Устройство хранения информации
Хранение и доступ к информации.
Файл-серверы, NAS. Технология RAID. Резервное копирование.
Эта статья посвящена вопросам хранения основной рабочей информации в малых офисах (10-50 пользователей)
Быстро, надежно, недорого.
Выбирайте любые два пункта
Смысл общей информации. Файловый сервер.
Когда группа людей заняты одним делом, информация у них общая. Например – бухгалтеры работают вместе с одной базой 1С. Как правило, она в маленьких офисах хранится на файл-сервере.
Или – отдел имеет документы (договора, реквизиты, статьи) совместного пользования. Они, очевидно, хранятся не у кого-то на локальном компьютере, а на общем сервере.
Потому что если каждый будет хранить у себя свою подборку документов, возникнет путаница – никто не будет знать, у кого более свежие версии. И сравнивать их очень утомительно. Стало быть, основная причина – требование актуальности общей информации.
Еще одна причина – надежность. Если политика IT на предприятии верная, отказ любой станции не ведет к трагедии. В лучшем случае, пользователь может пересесть на другой компьютер и продолжить работу. В этом ключ перехода к надежным файл-серверам. Ведь гораздо проще сделать надежным один-два компьютера (сервера), чем все.
Третья причина – скорость доступа.
При достаточной нагрузке (особенно это наблюдается в 1С в файловом режиме) от компьютера-сервера требуется достаточная скорость и «интеллектуальность» системы хранения, чтобы пользователи получали информацию быстро. Это реализуется специальным оборудованием, которое тоже выгоднее ставить на один компьютер, чем на все. По большей части, обычные станции ничего не «отдают» соседям, в этом просто нет необходимости. Хотя могут. Вообще совершенно нормально использовать свободное дисковое пространство станций для хранений большой, но редко требуемой информации. Но как правило, этого никто не просит.
Азм есть файл-сервер.
Таким образом, в _роли_ файлового сервера может выступать любой компьютер. Но как же устроены специально собранные файл-сервера?
В первую очередь, это надежность. Это хороший блок питания, и он включен к UPS. Чтобы самая банальная причина – отказ электропитания не мешала работе. БП (как и вся платформа сервера) прослужит долгие годы. Лет 10. Если хорошо собрана.
Это какая-нибудь платформа, причем не самая современная. Вообще, любая. До сих пор трудятся Пентиум-III с 256Мб ОЗУ. Потому что именно файл-сервер не делает преобразования данных и процессор и ОЗУ ему не важны.
Это диски. Вернее, Массив Дисков. И контроллер его.
Ну и система вентиляции дисков. Прочный корпус.
И все это убрано подальше от шаловливых рук пользователей. Ибо, как сказано в нашей статье о компьютерных вирусах «страшнее пользователя зверя нет».
Массивы Дисков. Технология RAID
Массив дисков имеет преимущество перед одиноким диском:
1. в надежности, за счет избыточности массива
2. в скорости, если на это хватило денег после надежности.
Технология RAID, многократно разобранная, например в
http://ru.wikipedia.org/wiki/RAID
имеет следующий смысл:
1. либо массив избыточен, тогда удаление любого диска массива не приводит к потере информации.
2. либо массив быстр, за счет записи и чтения с нескольких дисков одновременно.
3. иногда быстрота и надежность сочетаются, но вот количество дисков в таких массивах начинается с 4-х
Основные типы:
RAID-0 это тип «stripe». Он быстр, состоит из двух дисков и объем массива равен сумме объемов.
RAID-1 тип «зеркало». Он надежен, оба диска содержат одинаковые данные и выход из строя одного (любого!) диска к потере данных не приведет. Он не быстр, потому что запись идет на оба диска и контроллер тратит время на ожидание записи.
RAID-5. Состоит минимум из трех дисков, сочетает (в неповрежденном состоянии) относительно высокую скорость с надежностью. Сохраняет данные при отказе одного (любого) диска.
Помимо других видов RAID6,7, существуют комбинированные, в частности
RAID 1+0, он же 10. Это комбинация «зеркала» и «stripe», в которой две пары дисков объединяются в RAID0, а их результаты – зеркалятся RAID 1. Это наиболее простой из комбинированных типов массивов, сочетает скорость, надежность и простоту обслуживания. Устойчив к отказу одного диска, состоит минимально из трех дисков.
Самый распространенный в малых офисах тип – RAID1. Для удобства запоминания смысла типов, достаточно запомнить, сколько у вас останется информации, при отказе диска. Цифра в названии это и обозначает: в RAID1 останется, в RAID0 – не останется.
Следует заметить, что при покупке дорогого сервера со сложным массивом, нормально купить дополнительно один-два диска, точно таких же, как в массиве. На случай отказа. Потому что контроллеры идеально работают на массивах их одинаковых дисков, вплоть до модели и серии. А где их потом искать, если их раз в полгода снимают с производства.
Да и такой немаловажный аспект: хороший файл-сервер проживет долго, вероятно системные администраторы сменятся раньше. Где искать новому сисадмину информацию, где искать диск? Фирма-то стоит, работать не может. Одна надежда – в коробочке рядом с сервером заботливо лежит сменный диск.
Итак, контроллеры.
Хороший, производительный контроллер стоит дорого. Как два диска, к примеру. Еще дороже стоит его надежность.
Через контроллер проходит весь поток информации на диски. Он же занимается и всей этой эквилибристикой данными: зеркалированием, четностью, проверкой целостности. Это все скрыто от глаз пользователя и даже операционной системы.
Для системы массив – исключительно картина, представленная контроллером.
Более того. В случае отказа контроллера RAID5 или RAID1 данные можно будет получить, подключив диски к _точно такому же_ контроллеру. И то, если повезет.
В случае консистентного RAID1 или RAID10 данные можно получить с любого из зеркал с помощью обычного компьютера.
Словом, лучше бы контроллер сложного массива никогда не отказывал.
Надежными и функциональными считаются контроллеры Adaptec и LSI, более простыми – Promise, Tekram.
Выбор конкретного контроллера делается весьма серьезно, исходя из предполагаемого массива, платформы, дисков и цены решения. В каждом случае результат может быть разным. Но, в общем – контроллер и тип массива вряд ли будут меняться за время жизни сервера.
Диски.
Сами жесткие диски сейчас стали настолько доступны, особенно в пересчете на 1Мб, что все бюджетные решения делаются на самых обычных SATA-2 дисках. Важно только при выборе не залезть в самые свежие модели, с неизвестной историей отказов. А то в последнее время производители повадились выпускать диски быстрее, чем отделы разработки успевают отлаживать микропрограммы для них.
Столь популярные в свое время в серверах SCSI-диски сейчас переродились в SAS, но это не приблизило их к потребителю. Они дороже, существенно менее емкие и требуют более дорогих контроллеров. Да и подключить их к обычному компьютеру невозможно. Словом, их применяют только когда их высокая производительность востребована, а это отнюдь не файл-серверы начального уровня.
Итак, теперь мы знаем наиболее важные узлы файл-сервера.
Операционная система.
Как ни странно, но именно она имеет мало значения. Весь смысл файл-сервера – обеспечивать доступ из сети к данным. Иногда – с разграничением доступа, иногда и всем подряд. Какая же ОС для этого подходит? Несмотря на желание продать уверения MS, что подходит только их дорогущий MS Сервер, подходит вообще любая их современная пользовательская ОС, например 2000 Pro, XP Home или Pro. Ну и Линукс тоже подходит, во всем многообразии.
Этот вывод приводит нас к аппаратным хранилищам, а именно
NAS (Network Attached Storage – сетевое хранилище)
Это такие небольшие аппараты, большую часть места в которых занимают один-два диска. И небольшая плата электроники.
Они подключаются к локальной сети. Они содержат внутри специальную сборку Линукса, которая хорошо умеет одно – обеспечивать доступ из сети к файлам.
Двухдисковые устройства умеют делать массив RAID1, что приближает их к полноценным серверам.
Стоят они от 300-400долл за самые простые, до 1000долл за быстрые и надежные.
В качестве примера можно привести (один из многих, просто для примера) Synology DS209
http://www.synology.su/products/21
стоимостью примерно 400долл без дисков. Что, в общем, недорого.
Самое главное в NAS:
1. хорошая поддержка русских имен файлов и файловой структуры, совместимой с Виндовз. Иногда с этим бывают проблемы.
2. скорость работы. Несмотря на высокую производительность современных дисков и 100Мбит/с локальной сети, некоторые NAS умудряются работать на 2-8Мбит/с.
3. хорошая вентиляция дисков.
4. общая надежность работы.
Очевидными плюсами NAS являются:
+ компактность и мобильность
+ не требуется никакого легального ПО – линукс уже внутри
+ относительно низкая стоимость.
Таким образом, основные аспекты хранения общей информации мы разобрали.
Конечно, при правильной политике IT практически вся пользовательская информация может храниться на серверах, делая локальные компьютеры легкозаменяемыми. Это включает в себя: личные документы, почтовые базы, общие документы, программы ERP/CRM.
Осталось рассмотреть вопрос резервного копирования.
При всей надежности избыточных массивов, информация все равно дороже. Поэтому нормально наладить резервное копирование, причем в масштабах всего предприятия, с участием нескольких серверов, одной-двух рабочих станций, хранилища в интернете и секретарши.
Собственно, задача проста: самые ценные данные резервировать ежедневно (по ночам, автоматически). Причем данные с одного сервера – на другой и обратно. Еще делать копию на оптический перезаписываемый диск (и отдавать его доверенному лицу) и сбрасывать в интернет, на ftp-сервер.
Это защитит от электрических проблем. От пожара. От недружественного визита правоохранительных органов с изъятием всех серверов. От наводнения. Ну в общем, практически от всего.
Грамотная политика резервирования строится на вдумчивом разделении информации на ценную, ценную-ежедневно-изменяющуюся и неценную.
Неценной информацией (фильмы, музыка) пользователи пусть занимаются сами. И главное – не хранят ее в папках для ценной.
Ценная информацию, которая изменяется редко: отчеты за прошлые периоды, архивы, презентации, каталоги продукции, подборки фотографий. Ее надо записывать в рабочем порядке на оптические носители и хранить копии в сейфе. Нет необходимости ее резервировать ежедневно. Можно (если позволяет емкость) сделать ее локальное зеркало, на каком-нибудь не очень важном компьютере.
Ценная ежедневная информация: базы бухгалтерских программ, рабочие документы, почтовые базы. Для этой информации настраивается еженощное резервирование, исходя из смысла.
Базы бухгалтерии можно и всерьез резервировать в 2-3 места. Так же как и рабочие документы.
С документами сложнее – надо объяснить пользователям, чтобы туда не положили случайно что-то лишнее, потому что робот ночью разбираться не будет, а резервировать лишние 4Гб видео-DVD никому не нужно.
Почтовые базы достаточно резервировать 1 раз, они очень уж большие.
Следует помнить о логике и смысле, а так же о запасах свободного места для копий.
Часто применяется сочетание полного и инкрементного копирования. Скажем раз в неделю (месяц) делается полная копия, а еженощно – инкрементная. Инкрементная – это копия только файлов, изменившихся с прошлого раза.
Это может здорово сэкономить место. Ведь резервные копии, если их своевременно не удалять (а лучше – автоматически), могут за полгода занять любой, самый большой накопитель.
Следует заметить, что все виды накопителей, серверов и станций на предприятии могут быть объединены в одно целое – корпоративную систему хранения информации.
Система резервного копирования состоит из целого ряда процессов, запускающихся одновременно на серверах, с заранее продуманной логикой.
Нужные папки архивируются. Получившиеся архивы копируются на другие сервера или рабочие станции (пользователи которых не забывают оставлять их включенными на ночь). Отдельные процессы запускают запись на заранее вставленный DVD-RW или флешку, которые утром заберет сотрудник СБ и спрячет в укромном месте. Самое небольшое и ценное так же автоматически копируется в интернет. И все это настроено и живет своей ночной жизнью. Системный администратор раз в месяц проглядывает логи процессов и следит, чтобы не кончилось свободное место.
Вот такая история о корпоративной информации.