2-контроллерные СХД начального уровня
Готовые системы хранения данных начального уровня часто используются в различных решениях для SMB-сегмента: консолидация дискового пространства, виртуализация, различные кластерные решения, требующие совместного блочного доступа.
Ключевые особенности архитектуры большинства представленных на рынке СХД начального уровня:
Использование одного или двух контроллеров с горячей заменой, использующих совместный доступ к дискам. Под контроллером подразумевается специализированный сервер в специальном форм-факторе, обеспечивающий работу СХД (работу с дисками, обслуживание массивов и предоставление томов хостам и т.д.)
Наличие двух контроллеров обеспечивает повышение общей надёжности СХД — возможность избежать простоя при запланированном отключении или выходе из строя одного из контроллеров) и дополнительное масштабирование производительности при распределении томов по разным контроллерам. При использовании кэша на запись обеспечивается защита его целостности: защита по питанию (обычная батарея или ионисторы плюс сброс на флеш-память) и дублирование содержимого между контроллерами.
- Выбор хост-интерфейсов: 16 и 8Гбит FiberChannel, 1 и 10Гбит Ethernet (iSCSI, в некоторых моделях может быть поддержка FCoE), SAS. Для некоторых моделей существуют комбинированные варианты, например FC + SAS.
- Возможно подключение дополнительных дисковых полок (простых корпусов с SAS-экспандерами) через интерфейс SAS. Для повышения надёжности подключения может быть применено 2-путевое подключение (ниже приведён пример одной из возможных схем подключения).
Производительность СХД начального уровня
ALUA
В большинстве современных 2-контроллерных СХД начального уровня используется т.н. ассиметричный доступ: оба контроллера могут принимать запросы на доступ к определённому LUN, но непосредственно обслуживанием каждого конкретного LUN занимается лишь один контроллер.
В вышеприведённой схеме владельцем LUN A назначен контроллер A, для LUN B — контроллер B. Для каждого LUN есть набор оптимальных путей (зеленый цвет) и неоптимальных (красный). Запрос, отправленный по оптимальному пути, будет напрямую обработан контроллером, по неоптимальному — принят одним контроллером и передан соседнему контроллеру-владельцу LUN'а. Наличие таких дополнительных операций приведёт к снижению производительности. Для оптимального использования ресурсов СХД в спецификациях SCSI существует протокол ALUA (Asymmetric Logical Unit Access), позволяющий корректно использовать все доступные пути в MPIO: использовать только оптимальные пути, переключаться на другие доступные пути в случае неисправности оптимальных путей и автоматически переключаться обратно при их появлении.
Советы по планированию и внедрению решений на базе СХД начального уровня
- При планировании конфигурации СХД желательно равномерно распределить нагрузку по контроллерам.
- При планировании отказоустойчивых решений важно свести к минимуму наличие единых точек отказа: кластеризация серверов, использование двухпортовых HBA (или нескольких однопортовых, но в большинстве случаев это избыточно), дублирование коммутаторов SAN.
- Планируйте правильное с точки зрения MPIO подключение: для каждого из портов HBA должны быть доступны оба контроллера.
- В большинстве случаев для конкретной СХД может потребоваться специфическая настройка MPIO, учитывающая архитектуру СХД.
- Наличие отказоустойчивости на уровне дисков, контроллеров СХД и даже СХД целиком (репликация) не отменяют необходимости в резервном копировании.
Работа с SSD
Совсем недавно производительность контроллеров в большинстве СХД начального уровня составляла в лучшем случае около пары десятков тысяч IOPS, что ограничивало практическое применение двумя-тремя SSD. Сейчас ситуация улучшилась, лимиты производительности выросли до сотен тысяч IOPS, но даже современные 2-контроллерные СХД не стоит рассматривать в качестве платформы для создания all-flash массива.
В реальности на ограничение по IOPS и задержкам дополнительно влияет выбор интерфейса. Например, полностью раскрыть потенциал производительности современных SSD при использовании iSCSI через 1GbE невозможно даже при использовании большого количества линков.
Функционал
Описание наиболее распространённого функционала СХД начального уровня:
- Снапшоты (моментальные снимки). Снапшот — способ создания виртуальной копии тома на определённый момент времени. При создании снапшота его содержимое представлено ссылками на блоки исходного тома, при изменении блоков на исходном томе (перед операцией записи) его текущее состояние копируется в том-снапшот, т.е. используется т.н. copy-on-write.
Снапшот не стоит использовать непосредственно для резервного копирования, так как он не является независимой копией данных. Обычно снапшоты используются в качестве промежуточного звена при создании резервной копии, но в этом случае необходимо принимать меры для обеспечения целостности данных (например, с использованием VSS).
- Клонирование томов. После создания снапшота его можно превратить в полную независимую копию тома, просто заменив все ссылки реальными данными. Такой способ позволяет создать полную копию тома без необходимости остановки работы с исходным томом.
- Thin provisioning (тонкое выделение ресурсов). При использовании Thin Provisioning дисковое пространство на томах будет выделено только при его реальном заполнении данными, что позволяет упростить администрирование СХД при растущих объёмах данных.
- Репликация — создание удалённой копии тома, используется в катастрофоустойчивых решениях. Репликация может быть синхронной (операция записи считается завершённой только после записи на локальный том и на удалённый) или асинхронной (подтверждение операций записи происходит без учёта состояния удалённого тома). Синхронная операция обеспечивает гарантию отсутствия потери данных при выходе из строя основной СХД (не теряется ни одна операция записи), но требует наличия интерфейса с достаточной пропускной способностью и приемлемым уровнем задержки.
- Разгрузка дисковых операций (VAAI, ODX). В виртуальных средах (например, в VMWare vSphere) используется большое число специфических дисковых операций, например, копирование большого объёма данных заполнение нулями, блокировка LUN'а. Для улучшения производительности подобные операции могут выполняться на стороне СХД без участия хоста.
- Tiering (ярусное хранение данных) — позволяет разместить блоки данных по накопителям с различным уровнем производительности в зависимости от нагрузки. Такое перераспределение является прозрачным для хоста и позволяет оптимально использовать объём быстрых и дорогих накопителей (SSD или HDD 10-15 тыс. об/мин). Данный функционал, как и классический SSD-кэш, сравнительно недавно пришёл в сегмент СХД начального уровня.
Infortrend EonStor DS 1000/2000/3000
Компания Infortrend с 1993 года занимается разработкой и производством систем хранения данных. На российском рынке широкое распространение получила линейка 2-контроллерных СХД начального уровня EonStor DS. Infortrend не использует брендирование дисков, допустимо применение любых дисков из списка совместимости, что положительно сказывается на стоимости готового решения.В настоящее время актуальной является линейка EonStor DS 3000 и её чуть менее производительные варианты — 2000 и 1000. Ключевой особенностью является гибкость при конфигурировании. Для смены интерфейса не обязательно менять контроллер целиком, достаточно заменить небольшую и относительно недорогую интерфейсную плату.
На что обратить внимание:
- Сменные интерфейсные платы
- Infortrend предлагает опциональные SATA-интерпозеры — дополнительные платы-переходники, позволяющие использовать диски SATA в 2-контроллерных конфигурациях, для которых требуются диски SAS из-за наличия двух портов. По возможности старайтесь избегать применения интерпозеров и используйте диски с интерфейсом SAS.
2U, 12x3.5"
|
2U, 24x2.5"
|
3U, 16x3.5"
|
4U, 24x3.5"
|
4U, 48/60x3.5"
|
Форм-фактор |
|
Интерфейсы |
Определяются выбором дочерней платы для контроллера. Кол-во портов на один контроллер:
|
Кэш |
|
Макс. число дисков |
|
Функционал |
|
Различные конфигурационные пределы |
|
Производительность |
|
Тестирование производительности Infortrend 3024B
- Infortrend EonStor DS 3024GB
- Один контроллер
- Подключение: 2x порта 4xSAS2 (HBA LSI 9300-8e)
- 48 дисков 600ГБ 10 тыс. об/мин в RAID-6
- Хост: Intel Xeon E5606, 40ГБ памяти, CentOS Linux 6.6 X86_64, fio 2.1.14
- Последовательный доступ, блок 1МиБ, 2 потока
DotHill AssuredSAN 3000, AssuredSAN 4000, AssuredSAN Ultra
Компания DotHill во многом известна благодаря тому, что является OEM-партнёром HP. Системы хранения данных начального уровня HP Modular Storage Array (MSA) нескольких последних поколений производит именно DotHill.
На что обратить внимание:
- Серия AssuredSAN Ultra с высокой плотностью размещения дисков: 48 дисков 2.5" в корпусе 2U (Ultra48) и 56 дисков 3.5" в корпусе 4U (Ultra56)
Форм-фактор |
|
Интерфейсы |
Кол-во портов на один контроллер:
|
Кэш |
|
Макс. число дисков |
|
Функционал |
|
Различные конфигурационные пределы |
|
Производительность |
|
HP MSA 1040/2040
СХД HP MSA2040 является заменой предыдущей модели MSA P2000 G3. Производится компанией DotHill, соответствует серии DotHill 4000. Выбор в пользу Hеwlett-Packard может быть обусловлен необходимостью в использовании расширенной поддержки с гарантированным временем восстановления.На что обратить внимание:
- Серия MSA1040 — бюджетный вариант с меньшей производительностью и масштабируемостью. Не имеет поддержки SSD.
Форм-фактор |
|
Интерфейсы |
Кол-во портов на один контроллер:
|
Кэш |
|
Макс. число дисков |
|
Функционал |
|
Различные конфигурационные пределы |
|
Производительность* |
|