Разделы
ИБП AC SOHO (230В) (24)
ИБП AC Power (400В) (339)
Опции к ИБП AC (356)
Распределение питания (29)
Батареи для ИБП (55)
Полный список товаров
Производители
AEG Power Solutions
APC
BB Battery
CSB
Delta Energy Systems
Eaton
Emerson Network Power
EnerSys AD
Exide Technologies
Fiamm
GE
NorthStar
Panasonic
Power Battery Company, Inc..
Riello UPS
Tripp-lite
Yuasa
Статьи
Новые статьи (0)
Тестирования
ИБП (10)
ЦОД (5)
Последние новости
RSS-канал новостей  RSS-канал новостей
Валюта
Модульные системы: эволюция надежности
Автор: Нил РасмуссенСузанн Найлз
Статья компании: APC

Введение

Модульность — весьма распространенный принцип организации и рационализации сложных систем. Он воплощается с бесспорным успехом как в простейших (батарейка электрического фонарика), так и в самых сложных (многоклеточный организм) системах. Тем не менее, эволюционный переход от монолитного построения искусственных систем к модульному может сопровождаться скептическим отношением и медлительностью — до тех пор, пока новые подходы не завоюют достойного места в этой сфере, и пока их проверенные временем преимущества не станут всем очевидны.

Инженерная инфраструктура центров обработки данных (ИИЦОД) как раз находится в настоящее время в процессе такого перехода. И если наиболее наглядные преимущества построения систем из »кирпичиков» – масштабируемость, гибкость, простота и мобильность – понятны и не являются предметом серьезных дискуссий, то вокруг еще одного преимущества модульности — надежности — в отрасли разгорелись настоящие дебаты.

Применение к модульным системам простейшего принципа классического анализа надежности («чем больше частей, тем выше вероятность отказа») дает в лучшем случае неполную картину, а в худшем — полностью искаженную. Цель написания настоящей статьи — проиллюстрировать на конкретных примерах, как модульность обеспечивает не только наиболее очевидные и простые для понимания свои преимущества, но и более тонкий, сложный для понимания и глубокий выигрыш: отказоустойчивость. Это свойство внутренне присуще модульному построению и является мощным новым средством защиты от неисправностей. Основанная на нем стратегия обеспечения надежности сложных систем не только адекватна решаемой задаче, но и превосходит другие возможные стратегии. 

 

Модульность в природе: зарождение многоклеточных организмов

Модульный подход к построению систем значительно старше наших вычислительных центров или батареек электрических фонариков. Одни из первых немодульных систем — одноклеточные организмы — появились на Земле еще три миллиарда лет назад. Судя по ископаемым останкам, они  сумели развить у себя твердые оболочки, щупальца, ротовые аппараты, двигательные и хватательные конечности, а также множество других весьма замысловатых приспособлений. Некоторые достигали удивительных размеров — до шести дюймов (15 см) в поперечнике. Миллиарды лет эти сложные монолитные одноклеточные создания доминировали в пищевых пирамидах нашей планеты.

 

Extracted on 03/12/2014 

Первые одноклеточные организмы (Фотографии предоставлены Дейвидом Уокером и Брайаном Дарнтоном)

 

Но затем, примерно 500 млн лет назад, появились многоклеточные. И всего за какие-то несколько десятков миллионов лет стремительной эволюции вытеснили одноклеточных с доминирующих позиций, превзойдя все их достижения за предыдущие три миллиарда лет.

 

Преимущества модульности у многоклеточных

Что позволило модульным многоклеточным организмам превзойти монолитные одноклеточные и вытеснить их с позиций, которые те, казалось, так прочно занимали?

 

Extracted on 03/12/2014

Первые многоклеточные организмы (Фотографии предоставлены Дейвидом Уокером и Брайаном Дарнтоном)

 

  • Способность к масштабированию и росту. Рост системы, как в размерах, так и в возможностях, легко достигался добавлением модулей (клеток), взаимодействующих с прежними через стандартные интерфейсы.
  • Упрощение процесса воспроизводства. Для множества небольших, менее сложно устроенных клеток процесс воспроизводства оказался проще, быстрее и надежнее, чем для одной сложной.
  • Функциональная специализация модулей. Специализация клеток и возложение на них узких задач позволили добиться большей эффективности и нового качества, подобно тому, как это достигается при работе множества специалистов в единой команде. Ранние многоклеточные использовали клетки одного типа для движения, другого – для защиты, третьего — для поиска пищи и т.д. 
  • Более быстрое приспособление к меняющимся условиям среды. Возможность добавления, удаления и модификации клеток позволяла оперативно вносить в конструкцию небольшие изменения и, после испытаний, принимать их или отклонять.
  • Отказоустойчивость. Благодаря избыточной численности клеток повреждение или гибель некоторых из них не вели к деградации системы в целом. Причем пострадавшие клетки могли быть заменены или отремонтированы без остановки жизнедеятельности или снижения ее качества (гибели или инвалидизации организма).

Последнее из названных преимуществ, отказоустойчивость, обеспечивает модульным системам исключительно важный выигрыш в надежности по отношению к монолитным. Модульная система «мельче расфасована», что упрощает резервирование компонентов для исключения негативного влияние отказа одного или даже нескольких из них на работу системы в целом. Простая царапина стоит человеку нескольких сотен клеток кожи, однако никаких проблем с функционированием тела такая потеря не вызывает. Остальные клетки продолжают выполнять необходимую работу, пока повреждение устраняется. Мы, люди, не изобретали модульности. Мы сами— модульность. Каждый из нас состоит из триллионов модулей (клеток) и каждый день пользуется преимуществами отказоустойчивости.

 

Модульность в ИТ-сиcтемах: жесткие диски

Во дни мэйнфреймов для хранения данных в вычислительных центрах использовались жесткие диски фирменных конструкций, состоявшие из пакетов 14-дюймовых металлических пластин и сложных механизмов чтения/записи в корпусах размером со стиральную машину. В 1978 г. Корпорация IBM запатентовала идею использования массивов более миниатюрных дисков, но ее разработке помешали опасения, что таким путем никогда не удастся достичь уровня надежности обычных для того времени монолитных конструкций. Исследования в области отказоустойчивости и практика применения конструкций, обладающих этим свойством, находились тогда на самом раннем этапе своего развития, а их уделом оставалась аэрокосмическая отрасль, где отказ электронного компонента мог означать гибель людей.( Сегодня, когда информационные технологии играют огромную роль практически в каждой отрасли, включая здравоохранение и оборонную сферу, авария в вычислительном центре может угрожать человеческим жизням. Так что требование отказоустойчивости оказывается обусловлено далеко не одними лишь экономическими выгодами.)

 

 Extracted on 03/12/2014

Дисковый накопитель мэйнфрейма IBM 3370 (Фотографии из архивов корпорации IBM, © IBM)

 

В 1987 г. в Беркли группа исследователей обратила внимание на растущий разрыв между скоростью работы подсистемы хранения и остальных подсистем компьютера. В появившихся тогда внешних дисковых накопителях для ПК они увидели готовые кирпичики для построения системы, способной к более быстрому обмену данными. Год спустя эти ученые опубликовали программную статью «A Case for Redundant Arrays of Inexpensive Disks (RAID)» («О массивах недорогих жестких дисков с резервированием»), в которой предложили несколько схем организации записи данных («уровнейRAID»), обеспечивающих сохранение, выборку и восстановление информации с использованием таких массивов. В 1990 г. их теория воплотилась в действующее устройство. Оно состояло из широко применявшихся в ПК 5,25-дюймовых дисков, которые к тому моменту достигли уровней емкости, производительности и надежности, достаточных для использования в составе RAID-массивов. Новые модульные устройства хранения позволяли выбирать желаемое соотношение уровня резервирования и скорости чтения/записи, занимая намного меньше места, чем устройства хранения мэйнфреймов, которые они заменили. 

 

Преимущества модульности RAID-массивов

Что позволило RAID-массивам вытеснить старые монолитные устройства хранения?

  • Способность к масштабированию и росту. Объемы хранения легко наращивались простым увеличением числа модулей в составе массива либо подключением дополнительных массивов.
  • Упрощение процесса воспроизводства. Организовать массовое производство небольших дисков, используемых в составе RAID-массивов, оказалось значительно проще, нежели продолжать выпускать старые, сложно устроенные большие дисковые накопители.  
  • Функциональная специализация модулей. В зависимости от уровня RAID на отдельные диски в составе массива могут возлагаться функции увеличения объема хранения, повышения скорости доступа или резервирования. Кроме того, и RAID-массивы сами по себе могут являться модулями системы более высокого уровня, выполняя в ее составе каждый свою задачу.
  • Быстрая адаптация к меняющимся условиям среды. Число дисков в массиве и уровень RAID можно легко менять в зависимости от текущих требований по емкости, производительности и резервированию.
  • Отказоустойчивость. Схемы записи данных в RAID-массивах предусматривают резервирование для восстановления информации в случае отказа одного из дисков. 

 

 Extracted on 03/12/2014

RAID-массив

 

К удивлению разработчиков энтузиазм на рынке в отношении RAID-массивов вызвала не столько увеличенная скорость обмена данными — что являлось их главной целью — а повышенная благодаря отказоустойчивости надежность. Пока авторы упомянутой выше статьи от 1988 года не продемонстрировали отказоустойчивость RAID-массива, просто вынув диск в процессе работы, преобладало верное для не обладающих свойством отказоустойчивости систем, но ограниченное в своей применимости представление, согласно которому система из нескольких дисков должна быть менее надежна, поскольку в ней больше частей.

 

Модульность в ИТ-системах: системы сверхтонких серверов

На момент написания этой статьи системы одноплатных серверов являются центральным направлением перехода на модульные системы. Многие годы традиционные автономные серверы эволюционировали в сторону увеличения размеров и производительности. По мере развития  сетевых вычислений они принимали на себя все больше и больше различной работы. Новые серверы устанавливались в вычислительных центрах по мере необходимости, часто из сиюминутных соображений, без плана и согласования; нередко операторам ВЦ случалось обнаруживать серверы, установленные даже без их ведома. Образовывавшаяся в результате мешанина железных ящиков и кабелей становилась благодатной почвой для неразберихи и ошибок, ограничивая гибкость во внесении дальнейших изменений. 

 

Extracted on 03/12/2014 

Обычные серверы

 

Системы сверхтонких серверов, впервые появившиеся в 2001 г., чрезвычайно просто устроены и являют собой образцовый пример модульной архитектуры. Серверные платы, устанавливаемые в шасси такой системы, физически идентичны и оснащены одинаковыми процессорами. Любую из них можно сконфигурировать для использования тем или иным образом. Эти системы принесли в мир серверов преимущества модульности – масштабируемость, простоту воспроизведения, функциональную специализацию и приспособляемость. 

Хотя эти классические достоинства модульности уже обеспечили системам сверхтонких серверов растущее распространение в вычислительных центрах, для раскрытия всего их потенциала необходимо широкое использование важнейшего преимущества модульности – отказоустойчивости. Отказоустойчивые системы сверхтонких серверов – со встроенной логикой переноса нагрузки с неисправного сервера на резервный – только недавно начали появляться и выходить на приемлемый уровень цен. Надежность таких отказоустойчивых серверов будет выше, чем могут обеспечить применяемые в настоящее время методы программного резервирования или кластеров автономных серверов, что обеспечит им доминирующие позиции в серверной архитектуре вычислительных центров. Аналитики предсказывают на ближайшее пятилетие стремительный переход на системы сверхтонких серверов — с появлением автоматических механизмов обеспечения их отказоустойчивости.

 

Преимущества модульности сверхтонких серверов

Почему модульные системы сверхтонких серверов вытесняют более мощные обычные автономные серверы?

  • Способность к масштабированию и росту. Вычислительная мощность легко наращивается добавлением модулей (серверных плат). 
  • Упрощение процесса воспроизводства. Проще производить множество сравнительно скромных по своим возможностям сверхтонких серверов, чем изготавливать мощные монолитные серверы. Источники питания, вентиляторы охлаждения, сетевые адаптеры и другие вспомогательные компоненты централизованы на уровне шасси и используются всеми серверными платами совместно, что упрощает структуру «лезвия».
  • Функциональная специализация модулей. Каждый сверхтонкий сервер может быть сконфигурирован для работы с теми или иными приложениями по желанию пользователя.
  • Быстрая адаптация к меняющимся условиям среды. В зависимости от текущих деловых или финансовых соображений можно добавлять или удалять серверные платы, а также реконфигурировать их для работы с другими приложениями.
  • Отказоустойчивость. В случае отказа одной из серверных плат встроенная логика переноса нагрузки может обеспечить прозрачное перераспределение ее функций между оставшимися.

 

Система сверхтонких серверов  (10 серверных плат в одном шасси)

 

Новое определение отказа ИТ-системы

Приведенные примеры демонстрируют неизбежность вытеснения сложных монолитных конструкций модульными системами. Она обусловлена фундаментальными причинами, которые кроются в самой природе модульности. Одна из них – преимущество отказоустойчивости — имеет огромное значение для будущего вычислительных центров. Как только все серверы и устройства хранения в ВЦ окажутся отказоустойчивыми, это изменит само определение отказа ИТ-системы.

Рассмотрим два сценария отказа в вычислительном центре (Рис. 1). В правой части представлен отказ сразу всех стоек, что может произойти при аварии одного мощного ИБП, обеспечивающего питанием весь вычислительный центр. В левой — отказ всего одной стойки.

В обычном случае с точки зрения менеджера ИТ оба эти сценария одинаково плохи, поскольку за счет взаимозависимости между серверами, дисковыми массивами, коммутаторами и маршрутизаторами, отказ в одной стойке приведет к каскаду отказов, который выведет из строя весь ВЦ.

Но новые модульные конструкции вычислительных систем и устройств хранения постепенно начинают делать отказ на иллюстрации слева, захватывающий всего одну стойку, «лучше» отказа справа в глазах ИТ менеджера, поскольку резервирование ресурсов дает возможность сохранить работоспособность вычислительного центра в целом и после отказа отдельного устройства.
По мере распространения отказоустойчивых архитектур, вычислительные центры
смогут выдерживать большее число отказов отдельных устройств без отказа системы в целом. Когда сверхтонкие серверы выйдут на уровень отказоустойчивости, заложенный в эту концепцию, отказ одной, двух и даже большего числа стоек сможет обходиться без тяжелых последствий.

 

Рисунок 1Два сценария отказа в вычислительном центре.  Вид сверху. Четыре ряда по восемь стоек.

Отказ одной стойки                                                                    Отказ всех стоек

 

Значение для ИИЦОД

Эта новая парадигма управления отказами – предполагающая неизбежность отказа части модулей и надежное сохранение работоспособности на фоне таких событий – определяет особые требования к ИИЦОД в области защиты архитектуры ИТ нового типа. В частности, по мере того как вычислительные центры становятся все более отказоустойчивыми на уровне ИТ, применение для защиты питания одного мощного ИБП перестает быть оптимальным вариантом. Ведь его отказ приведет к остановке системы в целом, а это совершенно лишнее в вычислительном центре, способном пережить отказ одной из стоек с оборудованием. Если оснастить каждую стойку отдельным ИБП, его авария приведет к отказу только этой стойки, а не системы в целом. Увеличение числа ИБП повышает вероятность единичного отказа, но зато при таком отказе система в целом сможет сохранить работоспособность. Если отказоустойчивость системы ограничена способностью выдержать отказ двух стоек, то для ее остановки потребуется одновременный отказ сразу трех ИБП, что значительно менее вероятно, чем отказ одного мощного ИБП. Поэтому теория надежности считает распределенные модульные архитектуры питания и охлаждения значительно более подходящими для отказоустойчивых ИТ-систем. 

 

Архитектура ИИЦОД: монолитная или модульная?

За все 30 лет существования вычислительных центров архитектура ИИЦОД не претерпела больших изменений. От самых маленьких серверных комнат и до самых крупных ВЦ, применялась единая модель инженерной инфраструктуры с центральной «системой» защиты питания и охлаждения. Такая модель реализуется в уникальные монолитные конфигурации оборудования и схемы соединений. Переход на модульное построение не
только позволяет ИИЦОД надлежащим образом поддерживать модульное, отказоустойчивое оборудование ИТ, но и несет преимущества модульности самому оборудованию ИИЦОД – включая повышение надежности за счет устойчивости к отказам. 

 

Extracted on 03/12/2014

Монолитный централизованный ИБП 
 
 

Преимущества модульности ИИЦОД

Что позволит модульной архитектуре ИИЦОД вытеснить традиционную монолитную? 

  • Способность к масштабированию и росту. Модульная архитектура позволяет строить ИИЦОД в точном соответствии с текущими требованиями ИТ-системы, а при изменении этих требований масштабировать инфраструктуру. Это важное преимущество перед традиционным подходом, использующим монолитные, не подлежащие модификации подсистемы питания и охлаждения, которые строятся раз и навсегда в расчете на максимальную прогнозируемую потребность оборудования ИТ. Такой подход приводит к огромным излишним расходам, как капитальным, так и эксплуатационным
  • Упрощение процесса воспроизводства. Модульный подход требует производства большого числа небольших устройств вместо небольшого числа мощных. Увеличение объемов производства позволяет добиться повышения качества; а в сочетании с более простой и компактной конструкцией — еще и повысить степень автоматизации, исключив значительную часть ручного труда, что также ведет к снижению вероятности брака.  
  • Функциональная специализация модулей. Модули для подсистем защиты питания и охлаждения могут производиться в различных конфигурациях, рассчитанных на те или иные требования к уровню готовности и отводу тепла. В каждой из зон ВЦ, различающихся по таким требованиям, могут применяться наиболее подходящие конфигурации. 
  • Быстрая адаптация к меняющимся условиям среды. Постоянное добавление нового оборудования и обновление аппаратуры ИТ каждые 2–3 года требует постоянной модернизации оснащения ВЦ. Новое оборудование может отличаться от прежнего по размерам и форм-фактору, требованиям к питанию и охлаждению, используемым соединителям и т.д. Модульная ИИЦОД легко масштабируется и реконфигурируется с учетом изменяющихся требований средств ИТ.
  • Отказоустойчивость. Как отказоустойчивость аппаратуры ИТ позволяет сохранить работоспособность вычислительного центра при единичных отказах, так и отказоустойчивость оборудования ИИЦОД позволяет сохранить работоспособность подсистем охлаждения и питания при аварии одного из компонентов инженерной инфраструктуры. Отказоустойчивость может быть достигнута за счет резервных устройств ИИЦОД или внутреннего резервирования компонентов устройств ИИЦОД, например, использования резервных силовых модулей ИБП.

 

 

Модульный ИБП для установки в стойку

 

Как и в рассмотренных выше примерах модульных систем, первые четыре преимущества весьма важны для успеха, но решающим является пятое – отказоустойчивость. Более того, поскольку функционирование вычислительного центра полностью зависит от энергоснабжения и охлаждения, для ИИЦОД отказоустойчивость не менее важна, чем для защищаемой аппаратуры ИТ. ВЦ с отказоустойчивым основным оборудованием, но обычной ИИЦОД подобен подвесному мосту с прочным полотном, но слабыми тросами.

 

Заключение

Переход от монолитных систем к модульным – естественный путь эволюции сложных систем, благодаря переимуществам в эффективности, гибкости и надежности. Анализ успехов модульного подхода показывает потенциал глубоких, даже революционных, улучшений систем, остававшихся монолитными с момента своего возникновения и никогда не рассматривавшихся в ином свете. Отказоустойчивость и другие важнейшие преимущества модульности — масштабируемость, приспособляемость, возможность специализации и простота воспроизводства – столь же очевидны и неизбежны в искусственных модульных системах, как и в природных. 

Мир ИТ уже имел возможность убедиться в этих преимуществах на примере модульных конструкций систем хранения и вычислительных систем – RAID-массивов и сверхтонких серверов. Что еще более важно, ВЦ уже начинают следовать примеру аэрокосмической и других подобных отраслей в применении конструкций, полностью основанных на преимуществе модульности, ставшем непременным атрибутом ответственных систем еще с 1970-х: устойчивости к отказам. Тщательный контроль качества компонентов — лишь первый шаг к надежности, а обеспечение функционирования системы в случае их отказа – наилучшая тактика обеспечения выживания ВЦ.

По мере распространения новой модели построения ВЦ, основанной на модульности и отказоустойчивости, ИИЦОД должна развиваться в том же направлении: как для эффективной защиты новых ВЦ, так и для повышения собственной эффективности, гибкости и надежности. 

 

Литература

Информационная статья APC №117 «Адаптивная инженерная инфраструктура центра обработки данных: оптимизация ценности бизнеса».
Информационная статья APC №116 «Стандартизация и модульность в адаптивной инженерной инфраструктуре центра обработки данных».

 

Об авторах

Нил Расмуссен – один из основателей и технический директор компании American Power Conversion (APC). В APC он распоряжается крупнейшим в мире бюджетом научно-исследовательских и опытно-конструкторских работ в области инфраструктуры энергоснабжения, охлаждения и стоечной инфраструктуры ответственных сетей. Главные центры разработки продуктов находятся в США (штаты Массачусетс, Миссури, Род-Айленд), Дании, Тайване и Ирландии. В настоящее время Нил руководит созданием масштабируемых модульных решений для ЦОД.

До основания компании APC в 1981 г. Нил получил степень бакалавра и магистра по электротехнике в Массачусетском технологическом институте. Его дипломная работы была посвящена анализу источника питания мощностью 200 МВт для термоядерного реактора токамак. С 1979 по 1981 гг.
Он работал в лаборатории Линкольна в Массачусетском технологическом институте над маховиковыми накопителями энергии и системами использования солнечной энергии.

Сузанн Найлз — автор информационных статей в научном центре APC по вопросам ИИЦОД «NCPI Science Center». Она изучала математику в колледже Веллесли, получила степень бакалавра в области вычислительной техники в Массачусетском технологическом институте, защитив работу о распознавании рукописного текста. Ведет преподавательскую деятельность более 25 лет, работает с различными аудиториями, используя самые разные обучающие материалы: от руководств по программному обеспечению до фотографий и детских песен.

Для получения подробностей, пройдите по следующей ссылке: http://www.apc.com/whitepaper/?wp=76
Эта статья была опубликована 03 Декабрь 2014 г..
Число отзывов: 0
Написать отзыв