Ежегодный международный форум «ЦОД» (16+)

Школа выживания для ЦОДов

24.11.2020

От бесперебойного функционирования дата-центров зависит надежная и непрерывная работа сервисов государственных и частных информационных систем, составляющих в совокупности костяк цифровой экономики. 

Отказоустойчивость и надежность работы по сути основной товар ЦОДов. Поэтому именно вопросы обеспечения отказоустойчивости были в центре внимания форума «ЦОД 24 х 7. Инструкция по выживанию», проведенного «ИКС-Медиа» в уже ставшем традиционном «гибридном» формате с онлайн-видеотрансляцией и живым общением в студии. Тема вызвала большой интерес и привлекла более шестисот участников. 
 
 
Рост продолжается
 
Даже в непростой «карантинный» 2020 год, когда целые отрасли, не выдержав последствий пандемии, переживают спад, объем рынка коммерческих ЦОДов увеличился на 26%. Причем, как оценивает директор по развитию бизнеса iKS-Consulting Дмитрий Горкавенко, растет он в четыре раза быстрее, чем рынок ИТ в целом (7%). 
 
Согласно опросу iKS-Consulting, почти треть (31,3%) крупных компаний в России уже размещает свое оборудование в коммерческих ЦОДах, еще треть (32,5%) арендует инфраструктуру облачных провайдеров. В 2020–2021 годах 41% крупных компаний, имеющих опыт пользования услугами коммерческих ЦОДов или облачных провайдеров, намерены увеличить потребление этих услуг, а 8% компаний, ранее не имевших такого опыта, планируют начать сотрудничество.
 
Пандемия COVID-19 не остановила запуск новых площадок – в период самоизоляции в эксплуатацию введено 679 новых стойко-мест. По итогам 2020 года емкость коммерческих ЦОДов в РФ достигнет 49,9 тыс. стойко-мест, что на 13,2% больше, чем в 2019 году.
 
Причем даже в случае пессимистического сценария новой волны COVID-19, усиления экономических санкций, «заморозки» площадок и реализации валютных рисков среднегодовой рост количества стойко-мест коммерческих дата-центов оценивается в 6%. В оптимистическом сценарии – при полном осуществлении комплекса мер, направленных на ускорение развития отрасли, – рост превысит 15%, а в базовом сценарии, наиболее, по мнению iKS-Consulting, вероятном, составит 12%.
 
Рынок меняется не только количественно, но и качественно. Доля стоек, которые размещаются в ЦОДах, сертифицированных по уровню надежности Tier III Uptime Institute, выросла с 26% в 2018 году до 31% в 2019-м. 
 
Источник: iKS-Consulting

Динамика соотношения введенных стойко-мест разного качества
 
Рынок чутко реагирует на запросы бизнеса в отношении надежности. В большинстве новых масштабных проектов в бюджет изначально закладываются расходы на прохождение соответствующей сертификации. Со временем число стоек в ЦОДах, имеющих сертификаты, будет увеличиваться и не исключено, что уже в перспективе пяти лет сравняется с числом стоек в дата-центрах, где качество только заявлено.
 
От Tier III к Tier IV
 
Недавно Uptime Institute опросила менеджеров дата-центров о планах действий в связи пандемией и получила ответ: повысить надежность ЦОДов. Пандемия увеличила число рисков. Это и самоизоляция сотрудников, и сокращение числа специалистов на площадке, и сбои в работе логистических цепочек поставок оборудования и ресурсов. И всё это при резком увеличении нагрузки. ЦОДы справились с текущими вызовами, обеспечив бесперебойную работу размещенных в них вычислительных комплексов. Но неизвестно, какие проблемы принесет будущее.
 

«Если смотреть на отказоустойчивость в рамках классификации Uptime Institute, то по-настоящему отказоустойчивыми являются ЦОДы Tier IV», – отметил главный редактор «ИКС-Медиа» Александр Барсков. В России ЦОДов с уровнем надежности Tier IV не было. Но в этом году сразу три компании – «Ростелеком», DataPro и O2xygen – объявили о планах строительства таких объектов.
 
В начале ноября DataPro объявила об открытии ЦОДа DataPro Moscow II – первого в Восточной Европе дата-центра с уровнем надежности Tier IV. «Теперь у нас появилась возможность предоставлять премиальный продукт по разумной цене. К нам приходят тендерные комиссии, которые, не обладая достаточными знаниями, пытаются вникнуть в огромное количество технических деталей. Мы пытаемся упростить для них процесс выбора площадки, предложив то, чего лучше в мире еще не придумали», – заявил исполнительный директор DataPro Евгений Богданчиков.
 
Забота о данных
 
Главное в ЦОДе – данные клиентов, и надо сделать все возможное, чтобы предотвратить их потерю. Для этого нужно понимать, где находятся данные, кто их использует, насколько они важны для бизнеса. Необходимо обеспечить оптимальное размещение и отказоустойчивость приложений, защитить данные от уничтожения в результате сбоев, человеческих ошибок или хакерских атак. Сделать это можно, например, с помощью решений компании Veritas для управления данными в ЦОДах.

 
Для обеспечения отказоустойчивости данных и приложений компания предлагает использовать платформу InfoScale, осуществляющую оркестрацию и мониторинг данных, автоматизирующую процессы аварийного восстановления. Оптимизировать стоимость хранения данных позволит линейка хранилищ Veritas LTR Appliance 3340, которая предлагает хранение на дисковых носителях по цене, сопоставимой с ценой хранения на ленте.
 
Безагентный сбор информации о размещении данных поможет осуществить система APTARE IT Analytics. По утверждению технического директора Veritas Николая Починка, эта система упрощает планирование емкостей, идентифицирует излишне и недостаточно защищенные ресурсы, снижает затраты на инфраструктуру хранения в среднем на 15–35%.
 
Облачный мост
 
Основа любой системы предотвращения потери данных – резервное копирование. Современная архитектура хранения нередко фрагментарна. Данные могут находиться в публичных и частных облаках, в виртуализированных и невиртуализированных средах, в структурированных и нестуктурированных базах данных. Управлять столь разнородными данными – нетривиальная задача. Свои решения российскому рынку предлагает компания Commvault, в число клиентов которой входит, в частности, NASA.
 
Выступает Денис Корнеев, ведущий технический эксперт компании Commvault в России
 
«Свою задачу мы видим в строительстве “моста”, который связывал бы приложения, инфраструктуру и данные», – пояснил Денис Корнеев, ведущий технический эксперт Commvault в России. По такому «мосту» можно реплицировать on-premise-файлы в облако, передавать их между разными облаками, осуществлять перенос контейнеров и баз данных. Использование технологий репликации и дедупликации обеспечивает хранение данных, минимизацию занимаемого пространства и как следствие – снижение затрат.
 
Портфель решений включает платформу Commvault Data Protection, состоящую из традиционной системы резервного копирования и аварийного восстановления, распределенной платформы хранения первичных данных Hedvig и предоставляемой по модели SaaS платформы Metalic. Уровень хранения платформы – горизонтально-масштабируемое интегрированное решение для управления данными Commvault HyperScale X, оптимизированное для работы с гибридным облаком. Для организации поиска в резервных копиях проводится полнотекстовое индексирование, что полезно при выполнении запросов государственных структур, например судебных органов, требующих предоставить переписку по электронной почте. 
 
Холодные стены
 
Система охлаждения – базовая инженерная инфраструктура, обеспечивающая надежную работу ЦОДа. Самые эффективные системы охлаждения – с прямым фрикулингом, но они требуют, чтобы температура уличного воздуха даже в летний период была ниже температуры в машзале. Таких мест в нашей стране немного.
 
 
Выступает Анна Васильева, руководитель направления ЦОД компании РrofITcool
 
Охлаждение с помощью прецизионных кондиционеров не всегда удовлетворяет требованиям энергоэффективности. В качестве альтернативы руководитель направления ЦОД компании РrofITcool Анна Васильева предложила широко используемые в дата-центрах Европы «холодные стены» ProfITCool Wall. У них большая площадь теплообмена, что позволяет обеспечить выход на режим фрикулинга при более высоких температурах наружного воздуха. При этом снижение нагрузки на компрессор увеличивает его срок службы.
 
Система не требует фальшпола и фальшпотолка. Блоки работают на единый воздушный бассейн и резервируют друг друга. Для экономии места можно использовать воздухоохладители ProfITCool Air, устанавливаемые под стойку.
 
Чтобы свет в ЦОДе не погас
 
Надежность работы ЦОДа не в последнюю очередь определяется его системой энергоснабжения. В случае аварии на линии в дело должен вступить дизель-генератор, а до его запуска – источники бесперебойного питания.
 
Характеристики ИБП, их техническое обслуживание и капремонт в значительной степени зависят от способа передачи энергии в накопитель при заряде и извлечения энергии из него. Существуют два основных типа ИБП: с механической и электрической связью накопителя энергии с источником питания. У каждого типа есть сильные и слабые стороны. Некоторые эксперты полагают, что с учетом окупаемости и рентабельности бизнеса в дата-центрах мощностью от 1 МВт предпочтительнее использовать дизель-роторные ИБП (DRUPS). Однако в случае выхода такого устройства из строя его придется везти для ремонта на завод, что сопряжено со сложными работами по демонтажу и значительным временем простоя. Да и гибкость оставляет желать лучшего – дизель монтируется на валу накопителя, и их нельзя разнести, а масштабировать решение можно только путем установки новых дорогих DRUPS. 
 
Решения на статических ИБП с электрической связью, в которых накопителями могут выступать как аккумуляторы энергии, так и маховики, выглядят более гибкими, но большое количество параллельно подключенных компонентов снижает общую надежность. Компания Piller предлагает свои решения на технологии UB-V. Как указал директор Piller по развитию бизнеса в России Владислав Ротань, основное отличие от классической схемы с электрической связью в том, что источник питания не конструкция из параллельно подключенных узлов, а моноблок мощностью от 1 до 2 МВт. В качестве накопителя энергии выступают аккумуляторные батареи или маховики. Отсутствие параллельно подключенных узлов уменьшает число компонентов и значительно повышает надежность.
 
 
Выступает Владислав Ротань, директор компании Piller по развитию бизнеса в России 
 
По оценкам Владислава Ротаня, за 10 лет эксплуатации экономия на совокупной стоимости владения для решения с технологией UB-V по сравнению с классическим решением на статических ИБП составит 20%, а при использовании маховика Powerbridge – более 40%.
 
Надежное проектирование
 
О надежности надо начинать думать еще на этапе разработки концепции ЦОДа. Об этом постулате еще раз напомнил директор центра разработки компании Schneider Electric Андрей Воробьев. Оптимальное решение должно учитывать назначение объекта (потребности заказчика), бизнес-модели, используемые технологии, экономические параметры (CAPEX, OPEX), требования инвесторов, вендоров и регуляторов, а также внешние ограничения – существующую инфраструктуру, характеристики площадки, наличие ресурсов и окружающую среду. 
 
 
Выступает Андрей Воробьев, директор центра разработки компании Schneider Electric 
 
Компания Schneider Elecric предлагает делить разработку концепции ЦОДа на три этапа. Первый – оптимизация решения с помощью подхода Power Train. Решения «цепляются» друг к другу, как железнодорожные вагоны. Выбрали стойку, затем PDU, затем распределительный щит. Централизованная система кондиционирования с большими чиллерами может казаться дешевле, но со всеми дополнительными «вагончиками» типа запорной арматуры оказаться более дорогой, чем распределенная с маленькими. Досконально зная свои технологии, Schneider Elecric готова с наименьшим количеством итераций построить наиболее эффективный для решения конкретной задачи «поезд».
 
Второй этап создания концепции – автоматизация расчетов. Компания выпустила плагины для комплекса автоматизированного проектирования Autodesk Revit, которые позволяют визуализировать процесс и уже на начальном этапе оценить работоспособность решения. Третий этап – учет потребностей службы эксплуатации в плане организации пространства ЦОДа и автоматизации процессов работы. Об этом Schneider Elecric рекомендует позаботиться так же еще на стадии концепции.
 
Огонь, вода и оптововолокно
 
Еще один ключевой момент обеспечения надежности ЦОДа – противопожарная безопасность. Старый подход – срабатывание датчика, сирена, эвакуация персонала и заполнение машзала фреоном – вызывает остановку всего дата-центра и требует расхода большого количества дорогого хладагента. По оценкам Uptime Institute, срабатывания противопожарных систем чаще приводят к простоям ЦОДов, чем собственно пожары. 
 
Альтернативный вариант – защита ЦОДа установками пожаротушения тонкораспыленной водой HI-FOG, о которых рассказал генеральный директор Marioff Russia Олег Зуенко. Любой пожар можно потушить ложкой воды, только нужно знать, где и когда ее вылить. Водяным облаком окутывается не весь машзал, а лишь место возгорания. Да и вода, даже дистиллированная, намного дешевле фреона. В России такая система пожаротушения уже используется в дата-центрах Moscow One и Moscow Two компании IXcellerate.
 
Важна для бесперебойного функционирования дата-центра и оптимальна коммутация информационных систем. Сегодня требуется для одного клиента ЦОДа протянуть кабель между одними стойками, завтра другому клиенту нужно обеспечить связь между другими. Гибкость в планировании и распределении полезного пространства в кабельных каналах обеспечивают СКС. 
 
Владимир Стыцько, директор по работе с ключевыми заказчиками в России и странах СНГ компании CommScope, рассматривает два варианта организации волоконно-оптических магистралей в коммерческом ЦОДе с большим числом арендаторов. Вариант, когда каждый отсек (арендатор) каналами «точка – точка» соединяется напрямую с главным кроссом (ODF), прост, но малоэффективен, поскольку при такой конфигурации СКС трудно прокладывать новые кабели (из-за большой длины трассы), для добавления кабельных каналов нужно вскрывать противопожарные перегородки, а из-за межзальной коммутации главный кросс перегружается кабелями. Эксперт CommScope рекомендует другой вариант, который предусматривает организацию промежуточных кроссов и локальных точек консолидации в отсеках. В этом случае локальные сегменты легко адаптировать к потребностям арендаторов, для добавления кабелей требуется минимальное строительное вмешательство, а межзальная коммутация осуществляется в обход главного кросса.
 
Выступает Владимир Стыцько, директор по работе с ключевыми заказчиками в России и странах СНГ, CommScope 
 
Скупой платит дважды
 
«Попытка сэкономить на должном сервисе приводит к намного большим потерям в случае остановки работы ЦОДа», – подчеркнул директор по сервису KAM Colo & Cloud компании Vertiv Евгений Журавлев. Например, если пусконаладочные работы выполняются недостаточно квалифицированным персоналом, могут быть неправильно установлены режимы работы оборудования, возрастают риски его повреждения. Без текущего договора на обслуживание может задержаться выезд инженеров для диагностики и ремонта в аварийных ситуациях, а ремонт может затянуться из-за отсутствия запасных частей на складе. 
 
Да, сервис недешев. Но вендору приходится нести постоянные расходы на обучение и повышение квалификации специалистов, обеспечивать оперативность выполнения работ. А если оборудование вводится в строй и обслуживается квалифицированными специалистами, прослужит оно значительно дольше номинального срока. То есть качественный сервис – еще один фактор повышения надежности и отказоустойчивости дата-центра.