- 1. Вивчіть стандарт Tier дата-центру
- 2. Уточніть параметри електропостачання та охолодження дата-центру
- 3. Вибирайте локацію за місцем розташування ваших користувачів
- 4. Шукайте контакти керівництва і «потестіруйте» техпідтримку заздалегідь
- 5. Перевірте юридична особа власника дата-центру
- 6. Якщо працюєте з європейським ДЦ - запасіться терпінням
Вибрати дата-центр для свого проекту - та ще біль. Знайти кращий дата-центр під свої завдання простіше, якщо знати, на що звернути увагу при пошуку. У разі хмарної ігрової платформи Playkey якість стрімінга безпосередньо залежить від дата-центру: його надійності, близькості до користувача, якості мережі та інших параметрів. Тому з дата-центрами ми працюємо кожен день і знаємо основні їхні головні проблеми.
У цій публікації технічний директор Playkey Олексій Ликов розповість, як вибрати дата-центр, про що не забути при пошуку, навіщо заглиблюватися в особливості електроживлення і чим європейські ЦОДи відрізняються від російських. Передаємо слово Олексію.
1. Вивчіть стандарт Tier дата-центру
Перше питання при виборі дата-центру - надійність, або аптайм. Найпопулярніша сертифікація цього параметра - методологія Uptime Institute, яка ділить всі дата-центри на чотири рангу (Tier). Існує альтернативна система оцінки надійності дата-центрів за стандартом TIA 942, але нам він не такий цікавий в силу свого рекомендаційного характеру. У випадку з сертифікатом Uptime Institute, вони самі перевіряють ДЦ на декількох етапах (від проектування документації на будівництво до регулярної оцінки операційного обслуговування центру) і видають за підсумками перевірки оцінку. Отримати собі такий "липовий" сертифікат для ДЦ стає практично нереально.
Ось короткий опис кожного з чотирьох Tier:
- Tier 1. Інженерна інфраструктура без резервування і надлишкових ресурсів. Час простою за рік - 28,8 годин. Коефіцієнт відмовостійкості - 99,671%.
- Tier 2. Система не має повного резервування, але обладнана додатковими елементами охолодження і енергопостачання. Час простою за рік - 22,0 години. Коефіцієнт відмовостійкості - 99,749%.
- Tier 3. ЦОД має кілька каналів для розподілу електроживлення та охолодження, а також резервовані компоненти. Час простою за рік - 1,6 години. Коефіцієнт відмовостійкості - 99,982%.
- Tier 4. Дата центри з подвійним резервуванням з урахуванням, як мінімум, додаткового компонента. Кілька активних шляхів розподілу навантаження й охолодження з резервними компонентами 2 (N + 1), тобто 2 ІБП з надмірністю N + 1 кожен. Час простою дата-центру рівня TIER IV за рік не перевищує 24 хвилини, а коефіцієнт відмовостійкості становить 99,995%.
Карта всіх сертифікованих Uptime Institute ЦОД є тут , А ось їх розташування по Росії. Всього 26 штук, і всі вони знаходяться виключно в європейській частині країни:
Синім на карті відзначений один-єдиний російський ЦОД, сертифікований по максимальному стандарту TIER IV, причому розташований він не в Москві, а в Саранську. Ось як він виглядає зсередини:
На фото добре видно знімний фальшпол, який влаштований приблизно так:
Відповідно до класифікації рівня доступності ЦОД по Uptime Institute TIER IV передбачає повне резервування всіх інженерних систем з коефіцієнтом 2N + 1, що дозволяє проводити будь-які ремонтні роботи без припинення послуг ЦОД.
Ось як виглядає система електропостачання з незалежними вводами електрики для Саранська Цода:
за офіційними даними , ЦОД в Мордовії повинен стати центральним блоком для інфраструктури електронного уряду, але впорається і з завданнями банків, страхових компаній, і навіть військових.
Вимоги різних Tier іноді здаються трохи заморочений (наприклад, необхідність мати окрему парковку для співробітників і гостей ДЦ), але в більшості своїй адекватні. Так, ДЦ за стандартом Tier 3 зобов'язані мати приміщення у власності. Зрозуміло, що якщо дата-центр побудований в орендованій локації, то власнику будівлі може в будь-який момент часу прийти що завгодно в голову, і він або підвищить ціни, або взагалі розірве контракт, якими б не були штрафні санкції. Якщо ви бачите майданчик з сертифікатом Tier 3 і вище, такий ризик виключений. Для себе ми вибрали роботу з ЦОД не нижче Tier 2, а наш європейський дата-центр в Німеччині сертифікований за рівнем Tier 3.
Був курйозний випадок, коли ДЦ орендував приміщення на високому поверсі, а ліфт належав іншим особам і відповідно на вихідні і на ніч його відключали, і завести обладнання було проблематично.
2. Уточніть параметри електропостачання та охолодження дата-центру
Якщо ви використовуєте нестандартну конфігурацію серверів, то другий пункт сміливо можна ставити врівень з першим. Ми завжди особливо уважні до електроживлення і охолодження серверів, тому що використовуємо не звичайні, а GPU-сервера, на які не розраховане більшість дата-центрів.
Якщо ми візьмемо стандартну серверну стійку в 42 юніта, то вона в нормі буде виглядати так (ноутбук не додається):
Зазвичай до такої стійці власники Цода підводять 7-10 кіловат потужності і закладають відповідне охолодження. Цього достатньо для конструкції з типовими серверами, які споживають близько 300-500 Ватт в т.ч. різні СГД, комутаційне обладнання, патч панелі і так далі. Але в нашому випадку одна тільки відеокарта в GPU-сервері "їсть" від 150 до 250 Ватт, а таких відеокарт використовується до 8 штук на одному пристрої. У результаті сумарне споживання GPU-сервера - близько 2 кіловат.
Через це в одну стійку ми можемо поставити лише 3-4 сервера, тобто 6-8 юнітів, якщо ми говоримо про 2-х юнітних серверах. У підсумку в серверній стійці ми можемо зайняти лише 8 юнітів, а 34 юніта будуть вільні. Це ставить питання про ефективність використання місця. І піднятті нам ціни на оренду.
Висновок? Якщо у вас незвичайні запити до обладнання, то варто шукати дата-центр, заточений (хоча б частково) під таких клієнтів, як ви. У нашому випадку під клієнтів з GPU-серверами, з великим підведеною харчуванням до стійок і посиленим охолодженням. Поки таких клієнтів (і дата-центрів), щоправда, дуже мало.
3. Вибирайте локацію за місцем розташування ваших користувачів
Звучить банально, але варто нагадати про те, що розташування вашого R & D або штаб-квартири не обов'язково має бути місцем для вашого дата-центру. Первинно - то, де знаходиться основна маса користувачів сервісу. У Playkey офіс розробки знаходиться в Пермі, і на старті ми працювали також з місцевим пермським дата-центром, що спрощувало настройку і дозволяло швидше вирішувати будь-які питання з ЦОДом. Але коли для користувача база почала активно рости, і основна її частина (з тих, хто грає в Росії) все одно припадала на Москву, ми прийняли рішення згрупувати всі сервера також в центрі.
Після капітального переїзду в московський дата-центр ми відразу побачили поліпшення якості зв'язку та позитивний фідбек від гравців.
4. Шукайте контакти керівництва і «потестіруйте» техпідтримку заздалегідь
Швидка технічна і адекватне керівництво - ще один критично важливий момент в роботі дата-центру. Спробуйте уточнити у співробітників дата-центру якусь типову задачу, наприклад, налаштувати за інструкцією BIOS, і подивіться на реакцію. Якщо вас відправлять до іншого фахівця або почнуть гальмувати з відповіддю - все це не найкращі знаки. Пам'ятайте, що якщо з сервером трапиться щось серйозне, то без фізичної присутності питання найчастіше не вирішити. І техпідтримка - ваші "руки" на випадок будь-яких серйозних проблем.
Що стосується керівництва дата-центру, пам'ятайте, що без контакту "особи, що приймає рішення", будь-який узгодження буде займати довгі дні і тижні. Якщо при підписанні контракту ви до останнього не зустрічаєте людину, яка фактично приймає рішення в дата-центрі, краще пошукати альтернативний майданчик для розміщення серверів.
5. Перевірте юридична особа власника дата-центру
Найкоротший, але не менш важливий пункт. Не полінуйтеся "пробити" юридична особа на nalog.ru. Подивіться виписку з ЕГРЮЛ - і зрозумієте, як довго існує компанія, як часто змінювалося керівництво і власники. А в базі арбітражних справ не забудьте подивитися її судові справи.
6. Якщо працюєте з європейським ДЦ - запасіться терпінням
Менталітет європейських дата-центрів і їх організація роботи серйозно відрізняються від Росії. З нашого досвіду роботи з європейськими дата-центрами можна точно сказати, що вони роблять все повільніше. Якщо в Росії співробітники техпідтримки можуть оперативно вирішити практично будь-яку проблему з настройками сервера, то в Європі все не так просто. У них завжди є внутрішній поділ співробітників на тих, хто займається низькорівневими і високорівневими завданнями. Бюрократична машина змушує клієнтів доводити, що проблема дійсно важлива і вимагає негайного втручання "високорівневого" фахівця з боку дата-центру. Готуйтеся детально описувати причину свого звернення, чекайте узгодження "з топами" і тільки потім сподівайтеся на допомогу.
Є й відмінності в підході до роботи. Наприклад, в Росії практично всі запити до дата-центру можна відправити в чаті або листом і оперативно отримати відповідь. Коли ми працюємо з співробітниками дата-центрів в Німеччині та Великобританії, ми змушені спілкуватися тільки по телефону. Чому? Просто у них так прийнято.
Такі нюанси роблять європейців набагато повільніше. Варто зробити знижку і на те, що ми самі з Росії і нам простіше взаємодіяти з російськомовної підтримкою, але навіть безвідносно цього процеси у "наших", на мій погляд, збудовані краще, і робота йде швидше.
Ми зараз почали підготовку до виходу на ринок США, так що для нас все описані пункти - далеко не порожній звук. З штатами ми будемо розташовані вже не в трьох годинах льоту від дата-центру, плюс, буде пристойна різниця в годинних поясах. Так що до вибору довгострокового партнера будемо підходити з усією відповідальністю. Плюсом для швидкого запуску буде хмарний провайдер, благо за останній рік вже два великих сервісу запустили можливість орендувати сервера з GPU.
А для тих, хто хоче перевірити якість наших дата-центрів, ми підготували черговий промокод PlaykeyGeekSummer на 720 хвилин гри. Працює чотири доби з моменту активації, підходить тільки для нових користувачів, а активувати його не забудьте до 31 липня 2017 року.
Висновок?Чому?