rss Twitter Добавить виджет на Яндекс
Реклама:
     
 
 
 
     
     
 
 
 
     
     
 

Форум технологий Mail.ru: дело мастера боится

16 ноября 2011 г. в Москве состоялся второй «Форум технологий Mail.Ru Group». На форуме представители компании рассказали о том, как устроены и работают технологии, используемые в Mail.Ru Group, которая является одной из крупнейших Интернет-компаний в русскоязычном сегменте Сети.

Аудитория форума – профессиональное сообщество опытных разработчиков, иначе говоря, гуру Рунета, а также те, кто собирается присоединиться к этому сообществу. Поэтому доклады  были соответствующие: тонкости создания мобильных приложений, как обрабатывать 1,5 млрд. запросов в сутки, развитие интерфейса через гайдлайны и т.д.

Пожалуй, и гуру и новичкам была интересна тема, касающаяся обеспечения стабильности работы Интернет-ресурса. Вице-президент, технический директор, Mail.Ru Group, Владимир Габриелян назвал три причины, Вице-президент, технический директор, Mail.Ru Group, Владимир Габриелянопределяющие важность стабильности работы сайта. Первая заключается в том, что, если сайт просто долго загружается, пользователь уйдет на другой ресурс, который возможно, принадлежит вашим конкурентам. Вторая причина – как раз легкость перехода с сайта на сайт. И третья, достаточно важная: нестабильная работа ресурса, долгая по времени загрузка страниц – всё это нервирует пользователя, что опять-таки побуждает его уйти с вашего сайта.

По статистике, для среднего сайта время работы составляет 98,6%. На первый взгляд, это не плохо. Однако эти 98,6% означают, что сайт пять суток в год находится в неработающем состоянии. У крупных Интернет-ресурсов простой в сумме составляет четверо суток в год.

В 50% случаев причиной простоя являются сетевые аварии, 25% вызываются сбоями в работе программного обеспечения. В 16% случаев простой происходит из-за аварии различного оборудования, в 8% простой вызывают аварии серверов и компьютеров.

Владимир Габриелян подчеркнул, чтобы сайт был стабильным, обязательно нужен мониторинг. Есть десять причин, почему следует организовать мониторинг. Первая: «по закону Мерфи, сайт обязательно «упадет». Вторая: чем раньше вы узнаете о возникшей проблеме, тем быстрее примете необходимые меры. Третья причина: очень плохо, когда владелец сайта узнает о неполадках от пользователей (например, обсуждающих это на форумах). Четвертая причина перекликается с предыдущей: обсуждение простоя ресурса в Интернет приносит больший урон, чем сам простой. В-пятых,  ответственность за поломку сайта будет лежать на владельце ресурса, а не на провайдере. Шестая причина необходимости мониторинга вызвана проблемами разработки обновлений. Седьмое: даже если сайт, на первый взгляд, работает нормально, в Интернет он может быть никому не виден. Восьмая причина: мониторинг сэкономит время на обнаружение того, что конкретно не работает. В-девятых, знать о проблеме необходимо в любое время. В самой компании Mail.Ru Group администраторы системы дежурят круглосуточно. И, наконец, десятая причина – мониторинг компании обойдется дешевле, если сравнивать со стоимостью профессиональной разработки сайта.

По словам Владимира Габриеляна, в Mail.Ru Group работает 140 различных типов мониторов, которые мониторят порядка 150 тысяч объектов. В частности, в компании проводится мониторинг работы сервиса и его функций, сетевой доступности, скорости работы сайта, заменяемость хранилищ данных. «И самое важное – мониторинг того, что мониторинг работает», - подчеркнул Владимир Габриелян.

Кроме мониторинга необходимо резервирование систем  и балансировка нагрузки. При этом необходим автоматический ввод резерва, который всегда должен быть в рабочем состоянии. Одним из способов обеспечения отказоустойчивости является модульная архитектура проекта. Также необходим релиз-менеджмент и тестирование.

Проблема нового проекта, как правило, бывает связана с новым релизом. Поэтому релиз-менеджмент должен быть обязательно и быть автоматизирован. При запуске новой опции помогает сплит-тестирование – для небольшой группы пользователей. Все релизы должны иметь механизм, позволяющий «откатиться» на предыдущий шаг.

Для обеспечения стабильности работы сайта необходимо прогнозирование нагрузки. Для этого следует следить за графиком, иметь пороговое значение времени ответа, помнить о специфике проекта (всплески нагрузки в праздничные дни).

Еще требуется планирование аварий, которые, как мы сказали выше, неизбежны. Здесь имеется в виду то, что каждый участник команды должен знать свои действия в случае возникновения аварии. Любые планы восстановления после сбоя должны регулярно проверяться, так как они быстро теряют актуальность. Также обязательно нужно иметь резервные копии. Практика показывает, что зачастую компании их не имеют, а иногда бэкап столь огромен, что на его установку требуется значительное время. По результатам каждого сбоя должно быть проведено обсуждение: что прошло хорошо, а что не очень хорошо.

На форуме также обсуждались вопросы эволюции разработки, технологии поиска и тестирования, практика создания социальной игры, платежные системы и многое другое.

Автор: Елена Шашенкова (info@mskit.ru)

Рубрики: Интернет, Интеграция, Маркетинг, ПО, Кадры, Web

Ключевые слова: mail ru, mail

наверх
 
 
     

А знаете ли Вы что?

     
 

ITSZ.RU: последние новости Петербурга и Северо-Запада

MSKIT.RU: последние новости Москвы и Центра

NNIT.RU: последние новости Нижнего Новгорода