Распад интернета: крупные отключения происходят еженедельно

5 июля 2019

Конец июня ознаменовался сразу тремя крупными сбоями в интернете. Если раньше они проявляли себя раз в месяц, теперь участились и с конца июня возникают еженедельно. Самая заметная авария — в Facebook, когда пользователи не видели картинок. Неделей раньше перестали загружаться многие сайты — причиной стала ошибка маленького провайдера и слишком доверившийся ему большой.

Под угрозой не только сайты, но и сервисы мобильных экосистем. 4 июля Apple, чья репутация держится на бережном отношении к пользовательским данным, уронила облачный сервис iCloud. Что происходит с интернетом и когда это кончится?

Этот материал был первоначально написан для технорассылки The Bell. Подписаться на нее можно здесь.

Интернет на доверии

24 июня тысячи сайтов перестали работать или начали загружаться очень медленно. Быстро выяснилось, что это — следствие некомпетентности сотрудников одного маленького американского провайдера, а также не заблокировавшего эти настройки гораздо более крупного оператора Verizon.

Пострадали сервисы Cloudflare, Amazon, Facebook и другие — включая их клиентов (в их числе оказался и The Bell). Это могло бы стать хорошей демонстрацией хрупкости интернета, если бы произошло один раз. Но с конца июня произошло уже четыре крупных отключения.

Предел сложности

Когда проектировалась сеть сетей, которая должна была стать интернетом, нагрузочным тестированием для нее могла стать ядерная война, но не бизнес Amazon, миллиарды поисковых запросов в Google и одновременный просмотр миллионами людей сериалов на Netflix.

Задачи, которые стоят перед интернетом в 2019 году, не совпадают с теми, которые ставили проектировщики. Поэтому очень надежную систему начали модернизировать и усложнять.

Например, технокорпорации, пользователи которых потребляют существенную часть мирового трафика, проложили по дну собственные кабели (на изображении кабели Google, Microsoft, Amazon и Facebook отмечены черным, а остальные — серым).

Так как через подводные кабели в целом проходит 95% мирового трафика, несколько компаний контролируют существенную его часть. Ошибки компаний отражаются на целостности интернета.

Например, ровно через неделю после пенсильванского отключения уже сами сотрудники сервиса Cloudflare, обеспечивающего доступность сайтов по всему миру, доставку видеотрафика и защиту от DDoS-атак, неправильно обновили программное обеспечение. Результат — 30 минут нестабильной работы интернета в понедельник.

Но проблема не исчерпывается неправильными настройками где-то у технических специалистов. От крупных технокомпаний и предоставляемых ими услуг зависят сотни миллионов — а в случае экосистемы Facebook и миллиарды людей.

Именно эта экосистема перестала стабильно работать 3 июля — сообщения в Facebook Messenger и WhatsApp не проходили, а сториз в Instagram не показывались. Легче других отделался сам Facebook — там исчезла часть картинок, и на их месте стали видны текстовые описания, сочиненные нейросетями компании Цукерберга. На изображении ниже — характерный вид профиля одного из пользователей Facebook во время отключения.

Объяснение, которое дал Facebook, — «рутинная операция во время обслуживания привела к возникновению неисправности» — ничего на деле не объясняет. По не подтвержденным официально данным, сбой в Facebook Messenger привел к оттоку пользователей в Twitter и там положил сервис обмена прямыми сообщениями.

Это не первое подобное испытание для Facebook — в мае сервисы компании вышли из строя в ряде регионов на 24 часа, что привело к массовому переходу пользователей на альтернативные продукты и мессенджеры — в частности, на Telegram.

Сбои в облаках

Кроме передачи данных на уровне крупных узлов сети и обмена сообщениями на уровне конечных пользователей есть еще один важный компонент привычного нам интернета — сервисы хранения данных.

Мы привыкли к тому, что наши данные надежно хранятся в облачных хранилищах одной из крупных технокомпаний. В ближайшие годы, по прогнозу Мэри Микер, облачные хранилища по объему данных превзойдут и хранилища на устройствах пользователей, и внутренние корпоративные системы. Но надежность облачных хранилищ под большим вопросом.

Последний пример — Apple, которая свою экосистему построила вокруг приватности и защиты данных.

Что мне с этого?

В основном — нервотрепка. Раньше хранить данные в облаке боялись из-за недоверия. Затем — из-за плохих облачных инструментов.

Теперь выбора нет — добрая половина веб-приложений использует облачные хранилища; самые быстрые и стабильные сайты являются такими благодаря системам доставки контента вроде Cloudflare; весь рынок облаков оценивается более чем в $200 млрд, а в 2022 году его объем превысит $330 млрд.

При этом инфраструктурные ошибки будут обходиться все дороже. Подорожают и альтернативные решения.

Российским пользователям в ноябре, когда частично вступит в силу закон о суверенном интернете, следует ждать перемежающихся сбоев. Доступность облачных серверов может меняться в зависимости от настроения Роскомнадзора. Нечто подобное, но в сравнительно небольших масштабах мы наблюдали во время апрельской охоты за Telegram в 2018 году, когда выходили из строя многие блокируемые сервисы.

#технологии

Скопировать ссылку