Новая технология центров обработки данных Amazon может переписать правила облачного хранилища





Мы можем получать комиссию за покупки, совершенные по ссылкам.

Amazon Web Services уже много лет обеспечивает значительную часть Интернета. По данным CRN, по состоянию на первый квартал 2026 года компания, занимающаяся облачными технологиями и искусственным интеллектом, контролирует 28% мирового рынка облачной инфраструктуры. Вот почему всякий раз, когда в AWS происходит сбой, создается впечатление, что он забирает с собой большую часть Интернета. Это делает устойчивость сети главным приоритетом в любом центре обработки данных, а учитывая масштабы работы AWS и то, насколько от него зависит Интернет, это особенно важно для центров обработки данных AWS.

Давняя проблема центров обработки данных заключается в выходе за рамки топологии сети так называемого «жирного дерева». Хотя они могут быть надежными и предсказуемыми в масштабе, хорошо известно, что они требуют компромисса в эффективности и пропускной способности. Amazon сообщает, что ее новый сетевой дизайн является первым в своем роде и способен заменить сети с «толстым деревом» в центрах обработки данных AWS. Amazon называет этот новый сетевой дизайн RNG, что означает «устойчивые сетевые графики».

Согласно пресс-релизу Amazon, ее новая сетевая иерархия RNG является «прорывом, который обеспечит большую надежность и производительность для клиентов AWS, сэкономит миллиарды долларов на оборудовании и снизит выбросы CO2 во все большем количестве сетей, в которых работает компания».

Amazon не раздувает свои новые центры обработки данных, а не раздувает их

Хотя Amazon и ее команда разработали новый подход к проектированию своей сети RNG, его основы не новы. Он основан на существующем объеме работ и исследованиях плоских сетей (таких как проект межсетевых соединений Jellyfish), идее соединения маршрутизаторов и коммутаторов напрямую друг с другом, а не на уровнях, используемых в древовидной иерархии. Топология «толстого дерева» — распространенная схема сети в центрах обработки данных, где узлы соединены слоями, а ветви наверху дерева имеют более высокую пропускную способность («более толстые»), чем ветви внизу. Пакеты данных затем перемещаются вверх и вниз по дереву, маршрутизируясь по заданному пути.

Хотя эта топология имеет решающее значение для гипермасштабирования центров обработки данных (несмотря на сопротивление американцев), она также подвержена узким местам и перегрузкам. Маршрутизаторы на вершине дерева могут стать критическими точками отказа, выводя из строя целые части под ним. RNG Amazon, основанный на теории плоских сетей, улучшает пропускную способность за счет случайных соединений, что уменьшает узкие места в сети, но также уменьшает количество отдельных точек сбоя, при этом ни один маршрутизатор не является более важным, чем другой.

В статье, опубликованной в Amazon Science, Джакомо Бернарди, Ратул Махаджан и Сешадри Командур, команда, которая возглавляла поиск альтернатив топологии «толстого дерева», отметили, что потеря 1% маршрутизаторов эквивалентна примерно 1% потери мощности в случайной сети, подчеркивая повышенную устойчивость по сравнению с топологией дерева. Но реализация случайной сети всегда представляла собой определенную непрактичность, а именно, вопрос о том, как проложить такую ​​сеть, поскольку перекрещивание миллионов оптоволоконных кабелей в центре обработки данных просто невозможно. Существует также проблема, как эффективно маршрутизировать данные без строгого протокола, который предлагают устоявшиеся топологии.

Amazon создала Spraypoint и ShuffleBoxes для создания квазислучайной сети.

Чтобы решить проблемы случайной сети, Amazon использует смесь фиксированных сетевых элементов с избранными частями случайной сетевой архитектуры для создания «квазислучайной» сети. Для этого Amazon создал алгоритм маршрутизации данных под названием Spraypoint и пассивное оптическое устройство под названием ShuffleBox. Согласно официальному документу, опубликованному на arXiv, Spraypoint работает путем «распространения» всех пакетов источника на его соседей, все из которых имеют право на следующие переходы, и один из них выбирается на основе многопутевой маршрутизации с равной стоимостью (ECMP).

Идея состоит в том, что каждый пакет, распыляемый из источника, отправляется случайному соседу, затем пробирается кратчайший путь к путевой точке, а путевые точки отправляют трафик в пункт назначения. Amazon использует путевые точки, чтобы распределить трафик и предотвратить скопление пакетов в одном пункте назначения. Алгоритм Spraypoint допускает некоторый уровень произвольного сетевого взаимодействия на обычных маршрутизаторах, поэтому маршрутизаторам не требуются специализированные процессоры или память для хранения и обработки всех возможных путей маршрутизации.

ShuffleBox предназначен для физического подключения RNG. ShuffleBox — это оптические устройства с герметичным корпусом и без источника питания, поэтому они не увеличивают задержку и снижают риск сбоя. ShuffleBoxes работают, имея порты, обращенные к маршрутизатору, для подключения серверных стоек, а затем еще один набор портов для подключения их к другим ShuffleBoxes. Волоконные провода перетасовываются внутри в соответствии со специальной схемой, подробно описанной в официальном документе, затем блоки ShuffleBox соединяются между собой случайным образом. Это дает сети квазислучайные соединения, но при этом сохраняет низкую сложность кабельной разводки и позволяет масштабировать ее в соответствии с занимаемой площадью, на которой работает AWS. Amazon также заявляет, что их стоимость аналогична стоимости обычных патч-панелей, что делает их экономически эффективным решением.

Amazon находится на переднем крае, и то, что она делает, имеет значение

В официальном документе Amazon утверждается, что RNG соответствует или превосходит сети с «толстым деревом» по множеству моделей сетевого трафика и рабочих нагрузок, а также способен перемещать данные на треть быстрее, при этом его внедрение обходится на 45 процентов дешевле. Вероятно, это связано с заявлением Amazon, что ее новая квазислучайная сеть обеспечивает ошеломляющее сокращение количества маршрутизаторов на 69 процентов. Это приводит не только к снижению затрат на оборудование, но и к снижению потребления электроэнергии — Amazon ожидает, что центры обработки данных AWS, использующие RNG, будут потреблять на 40 процентов меньше энергии по сравнению с иерархическими сетями.

Уменьшение мощности и оборудования также означает сокращение объема охлаждения, необходимого центрам обработки данных AWS, и оба этих фактора помогут Amazon сократить выбросы CO2 на площадках своих центров обработки данных. Углеродный и водный след центров обработки данных стал основным предметом споров как для общественности, так и для законодателей, заставляя эти места становиться более экологически устойчивыми. Amazon уже использует очищенную воду для охлаждения некоторых центров обработки данных, но это только часть уравнения.

Тем не менее, снизив базовые требования к охлаждению и электропитанию для своих центров обработки данных с помощью RNG, Amazon может фактически достичь своей цели: обеспечить положительный уровень воды к 2030 году и достичь нулевых выбросов углекислого газа к 2040 году. Будучи лидером рынка, Amazon находится на переднем крае технологий центров обработки данных; то, что она делает, имеет значение, поскольку это оказывает волновое воздействие на отрасль. Теперь, когда компания доказала жизнеспособность гибридного сетевого подхода, другие компании, такие как Google и Microsoft, могут последовать ее примеру.

По данным Amazon, ее первая квазислучайная сеть RNG была запущена в Дублине, Ирландия, в 2024 году. В течение 2025 года она распространилась на Испанию и Германию, а с апреля 2026 года теперь является стандартом для новых центров обработки данных AWS.