Инфраструктура искусственного интеллекта для Большого адронного коллайдера (БАК) кардинально отличается от стандартных систем на базе TPU или GPU. Как сообщает The Register, специалисты ЦЕРНа (CERN) фактически «впечатывают» специализированные ИИ-алгоритмы прямо в кремниевые чипы, чтобы отфильтровывать колоссальные потоки данных практически мгновенно.
Каждый год установка производит около 40 тысяч эксабайт необработанных данных с датчиков — это сравнимо с четвертью всего объёма информации в интернете. Сохранять такие массивы ЦЕРН не в состоянии, поэтому критически важно в реальном времени отбирать только значимые сведения. Поток достигает сотен терабайт в секунду, и алгоритмы его обработки должны обладать феноменальной скоростью. Именно поэтому их интегрируют непосредственно в аппаратное обеспечение, «выжигая» в кремнии.
В 27-километровом туннеле БАК субатомные частицы сталкиваются со скоростями, приближенными к световым. По кольцу циркулируют примерно 2,8 тысячи сгустков протонов с интервалом в 25 наносекунд. Несмотря на контроль со стороны учёных, столкновения происходят относительно редко: из миллиардов протонов в каждом цикле взаимодействует лишь около 60 пар. В результате рождаются новые частицы, которые регистрируют детекторы ЦЕРНа.
Источник изображения: Brandon Style/unsplash.com
Каждое столкновение пары частиц создаёт несколько мегабайт информации. В секунду происходит до миллиарда таких событий, что в сумме генерирует около 1 петабайта данных. Очевидно, что сбор и хранение всего этого объёма в исходном виде технически неосуществимы. Поэтому ЦЕРН разработал масштабную вычислительную систему, которая на уровне детекторов сразу разделяет информацию на «перспективную» и «фоновую».
Источник изображения: Thea Klaeboe Aarrestad (ETH Zürich)
В детекторах применяются ASIC-микросхемы, которые временно хранят данные не дольше 4 микросекунд — после этого они либо записываются, либо безвозвратно теряются. Решение о сохранении принимает первичный триггер (Level One Trigger), построенный на основе примерно тысячи FPGA-плат. Эти платы получают информацию по оптическим каналам со скоростью порядка 10 ТБ/с. Анализ происходит непосредственно на самих чипах в режиме реального времени, по мере поступления данных — даже самое быстрое внешнее хранилище не способно обработать подобный поток. Специализированный алгоритм AXOL1TL выносит вердикт за время не более 50 наносекунд. В итоге сохраняется лишь около 0,02 % данных о столкновениях, что соответствует примерно 110 тысячам событий каждую секунду. Отобранная информация передаётся на поверхность, но даже после такой первичной фильтрации ежесекундно передаются терабайты данных.
Источник изображения: Thea Klaeboe Aarrestad (ETH Zürich)
На поверхности вступает в работу второй фильтр — High Level Trigger, который сокращает поток до примерно тысячи событий в секунду. Эта система использует 25,6 тысяч центральных процессоров и 400 графических процессоров для реконструкции столкновений и отбора наиболее значимых с научной точки зрения. В результате формируется около 1 петабайта новых данных ежедневно. Эти данные распределяются между 170 научными центрами в 42 странах, где их изучают исследователи со всего мира. Совокупная вычислительная мощность всех участников проекта достигает примерно 1,4 миллиона ядер. ЦЕРН ставит задачу измерять параметры столкновений с точностью 99,999 % — это «золотой стандарт», необходимый для обоснования научных открытий.
Источник изображения: Thea Klaeboe Aarrestad (ETH Zürich)
Стандартные инструменты искусственного интеллекта оказываются неэффективными для систем детектирования, что вынудило специалистов ЦЕРН создать собственную технологическую платформу. Модели ИИ, применяемые на Большом адронном коллайдере, целенаправленно оптимизированы: их масштаб уменьшен, архитектура усовершенствована, вычисления распараллелены, а работа «натаскана» на выделение исключительно значимых данных. В контексте БАК такие модели демонстрируют сопоставимую производительность, но оказываются намного более экономичными по сравнению с классическими решениями машинного обучения. Для внедрения моделей в аппаратное обеспечение используется компилятор HLS4ML, который преобразует их в код на C++, способный выполняться на ИИ-ускорителях, системах на кристалле, специализированных ПЛИС и даже прошиваться в виде заказных микросхем. При этом существенная доля ресурсов чипа отводится не на выполнение алгоритма, а на хранение таблиц с заранее вычисленными результатами для типичных входных значений, что позволяет осуществлять фильтрацию информации с ещё большей скоростью.
Источник изображения: CERN
В конце текущего года БАК будет остановлен, а его преемник — Высокосветильный коллайдер, должен быть запущен в 2031 году. Он будет оснащён более мощными магнитами для фокусировки частиц, размеры пучков увеличатся вдвое, а сам ускоритель станет генерировать в десять раз больше данных, причём объём информации от каждого отдельного события возрастёт с 2 до 8 мегабайт. ЦЕРН уже накопил 1 эксабайт данных с БАК, однако это составляет лишь десятую часть от того массива, который предстоит хранить и обрабатывать в течение следующего десятилетия. И в то время как ведущие исследовательские центры в области ИИ создают языковые модели всё большего размера, ЦЕРН движется в обратном направлении, сосредоточив усилия на максимальном упрощении и ускорении процесса обнаружения аномальных событий с помощью искусственного интеллекта.
Источник:
- The Register