Compute Express Link (CXL) представляет собой инновационное технологическое решение, решающее критические проблемы со стенками памяти в современных вычислительных инфраструктурах. Технология межсоединений представляет собой комплексный подход к преодолению существующих ограничений архитектуры памяти, предлагая высокую плотность полосы пропускания и стандартизированный интерфейс для расширения и объединения памяти. Инновационный дизайн CXL привлек значительное внимание как в промышленной, так и в академической сфере, что свидетельствует о его потенциале коренным образом изменить архитектуру центров обработки данных. Крупнейшие технологические лидеры, в том числе Intel, Samsung и SK Hynix, активно изучают и внедряют технологии CXL. Значение этой технологии выходит за рамки простых постепенных улучшений, обещающих произвести революцию в том, как вычислительные системы управляют и используют ресурсы памяти во все более сложных вычислительных средах.
Несмотря на многообещающую технологическую основу CXL, эта технология сталкивается со значительными проблемами производительности, возникающими из-за внешнего вмешательства в серверные архитектуры. Технология межсоединений сталкивается с потенциальными угрозами производительности из-за сложных взаимодействий между основной памятью (MMEM) и соседними компонентами хранилища, которые текущие исследования не изучили всесторонне. Поддержание изоляции производительности становится критически важным, особенно для приложений с жесткими требованиями к производительности. Существующие исследования, такие как исследование MT2, пытались изучить взаимодействие между постоянной памятью и DRAM путем выявления шумных соседей и уменьшения сбоев в трафике памяти. Однако механизмы вмешательства, специфичные для CXL, остаются в значительной степени недостаточно изученными. Современные подходы к моделированию обычно вводят коэффициенты задержки вручную, что не позволяет точно отразить реальную операционную среду и нюансы взаимодействия между различными вычислительными компонентами.
Исследователи из Университета Цинхуа, Института вычислительных технологий, Китайской академии наук, Alibaba Group и Университета Чжэцзян разработали CXL-помехикомплексная методология для систематической характеристики и анализа потенциальных механизмов взаимодействия между памятью и системами хранения в архитектурах CXL. В исследовании использовались настраиваемые микротесты и реальные приложения в двух различных аппаратных конфигурациях CXL для выявления и изучения условий помех. Проводя детальные оценки с использованием функций ядра и счетчиков производительности оборудования, исследовательская группа исследовала сценарии взаимодействия в нескольких областях приложений, включая файловые системы, базы данных, машинное обучение, большие языковые модели, базы данных в памяти и графовые вычисления. Важно, Это исследование положило начало первому исследованию помех CXL на реальных устройствах, продемонстрировав новый подход к пониманию сложных вычислительных взаимодействий. В ходе исследования были успешно изучены стратегии вмешательства программного и аппаратного обеспечения, в конечном итоге разрабатывает решения для восстановления пропускной способности памяти до 99% от исходного уровня производительности.
CXL, разработанный в 2019 году, представляет собой надежное и уникальное межсоединение с открытым стандартом, предназначенное для повышения производительности приложений, ориентированных на данные, за счет высокоскоростной связи между вычислительными компонентами с малой задержкой. Стек протоколов этой технологии состоит из трех важнейших элементов: CXL.io, CXL.cache и CXL.mem, каждый из которых обеспечивает отдельные механизмы передачи данных и доступа к памяти. Устройства CXL подразделяются на три типа с различными возможностями: от облегчения связи до совместного использования и расширения ресурсов памяти. Эти устройства могут быть реализованы с использованием технологий FPGA или ASIC, при этом такие поставщики, как Intel, Samsung, Montage и Micron, активно разрабатывают инновационные решения. Эта технология устраняет фундаментальные ограничения традиционных систем памяти, в частности ограниченную емкость и пропускную способность обычной DRAM, предлагая сложные возможности объединения и расширения памяти.
Исследовательская группа разработала комплексные микробенчмарки для систематической оценки взаимодействия CXL в различных операциях с памятью и хранилищем. Экспериментальная установка включала перекрестную оценку трех операций, связанных с памятью (загрузка, сохранение и временное сохранение), и двух операций, связанных с хранением (произвольное чтение и произвольная запись). Исследователи тщательно контролировали условия эксперимента, отключая гиперпоточность, блокируя частоту процессора и очищая кэш перед каждым тестом. В ходе экспериментов основные и мешающие процессы были распределены по отдельным ядрам внутри одного узла NUMA, что обеспечило точную точность измерений. Для получения статистически надежных средних результатов было проведено несколько итераций теста. Разработка микротестов позволила детально изучить механизмы взаимодействия между CXL, MMEM и системами хранения, предоставив детальную информацию о взаимодействии производительности в различных вычислительных конфигурациях.
В ходе исследования были изучены сценарии помех для четырех различных типов приложений, систематически классифицировав их по типам от A до D. Эти категории охватывали приложения, связанные с файловой системой, в трафике CXL, приложения, связанные с CXL, в трафике SSD, приложения, связанные с MMEM, в трафике CXL и Приложения, связанные с CXL, под трафиком MMEM. Исследователи выбрали широкий спектр приложений с различными вычислительными характеристиками для всестороннего анализа механизмов интерференции. В исследовании тщательно задокументировано влияние на производительность в различных сценариях. Анализ выявил постоянные конфликты и конфликты между различными типами доступа и конфигурациями систем, подчеркивая сложные взаимозависимости между вычислительными компонентами в современных серверных архитектурах.
По мере того как технология CXL переходит от теоретических концепций к коммерчески доступным устройствам, исследователи осознают острую необходимость изучения этих компонентов за пределами изолированных характеристик. Исследование показывает значительные последствия для производительности, когда устройства CXL взаимодействуют с другими компонентами системы, демонстрируя потенциальное падение производительности до 93,2% при определенных сценариях помех. Систематически исследуя коренные причины этих нарушений производительности, исследование не только выявляет сложные взаимодействия внутри современных вычислительных архитектур, но также предлагает целевые механизмы управления трафиком CXL. Комплексная оценка дает решающее представление о технологических проблемах и потенциальных стратегиях их решения для новых технологий памяти и межсоединений, предлагая детальное понимание компромиссов в производительности, присущих вычислительным инфраструктурам следующего поколения.
Проверить тот Бумага. Вся заслуга в этом исследовании принадлежит исследователям этого проекта. Также не забудьте подписаться на нас Твиттер и присоединяйтесь к нашему Телеграм-канал и LinkedIn Групс. Если вам нравится наша работа, вам понравятся наши информационный бюллетень.. Не забудьте присоединиться к нашему 60 тысяч+ ML SubReddit.
![Характеристика и смягчение помех Compute Express Link (CXL) в современных системах памяти](https://www.marktechpost.com/wp-content/uploads/2024/01/Screenshot-2024-01-13-at-8.44.05-AM-150x150.png)
Асджад — стажер-консультант в Marktechpost. Он учится на степень бакалавра технических наук в области машиностроения в Индийском технологическом институте в Харагпуре. Асджад — энтузиаст машинного и глубокого обучения, который постоянно исследует возможности применения машинного обучения в здравоохранении.