Обновления прошивок и первые данные о влиянии обновлений на производительность систем в центрах обработки данных

Автор: Нэвин Шеной (Navin Shenoy)

За последние несколько дней корпорация Intel проделала большую работу по устранению уязвимостей «Spectre» и «Meltdown». Мы стараемся предоставить нашим клиентам всестороннюю поддержку в решении этой проблемы, и мы намерены и впредь продолжать эту работу. Я бы хотел выразить признательность многим из наших партнеров, в том числе компаниям Dell, HPE, HPI, Lenovo и Microsoft, за присоединение к нашему публичному обещанию уделять первостепенное внимание вопросам безопасности.

Подробнее:  Уязвимости безопасности и продукты Intel  (пресс-кит) | Результаты исследования безопасности  (Intel.com)

Я расскажу о ходе нашей работы по выпуску обновлений для прошивок, которые призваны устранить уязвимости, а также проблему с перезагрузкой систем, о которой я писал на прошлой неделе. Кроме того, я расскажу о первых результатах тестирования, позволяющих оценить влияние обновлений на производительность наших платформ в центрах обработки данных.

Обновления прошивок

На сегодняшний момент мы выпустили обновления прошивок для 90% процессоров Intel, которые были представлены за последние пять лет, но впереди у нас еще немало работы. Как я уже отметил на прошлой неделе, хотя обновления прошивки и защищают системы от уязвимостей, заказчики сообщают о более частых перезагрузках систем с обновленными прошивками.

Работая над этим вопросом, мы установили, что подобное поведение наблюдается и в других продуктах в некоторых конфигурациях, в том числе в платформах на базе процессоров Ivy Bridge, Sandy Bridge, Skylake и Kaby Lake. Нам удалось воспроизвести это поведение в наших тестовых условиях, и мы продолжаем работать над выяснением причин. Одновременно с этим, со следующей недели мы начнем предоставлять производителям бета-версию нашего микрокода для валидации.

Для заказчиков, желающих ознакомиться с дополнительными рекомендациями, мы опубликовали более подробную информацию на сайте Центра безопасности Intel.com.  Я буду и далее публиковать обновленную информацию по этому вопросу.

Тестирование производительности в центрах обработки данных

10 января, я поделился с читателями результатами первых тестов, позволяющими оценить влияние обновлений на производительность клиентских систем, а сегодня я готов показать данные о влиянии обновлений на производительность систем в центрах обработки данных. Эти результаты были получены с применением стандартных отраслевых тестов, но мы прекрасно понимаем, что наших заказчиков в первую очередь волнует, как эти обновления скажутся на их собственных рабочих нагрузках. На сегодняшний день мы протестировали серверные двухсокетные платформы на базе процессоров Intel Xeon® Scalable® (под кодовым названием Skylake), нашей новейшей серверной микроархитектуре.

Как и ожидалось, полученные на данный момент результаты тестов указывают на то, что влияние обновлений на производительность зависит от характера конкретных рабочих нагрузок и их конфигураций. В целом, в рабочих нагрузках, подразумевающих большее число изменений в пользовательских привилегиях и в привилегиях ядра, и в которых большая часть машинного времени используется для выполнения задач в привилегированном режиме, влияние обновлений будет более заметно.

Подытоживая имеющиеся на сегодня результаты тестов, можно отметить следующее:

  • В стандартных отраслевых тестах для оценки скорости целочисленных вычислений и вычислений с плавающей точкой, в тестах Linpack, STREAM, в тестах исполнения Java приложений на стороне сервера и в тестах энергетической эффективности, влияние обновлений на производительность варьировалось в диапазоне от 0% до 2%. Эти тесты представляют собой рабочие нагрузки общего характера, наиболее интересные для корпоративных заказчиков и пользователей облачных сервисов.
  • В тесте обработки онлайн-транзакций (OLTP), воссоздающем процессы взаимодействия между брокерской фирмой, заказчиком и биржей, после установки обновления было зафиксировано снижение производительности на 4%. В настоящее время проводится дополнительное тестирование производительности на аналитических задачах, и результаты будут зависеть от конфигурации системы, настроек тестов и используемого пакета для тестирования.
  • Тесты в задачах хранения данных тоже свидетельствуют о том, влияние на производительность зависит от пакета для тестирования, настроек тестов и от конфигурации системы:
    • В тесте FlexibleIO, моделирующем различные типы рабочих нагрузок ввода-вывода, результаты зависят от множества факторов, в том числе от соотношения количества операций чтений/записи, размера блоков, используемых накопителей и степени загрузки процессора. Когда мы проводили тестирование с максимальной загруженностью процессора (100% операций записи), мы увидели снижение пропускной способности на 18%, что обусловлено отсутствием запаса для загрузки процессора. При соотношении числа операций чтения/записи 70/30, снижение производительности составило 2%. В тестах, подразумевающих низкую загруженность процессора (100% операций чтения) – а именно такая модель характерна для задач по организации совместно используемой памяти, мы отметили увеличение загруженности процессора, при этом без какого-либо влияния на показатели производительности.
  • Тесты средств разработки Storage Performance Development Kit (SPDK), которые включают в себя инструменты и библиотеки для создания высокопроизводительных, масштабируемых приложений для систем хранения данных в пользовательском режиме, проводились в нескольких тестовых конфигурациях. В конфигурации SPDK iSCSI влияние обновлений на производительность при работе с одним ядром составило 25%. В конфигурации SPDK vHost мы не заметили снижения производительности.

Более подробная информацию о конкретных тестах, платформах и полученных результатах приведена в таблице ниже. В тех случаях, когда мы отмечаем заметное снижение производительности после установки обновлений, мы тесно работаем с нашими партнерами и заказчиками в поисках решения этой проблемы. В некоторых случаях можно найти другие подходы, которые позволяют свести влияние на производительность к минимуму. Более подробную информацию о некоторых из этих подходов можно получить в нашем техническом материале или в публикации Google о предложенном ими решении безопасности «Retpoline».

Я продолжу публиковать информацию о результатах нашей работы по этому вопросу, в том числе буду делиться данными о влиянии обновлений на производительность систем на базе наших более ранних платформ.

Нэвин Шеной является исполнительным вице-президентом и генеральным управляющим подразделения Data Center Group в корпорации Intel.

О корпорации Intel

Intel (NASDAQ: INTC) раздвигает границы технологий, чтобы сделать возможными самые удивительные впечатления. Более подробная информация об Intel и о результатах работы более 100 тысяч сотрудников компании представлена на сайтах newsroom.intel.ru и www.intel.com.

Intel и логотип Intel являются торговыми марками корпорации Intel в США и в других странах.

*Прочие наименования и торговые марки могут быть собственностью соответствующих владельцев.