Тестирование нового процессора Intel Atom C3958
Очередной мой переводной материал. На этот раз героем является процессор Intel Atom C3958, тестирование которого провел интернет-ресурс servethehome. Но не спешите закрывать страницу, т. к. речь пойдет не о хилом, немощном нечто, мало пригодном для обычного использования, а о сравнительно недавно анонсированной 3000-й серии этих процессоров (а, по сути, SoC), ориентированных на применение в хранилищах данных, встраиваемых решениях, серверах. Итак, Intel Atom C3958 – обзор и результаты тестирования топового процессора в этом семействе.
Описание и характеристики
В 3-е поколение семейства процессоров Atom, имеющих кодовое имя "Denverton", входит довольно большое количество моделей. Самый младший процессор имеет всего 2 ядра, ну а старшенький (о котором сейчас и идет речь), может похвастаться аж 16-ю ядрами.
В определенной степени можно сказать, что имеется как минимум 2 топовые модели, это C3958 и ее близкий родственник - C3955. Приведу основные характеристик обеих моделей.
Процессор | C3955 | C3958 |
Количество ядер | 16 | |
Количество потоков | 16 | |
Базовая частота (Turbo Boost), ГГц | 2.1 | 2.0 |
Макс. частота, ГГЦ | 2.4 | 2.0 |
Макс. объем памяти, ГБ | 256 | |
Кол-во линия PCI-Express | 8 | |
Макс. кол-во SATA | 16 | |
Встроенная поддержка LAN | 4x10/2.5/1 GbE | |
Поддержка Intel® QuickAssist | - | + |
TDP, Вт | 32 | 31 |
Рекомендуемая цена, $ | 434 | 449 |
Собственно, различия не сказать, чтобы сильно бросались в глаза. Причем C3955 имеет поддержку Turbo Boost, а вот старший Atom подобного «турбонаддува» лишен. Казалось бы, не ему быть топовой моделью, но все же главное его отличие от C3955 – это поддержка технологии Intel® QuickAssist.
Кратко о том, что такое QuickAssist, или сокращенно – QAT. Это набор программно-аппаратных средств для ускорения шифрования и сжатия данных. Очень помогает QuickAssist в случаях, когда необходимо производить сжатие данных «на лету», шифровать потоки данных, обеспечить работу криптографии и т. п. В общем, все, что связано с защитой данных, аутентификацией, обеспечением безопасности. QAT существенно ускоряет работу приложений, причем весьма существенно.
Надо заметить, что эта полезная функция входит в состав не каждой модели. Вот и C3955 ее лишен, хотя имеет свои достоинства. QuickAssist использовался и процессорами Atom серии C2xxx, но в новом поколении использование технологии вышло на более высокий уровень. Так, в отличие от Atom C2xxx, для C3xxx не требуется специальный драйвер. В тестировании функция QAT была активирована, хотя в представленных ниже тестах она не использовалась.
Собственно, наличие QAT – едва ли не единственный аргумент в пользу именно C3958, а не C3955, хотя повод весьма веский. Если же выполняемые задачи не подразумевают использование шифрования, сжатия данных, в общем того, для чего нужна эта технология, то смысла в выборе именно C3958 нет.
О том, что это именно серверный продукт, говорят характеристики процессора. Здесь и поддержка большого объема памяти, и наличие 16-мегабайтного кэша L2 (по 1 МБ на каждое ядро), причем ECC, 4-х 10-гигабитных интерфейсов, 16-ти SATA устройств, технологий виртуализации VT-x, VT-d и т. п. Кстати, этот процессор не поставляется покупателям как отдельный компонент, а только в составе как минимум материнской платы.
Для тех, кому интересно, приводим результат выполнения линуксовой команды lscpu, выводящей подробную информацию о процессоре и всех его особенностях.
Тестовый стенд
Для проведения испытания была собрана следующая конфигурация:
- Материнская плата: Gigabyte MA10-ST0 с распаянным на нем процессором Intel Atom C3958.
- Память: 4x 16GB DDR4-2400 RDIMMs (Micron).
- SSD: Intel DC S3710 400GB.
- Загрузочное устройство: Intel DC S3700 200GB.
Немного подробнее про системную плату. Она весьма интересна для построения хранилищ данных. «На борту» у нее 4 слота для установки памяти, флеш-память eMMC объемом 32 ГБ производства Kingston, 2 10-гигабитных порта SFP и столько же гигабитных сетевых портов. При этом имеется разъем PCIe x8, а также 4 разъема SFF8087 для подключения 16 SATA накопителей.
Подробный обзор данной материнской платы скоро будет, но сейчас можно сказать, что максимальное потребление с двумя 10Gb SFP+ подключениями и двумя подключенными гигабитными интерфейсам составило 61 Вт.
Результаты тестов
Мы использовали наши старые, проверенные Linux-Bench скрипты. У нас есть более свежая подборка скриптов, но в данном случае она показалась не столь нужной, т. к. основное предназначение данной платформы – это встроенные приложения. При использовании подобной конфигурации в хранилищах данных или в сетевых устройствах встроенные приложения не имеют высокой нагрузки, и использование расширенных наборов команд AVX2 и AVX-512 видится излишним.
В своих прошлых проверках мы убедились, что лучшими ОС для процессоров Intel Atom серии C2000 являются Linux и FreeBSD. Windows мало распространена на таких платформах, и мы не советуем использовать данную платформу в качестве обычного компьютера. Для этого найдется масса других, более выигрышных вариантов.
Python Linux 4.4.2 Kernel Compile Benchmark
Этот тест мы используем часто. Используется стандартный конфигурационный файл, ядро Linux 4.4.2, взятое с kernel.org, и стандартно генерируемая конфигурация нагружает каждый поток в системе. Результаты показывают количество компиляций в час.
Полученные результаты показали очень неплохую производительность, которая соизмерима с результатами 8-ядерного процессора Xeon D. Модель C3955 показала немного лучшие результаты. Это неудивительно, все же различия в микроархитектуре должны проявляться в работе процессоров.
c-ray 1.1
Еще один постоянно используемый нами тест трассировки лучей, весьма популярный и показывающий разницу работы в многопоточных системах.
Показанная производительность и тут хороша. Ожидаемо более «шустрый», да еще турбированный C3955 показал более высокие результаты. Что интересно, Intel Xeon E3 продемонстрировал схожую производительность, но у него нет многих функций, которые есть у Atom, да еще и потребляемая мощность у него выше.
7-zip Compression
Очень популярное и часто используемое кроссплатформенное приложение для архивации/разархивации данных.
Полученные результаты очень неплохи. Конечно, 16 ядер Atom это не 16 ядер Xeon D, и тягаться с последним не получится. В данном случае не используется QAT, а это могло бы заметно изменить результаты, и в этом мы скоро убедимся. Если же говорить о производительности, то по скорости сжатия Intel Atom C3958 можно расположить где-то между 6-ю и 8-ядерными Xeon D. Скорость разархивации находится на где-то между 8-ю и 12-ядерными Xeon D.
Sysbench CPU test
Очередной популярный тест на платформе Linux. Мы использовали именно тест CPU, а не OLTP, который применяется при проверке накопителей.
Пришлось убрать результаты процессоров C2358 и D525 из-за низких значений, что сделало бы график сложночитаемым. Тест хорошо масштабируется и отлично нагружает все имеющиеся ядра процессора. Неудивительно, что 16 ядер пришлись очень «ко двору».
OpenSSL
Криптографический пакет, используемый для шифрования обмена между серверами. Мы получили следующий результат.
При повторной проверке получилось следующее (мы отсортировали результаты в том же порядке, что и в первом прогоне тестов, чтобы было удобнее).
Как мы видим, Intel Atom C3958 соперничает со сходным по цене Xeon Silver 4108, который предназначен для более мощных серверов. Но более интересным в данном случае является сравнение с предыдущим 2000-м поколением процессоров Atom. Топовый C2758 с включенным QAT оказался в 4 раза медленнее C3958, в котором не использовалась данная функция. Это важно, т. к. OpenSSL часто используется именно в сетевых устройствах и системах хранения данных.
UnixBench Dhrystone 2 и Whetstone Benchmarks
Тесты старые, но пока мы продолжаем использовать их по многочисленным просьбам. Результаты UnixBench Dhrystone 2.
Результаты Whetstone Benchmarks.
В данном случае видим явную пользу от многоядерности, т. к. в данном случае это компенсирует те компромиссы в микроархитектуре, на которые пришлось пойти для снижения энергопотребления. В данном случае вариант, когда «числом, а не уменьем».
Заключение
Это совсем не тот «Атом», который сразу приходит на ум при упоминании этого семейства процессоров. Базовая частота Atom C3958 не так велика по нашим временам, нет поддержки технологии «Turbo Boost», нет кэш-памяти третьего уровня, нет поддержки набора команд AVX2/ AVX-512, но 16 ядер, по 1 МБ кэша L2 на каждое ядро, существенные улучшения в IPC (Inter Process Communications) позволяют ему соперничать в производительности с Xeon D и Xeon Bronze/Silver.
Естественно, последние более подходят для виртуализации и обычного применения, но в сетевых устройствах и устройствах хранения данных «атомные» процессоры весьма хороши.
Сейчас много говорят об AMD EPYC, но у AMD нет своих решений, способных конкурировать в данном сегменте по совокупности характеристик. Так, EPYC 7251 имеет TDP в 120 Вт (сравните с Atom), имея 8 ядер, 16 потоков, правда, поддерживая увеличение частоты до 2.9 ГГц. Правда, и целей занять свою нишу именно в этом сегменте у AMD нет, по крайней мере, с EPYC.
Активность проявляла компания ARM, но сочетание производительности и использование технологий ускорения функций криптографии и компрессии данных, которое есть в 3000-й серии процессоров Atom, позволяют Intel уверенно чувствовать себя в ближайшем будущем.
Если рассматривать топовые решения с поддержкой QAT, то можно увидеть существенный прогресс, по сравнению с предыдущим поколением (Atom C2758). Единственное, что снизилось - это тактовая частота (примерно на 17 %). В остальном – сплошные улучшения. Судите сами, количество ядер удвоилось (с 8 до 16), объем кэша и максимального объема памяти увеличился вчетверо (до 16 МБ и 256 ГБ соответственно), PCIe обновила поколение, появилась поддержка 10-гигабитной сети. Вот только за существенно возросшую производительность пришлось заплатить возросшим TDP.
К сожалению, увеличились, и существенно, цены. Правда, широкая линейка моделей позволяет подобрать вариант (например, Atom C3758), который дешевле, и может с успехом заменить предыдущий топовый процессор в соответствующих областях применения.
Благостную картину существенно возросшей производительности только портит цена, т. к. при стоимости в 449 $ Atom C3958 конкурирует с Intel Xeon Silver 4108 и Xeon D lines, а это, как ни крути, птицы несколько другого полета.
Источник: https://www.servethehome.com/intel-atom-c3958-16-core-top-end-embedded-qat-linux-benchmarks-and-review/
Читайте другие статьи раздела "Техника".