Тест Corei7: разгон и производительность.
Введение.
В ноябре 2008 года корпорация Intel анонсировала новую архитектуру - Nehalem, которая является преемником микроархитектуры Core.
Архитектура Nehalem является модульной. Инженеры Intel создали набор базовых блоков, благодаря чему, можно создавать различные модификации процессоров, заменяя те или иные блоки.
Первые процессоры на базе архитектуры Nehalem получили название Core i7. Новые процессоры имеют целый ряд нововведений.
FSB больше нет, есть QPI.
QPI, Intel QuickPath Interconnect, "QuickPath" (ранее Common System Interface, CSI) — новый высокопроизводительный стандарт на процессорную шину типа точка-точка для связи процессоров с периферией и другими CPU в многопроцессорной конфигурации, разработанный фирмой Intel. Nehalem напоминает архитектуру AMD Barcelona, и это доказывает, что технологические решения AMD были не такие плохие, но страдали плохой технической реализацией.
Производительность QPI измеряется в количестве пересылок в секунду (Гигатранзакций в секунду, ГТ/с). Для моделей Core i7-920 и Core i7-940 пропускная способность равна 4.8 ГТ/с, а для Core i7-965 Extreme Edition 6.4 ГТ/с за каждое соединение.
Simultaneous Multi-Threading: возрождение Hyper-ThreadingТехнология Hyper-Threading впервые появилась в Pentium 4 "Northwood". Данная была улучшена и применена на процессорах поколения Nehalem.
Процессоры Core-i7 имеют монолитную компоновку, и, поскольку физических ядер на кристалле четыре, процессоры могут выполнять 8-поточные задачи одновременно. А при использовании двух кристаллов на одной подложке, количество потоков возрастет до 16-ти.
Hyper-Threading, во времена Pentium 4 "Northwood", в некоторых случаях негативно сказывался на производительности однопоточных приложений. В технологии Simultaneous Multi-Threading проблема распараллеливания процессов была сведена к минимуму.
Контроллер памяти.
В архитектуре Nehalem, в отличие от архитектур предыдущих поколений, контроллер памяти был перенесен в процессор.
Если раньше, процессор взаимодействовал с памятью через внешний контроллер (северный мост) по шине FSB, то процессоры Core i7 имеют прямой доступ к памяти, что существенно сказывается на производительности связки «процессор-память» в лучшую сторону.
Встроенный контроллер памяти Core i7-920/940 поддерживает три канала памяти DDR3 1066 МГц по 64 бита на каждый, благодаря чему пропускная способность памяти достигает 25,6 ГБ/с. Контроллер памяти Core i7-965 Extreme Edition поддерживает память 1333MHz.
Следует отметить, что ожидаемые осенью процессоры Core i5, а еще позднее Core i3 будут иметь поддержку только двойного канала.
IntelTurboBoostTechnology
Данная технология направлена на повышение производительности приложений, неоптимизированных под многопоточность. Если приложение использует только одно или два ядра, а остальные ядра простаивают, то процессор автоматически снижает тактовую частоту бездействующих ядер и повышает частоту используемых. Уровень TDP процессоров Core i7 равен 130W, и технология Turbo Boost повышает тактовую частоту ядер так, чтобы значение TDP не было превышено.
Кэш третьего уровня
В процессорах микроархитектуры Core использовалось два уровня кэша: L1 и L2. В процессорах Core i7 используется три. Инженеры Intel решили оснастить каждое ядро процессора собственным кэшем L2 относительно небольшого размера – 256Кб. Такое решение было принято в связи с тем, что при использовании неразделяемого L2 кэша в процессорах Core процессорные ядра иногда могли «перетирать» данные, необходимые другому ядру.
Кэш третьего уровня имеет объем в 8 мегабайт. В отличие от AMD, работа кэша Intel инклюзивная. Это означает, что если ядро попытается получить доступ к данным, которые отсутствуют в кэше L3, то необходимости искать данные в собственных кэшах других ядер отпадает, так как этих данных там просто нет. Если же данные обнаружены, то процессор получает информацию о том, где могут быть потенциально расположены нужные данные в кэше нижнего уровня любого из ядер.
Тестирование.
Целью нашего тестирования является выявление эффективности всех нововведений, примененных в процессорах Core i7. Для сравнения были взяты процессоры Core 2 Quad Q9550 и Core i7-920.
Данный экземпляр процессора Core i7-920 основан на степпинге C0. На текущий момент Intel обновила ревизию процессоров Core i7, новый степпинг имеет маркировку D0, и, по мнению многих оверклокеров, Core i7 на степпинге D0 обладают улучшенным разгонным потенциалом.
Так как Core i7-920 обладает контроллером памяти с поддержкой памяти DDR3-1066, Core 2 Quad Q9550 был разогнан по шине до 400MHz, и его тактовая частота стала составлять 3.4GHz. На данной частоте FSB процессор сможет раскрыть весь потенциал памяти DDR2 частотой только в 800MHz, после чего попробуем сопоставить производительность процессора Core i7 без разгона с Core 2 Quad Q9550 в разгоне.
Для выявления разницы производительности между архитектурами, Core i7 так же был разогнан до частоты 3.4GHz (BLCK 170MHz x 20) для сравнения быстродействия процессоров на равных частотах.
Так же, Core i7 был протестирован с отключенным SMT (Hyper-Threading).
Стендовые конфигурации:
Стенд 1:
Процессор: IntelCorei7-920
Охлаждение: IntelBox
Материнская плата: Gigabyte X58-UD3R
Оперативная память: 3х2Gb 1333MHzDDR 3 Transcend
Видеокарта: HISHD 4870 1GbGDDR5
Жесткий диск: SeagateBarracuda 7200.12 500GB (16mb)
Операционная система: Windows Vista x64 SP1
БП: Huntkey 500W (6500HG)
Стенд 2:
Процессор: IntelCore 2 QuadQ9550
Охлаждение: PCooler 92CU
Материнская плата: GigabyteP45-DS4
Оперативная память: 2х2Gb 800MHzDDR2 Transcend
Видеокарта: HISHD 4870 1GbGDDR5
Жесткий диск: SeagateBarracuda 7200.12 500GB (16mb)
Операционная система: WindowsVistax64 SP1
БП: Huntkey 500W (6500HG)
SuperPi Mod 1.5
По результатам Super Pi (меньше -> лучше), Core i7 на частоте 3.4GHz и с включенным HT существенно превосходит Core 2 Quad Q9550, который работает на такой же частоте.
Наличие SMT (Hyper-Threading) так же незначительно сказывается на результатах однопоточного Super Pi, что действительно говорит об архитектурном улучшении технологии Hyper-Threading. Еще раз повторюсь, что ранее использование Hyper-Threading в однопоточных задачах приводило к снижению производительности.
CineBench 10 x64
В однопоточном тесте CineBench вновь побеждает разогнанный Core i7 920, который превосходит Q9550@3.4GHz практически на 20 процентов. В остальных режимах Q9550 в разгоне незначительно уходит вперед от Core i7 на штатных частотах.
В многопоточном режиме CineBench 10, процессор Core-7 920 без разгона и с отключенным SMT уступает разогнанному Q9550. Включение SMT возвращает победу Core i7.
Winrar 3.71
В многопоточном и однопоточном тесте Winrar 3.71, Core i7 вновь лидирует. Наличие активного SMT не сказывается на результатах в однопоточном тесте, а в режиме многопоточности дает существенное преимущество, и Core i7-920 не оставляет шансов Q9550.
3DMarkVantage
В тесте 3D Mark Vantage, Core i7-920 без HT (SMT) и разгона немного уступает Q9550@3.4GHz, но включение SMT возвращает все на свои места.
В бенчмарках Everest присутствуют результаты тестирования Core i7 с памятью в двойном канале (Core I7-920@2.66GHz, 2-ой канал). Результаты в тестах процессора в этом режиме переписаны с результатов, полученных при использовании тройного канала.
CPU Photoworx
В данном тесте, разгон Q9550 не помогает процессору сравниться с Core i7. Процессор поколения Nehalem существенно превосходит своего предшественника во всех режимах.
CPUQueen
В данном тесте картина полностью повторяет предыдущую. Q9550 @3.4GHz уступает Core i7-920 даже с отключенным SMT. Core i7-920 на этой же частоте получает практически 40% превосходство над Q9550.
CPU Z-Lib
Вновь аналогичная картина.
Задержка памяти
Данный тест позволяет определить время доступа к памяти, т.е. чем меньше значение, тем лучше. Удивительно, но работа с памятью Core i7 в двойном канале оказалась быстрее работы тройного. Core i7 побеждает Core 2 Quad во всех режимах – преимущество переноса контроллера памяти в процессор очевидно.
Чтение и копирование в памяти.
Данные тесты очередной раз подтверждают преимущество работы с памятью Core i7.
Заключение
Процессоры Core i7 выводят на новый уровень производительности. Разница в цене между Core 2 Quad Q9550 и Core i7 920 не способна компенсироваться разгоном первого. На равных частотах Core i7-920 не оставляет шансов Q9550.
Удивительный результат был получен в тесте задержки памяти в двойном канале. Возможно, это связано с отсутствием оптимизации теста под тройной канал. В любом случае, скорость работы связки «процессор-память» оказывается быстрее, чем таковая на Q9550.
Не осталась в стороне и технология Turbo Boost. В нагрузке однопоточным приложением, частота процессора со стандартных 2.66GHz поднималась до 2.793 GHz – множитель автоматически увеличивался на 1. Аналогичная картина наблюдалась и в разгоне процессора.
Проведенные тесты демонстрируют эффективность работы всех нововведений. SMT (Hyper Threading) действительно оказывает минимальное влияние на однопоточные задачи, а при использовании многопоточных задач, эффективность SMT очевидна.
Хочется также отметить, что ради спортивного интереса, данный экземпляр Core i7-920 на боксовом кулере удалось разогнать до частоты 3.7 GHz (185х20) без повышения напряжения, но разогнать процессор еще выше оказалось не так просто. Рост тактовых частот ведет к пропорциональному росту температур, да и проводить тестирование на такой частоте не имело бы смысла. Впрочем, как и его использование.
В общем и целом, процессоры получились достаточно быстрыми, порою, существенно превосходящими по производительности предыдущее поколение.
Редактировал: Новик Владимир
Источник: http://www.benchmark.kz/