Двоядерний процесор intel pentium 2 4 ГРЦ

Олексій Шобанов

Продовжуючи низку весняних прем'єр, компанія Intel представила чергову модель у лінійці процесорів для високопродуктивних систем для дому та офісу – процесор Intel Pentium 4 з тактовою частотою 2,4 ГГц. Перехід на 0,13-мікронний технологічний процес значно розширив «частотні горизонти», що відкриваються перед флагманом процесорного ринку. компанії Intel, і тепер нам здаються цілком звичайними щоквартальні презентації нових, дедалі швидших процесорів. Як і його попередники - Pentium 4 2 ГГц та 2,2 ГГц, також побудовані на основі ядра Northwood за 0,13-мікронною технологією, новий процесормає кеш другого рівня розміром 512 Кбайт, що вдвічі перевищує розмір L2-кешу у молодших моделей цієї лінійки, створених на основі ядра Willamette (0,18 мікронний техпроцес). Pentium 4 2,4 ГГц виконаний у формфакторі mPGA-478 з використанням корпусу FC-PGA2 (Flip-Chip Pin Grid Array), який на сьогоднішній день має найдосконалішу схему теплового розсіювання. Говорячи про тепловий режим процесора Pentium 4 на новому ядрі Northwood, не можна не відзначити той факт, що перехід на нову 0,13-мікронну технологію дозволив не тільки збільшити кількість транзисторів до 55 млн. на кристалі, при цьому зменшивши його розміри, а й знизити напруга живлення ядра до 1,5 В, тим самим скоротивши тепловиділення. Так, у перших процесорів на цьому ядрі, які працюють на тактовій частоті 2 ГГц та 2,2 ГГц, воно становить відповідно 52 Вт та 55 Вт, а у нового Intel Pentium 4 2,4 ГГц вбирається у 58 Вт. Для температурного контролю в процесорі використовується так звана технологія Thermal Monitor, суть якої зводиться до використання термодатчика і блоку TCC (thermal control circuit), що управляє подачею тактових імпульсів на процесор. При цьому передбачено два режими функціонування: автоматичний (Automatic mode) та на вимогу (On-Demand mode). Автоматичний режимможе бути активізований через BIOS системноїплати. У цьому режимі при підвищенні температури процесора до певного значення блок TCC активізується і генерує імпульси, що блокують подачу тактових імпульсів, що фактично викликає зниження тактової частоти процесора на 30-50% (відповідно до заводських установок), збільшуючи час його простою, що, своєю чергою, дозволяє знизити температуру. Робота блоку TCC в режимі "на вимогу" визначається вмістом регістра температурного контролю (ACPI Thermal Monitor Control Register). Відповідно до його стану блок TCC може бути активізований незалежно від температури процесора, при цьому тривалість холостого ходу процесора можна варіювати гнучкіше в діапазоні між 12,5% і 87,5%. І, звичайно, реалізована можливість відключення комп'ютера при катастрофічному нагріванні кристала процесора до 135 °С; у цьому випадку на системну шину видається сигнал THERMTRIP#, що ініціює відключення живлення. Як і всі його попередники, новий процесор побудований відповідно до мікроархітектури Intel NetBurst, яка має на увазі наступні нововведення:

  • 400-мегагерцева системна шина;
  • Hyper-Pipelined Technology;
  • Advanced Dynamic Execution;
  • Execution Trace Cache;
  • Rapid Execution Engine;
  • Advanced Transfer Cache;
  • Streaming SIMD Extensions 2 (SSE2).

У кількох словах опишемо ці особливості архітектури процесорів Intel Pentium 4. 400-мегагерцева шина (як її ще називають – Quad Pumped Bus) дозволяє за рахунок особливої ​​організації на фізичному рівні передавати 4 пакети даних за один такт системною шиною з частотою FSB 100 МГц. Таким чином, ця 64-бітна шина має пікову пропускну здатність 3,2 Гбайт/с, забезпечуючи високошвидкісний обмін даними процесора з іншими пристроями. Незабаром очікується реалізація 533-мегагерцевой Quad Pumped-шини, що відповідає роботі системної шині на фізичній частоті FSB 133 МГц, при цьому, як нескладно припустити, швидкість обміну даними по ній перевищить величину 4 Гбайт/с, що здавалася раніше недосяжною. Hyper-Pipelined Technology має на увазі використання безпрецедентно довгого 20-ступінчастого гіперконвеєра (нагадаємо, що процесори сімейства Р6 мали вдвічі менший конвеєр). Такий підхід дозволяє значно збільшити тактову частоту процесора, хоч і призводить до такого негативного наслідку, як збільшення часу перезавантаження конвеєра у разі помилки передбачення переходу. Для того щоб зменшити ймовірність виникнення подібної ситуації, в процесорах Pentium 4 застосована технологія Advanced Dynamic Execution, яка передбачає збільшення пулу команд до 126 (Pentium III пул команд містив 42 команди) і збільшення до 4 Кбайт буфера розгалужень, що зберігає адреси вже виконаних переходів. Це, разом із удосконаленим алгоритмом передбачення, дозволяє підвищити можливість прогнозування переходів на 33% проти процесорами сімейства Р6 і довести його до 90-95%. У процесорах Pentium 4 реалізовано дещо нетрадиційний підхід до організації кешу першого рівня L1. Хоча L1, як і в більшості сучасних процесорів, складається з двох частин: кешу даних (8 Кбайт) та кешу інструкцій, особливість останнього полягає в тому, що тепер він зберігає до 12 тис. вже декодованих мікрооперацій, причому розміщених у порядку їх виконання, визначеному з урахуванням передбачень переходів розгалужень. Кеш інструкцій процесора Intel Pentium 4 з такою організацією отримав назву Execution Trace Cache. Rapid Execution Engine – це два блоки арифметичної логіки (ALU), які працюють на подвоєній частоті процесора. У випадку описуваного нами процесора, тактова частота якого дорівнює 2,4 ГГц, це означає, що блоки ALU працюють на частоті 4,8 ГГц, а враховуючи, що функціонують вони в паралельному режимі, неважко підрахувати, що процесор може виконувати чотири цілі операції такт (трохи більше 0,4 мкс). Кеш другого рівня L2 процесорів сімейства Pentium 4 отримав назву Advanced Transfer Cache. Що має 256-бітну шину, що працює на частоті ядра, і вдосконалену схему передачі даних, цей кеш забезпечує високу пропускну здатність, настільки важливу для потокових процесів обробки. Як зазначалося вище, спочатку процесори на ядрі Willamette мали кеш L2 розміром 256 Мбайт, перехід на 0,13-мікронну технологію дозволив збільшити кеш другого рівня до 512 Мбайт. Таке збільшення кешу L2 благотворно позначилося на продуктивності процесора, дозволяючи знизити можливість промаху при зверненні. У процесорах Pentium 4 реалізовано підтримку збільшеного набору інструкцій потокових SIMD-розширень (Streaming SIMD Extensions), що отримав назву SSE 2. У цьому наборі до вже існуючих 70 SIMD-інструкцій було додано ще 144 нові інструкції. Ці інструкції дозволяють виконувати 128-розрядні операції як з цілими числами, так і з числами з плаваючою точкою, даючи значний приріст продуктивності на цілій низці завдань, що використовують потокову обробку даних. Тут існує тільки одне «але» - код завдання, що виконується, повинен бути відповідним чином оптимізований і відкомпільований.

При всіх вищеперелічених удосконаленнях в основу процесорів модельної лінійки Pentium 4 покладена та ж 32-бітова архітектура Intel (IA-32), і новий процесор не є винятком. Як наслідок, Pentium 4 2,4 ГГц оптимізовано на роботу з 32-бітним програмним забезпеченнямі показує традиційно стабільну та високопродуктивну роботу з такими операційними системами, як Windows 98, Windows Me, Windows 2000, Windows XP та ОС сімейства UNIX. У нас була можливість протестувати роботу нового процесора від компанії Intel, використовуючи таку конфігурацію тестового стенду:

Для тестування нами використовувалась операційна система Microsoft Windows XP. Результати тестування наведено у таблиці.

Можливо, хтось запитає: скільки ж можна збільшувати продуктивність процесора і взагалі наскільки необхідні для сучасного персонального комп'ютеранастільки потужні центральні процесори? На це хочеться відповісти, що робота центральному процесору завжди знайдеться. Його обчислювальні потужності можна використовувати, переклавши на нього роботу логіки інших підсистем комп'ютера, тим самим знизивши вартість останніх. Деякі експерти порушують питання про те, що при подальшому зростанні швидкодії центрального процесораможна було б перекласти на нього та обчислювальне навантаження процесора графічної карти(що вже робилося у минулому, але з зовсім іншими мотиваціями).

Насамкінець хотілося б відзначити, що новий процесор від Intel - Pentium 4 2,4 ГГц демонструє стабільну роботу і відмінну продуктивність на додатках, що працюють зі звуком, відео, 3D-графікою, на офісних додатках та іграх, а також при виконанні складних обчислювальних завдань . Одним словом, на базі цього процесора можуть бути створені високопродуктивні станції для дому та офісу, здатні задовольняти найвибагливіші запити користувачів та вирішувати завдання, що висувають максимально високі вимоги до обчислювальних потужностей вашого персонального комп'ютера.

Комп'ютерПрес 5"2002

"топових" на той момент настільних процесорів, що перейшли 2-гігагерцовий рубіж. До сьогоднішнього дня в лінійках у обох компаній з'явилося за новою моделлю, а значить, є привід провести чергове порівняння або виправити недоліки старого. Дослідження нових моделей завжди цікаве, якщо ті різняться архітектурно, але сьогодні не є випадком. Старі ядра, наступний ступінь коефіцієнтів множення – ось і «нові процесори». Заслуговує на увагу «зворотний» факт: Athlon XP 2100+ це остання модель на ядрі Palomino, що навіть не значилася раніше в плані випуску і прикриває місце до виходу нового ядра Thoroughbred.

У процесорів Intel теж будуть зміни. Незабаром відбудеться перехід на шину 533 МГц, так що наявний у нас екземпляр теж до певної міри «прощальний».

Що ж, постараємося отримати максимальну користь із цього тестування. По-перше, можна порівняти нову модельз попередньою, та за різницею показників у тестах оцінювати масштабованість. По-друге, можна ввести в дію свіжі версії використовуваних тестів і додати нові добрі, такі статті зазвичай для проміжного порівняння не використовують. Нарешті, по-третє, завжди залишаються актуальними абсолютно марні і безпрограшні спроби виявити абсолютного лідера за швидкістю.

Для вирішення першого завдання додамо в пару до Intel Pentium 4 2,4 ГГц 2,2-гігагерцову модель, а до AMD Athlon XP 2100+ Athlon XP 2000+, і протестуємо кожну пару на одному і тому ж своєму чіпсеті. Спираючись на досвід вже згаданого великого порівняння, для вирішення третього завдання виберемо для процесора Intel три найцікавіші платформи, а для процесора AMD обмежимося однією найшвидшою практично скрізь VIA KT333 + DDR333. Що ж до оновлення тестового набору, завітайте до розділу з результатами.

Умови тестування

Тестовий стенд:

  • Процесори:
    • Intel Pentium 4 2,2 ГГц, Socket 478
    • Intel Pentium 4 2,4 ГГц, Socket 478
    • AMD Athlon XP 2000+ (1667 МГц), Socket 462
    • AMD Athlon XP 2100+ (1733 МГц), Socket 462
  • Материнські плати:
    • EPoX 4BDA2+ (BIOS від 05/02/2002) на базі i845D
    • ASUS P4T-E (версія BIOS 1005E) на базі i850
    • Abit SD7-533 (версія BIOS 7R) на базі SiS 645
    • Soltek 75DRV5 (версія BIOS T1.1) на базі VIA KT333
  • 256 МБ PC2700 DDR SDRAM DIMM Samsung, CL 2 (використовувалася як DDR266 на i845D)
  • 2x256 МБ PC800 RDRAM RIMM Samsung
  • ASUS 8200 T5 Deluxe GeForce3 Ti500
  • IBM IC35L040AVER07-0, 7200 об/хв, 40 ГБ
  • CD-ROM ASUS 50x

Програмне забезпечення:

  • Windows 2000 Professional SP2
  • DirectX 8.1
  • Intel chipset software installation utility 3.20.1008
  • Intel Application Accelerator 2.0
  • SiS AGP Driver 1.09
  • VIA 4-in-1 driver 4.38
  • NVIDIA Detonator v22.50 (VSync = Off)
  • CPU RightMark RC0.99
  • RazorLame 1.1.4 + Lame codec 3.89
  • RazorLame 1.1.4 + Lame codec 3.91
  • VirtualDub 1.4.7 + DivX codec 4.12
  • VirtualDub 1.4.7 + DivX codec 5.0 Pro
  • WinAce 2.11
  • WinZip 8.1
  • eTestingLabs Business Winstone 2001
  • eTestingLabs Content Creation Winstone 2002
  • BAPCo & MadOnion SYSmark 2001 Office Productivity
  • BAPCo & MadOnion SYSmark 2001 Internet Content Creation
  • BAPCo & MadOnion SYSmark 2002 Office Productivity
  • BAPCo & MadOnion SYSmark 2002 Internet Content Creation
  • 3DStudio MAX 4.26
  • SPECviewperf 6.1.2
  • MadOnion 3DMark 2001 SE
  • idSoftware Quake III Arena v1.30
  • Gray Matter Studios & Nerve Software Return to Castle Wolfenstein v1.1
  • Expendable Demo
  • DroneZmarK
ПлатаEPoX 4BDA2+ASUS P4T-EAbit SD7-533Soltek 75DRV5
Чіпсетi845D (RG82845 + FW82801BA)i850 (KC82850 + FW82801BA)SiS 645 (SiS 645 + SiS 961)VIA KT333 (KT333 + VT8233A)
Підтримка процесорівSocket 478, Intel Pentium 4Socket 462, AMD Duron, AMD Athlon, AMD Athlon XP
Пам'ять2 DDR4 RDRAM3 DDR3 DDR
Слоти розширенняAGP/6 PCI/CNRAGP/5 PCI/CNRAGP/ 5 PCIAGP/5 PCI/CNR
Порти введення/виведення1 FDD, 2 COM, 1 LPT, 2 PS/2
USB2 USB 1.1 + 1 роз'єм на 2 USB 1.12 USB 1.1 + 2 роз'єми по 2 USB 1.12 USB 1.1 + 1 роз'єм на 2 USB 1.1
Інтегрований IDE-контролерATA100ATA100ATA100ATA133
Зовнішній IDE-контролерHighPoint HPT372- - -
ЗвукAC"97 codec, Avance Logic ALC201APCI Audio, C-Media CMI8738/PCI-6ch-MXAC"97 codec, VIA VT1611A
Вбудований мережевий контролер- - - -
I/O-контролерWinbond W83627HF-AWWinbond W83627GF-AWWinbond W83697HFITE IT8705F
BIOS2 Мбіт Award Medallion BIOS v.6.002 Мбіт Award Modular BIOS v.6.00PG2 Мбіт Award Modular BIOS v. 6.00PG
Форм-фактор, розміриATX, 30,5x24,5 смATX, 30,5x24,5 смATX, 30,5x23 смATX, 30,5x22,5 см

Результати тестів

Ми вже неодноразово намагалися сформулювати критерії оптимального процесорного тесту. Звичайно, ідеал недосяжний, але сьогодні ми робимо свій перший крок у його напрямку - запускаємо проект CPU RightMark(). За подробицями та новинами проекту надсилаємо вас на його сайт, тут же наведемо короткі роз'яснення, які мають допомогти вам зрозуміти суть тестового експерименту та його інструментарій.

Отже, CPU RightMark - це тест процесора і підсистеми пам'яті, що здійснює чисельне моделювання фізичних процесів і вирішення завдань з області тривимірної графіки. Говорячи дуже коротко, один блок програми чисельно вирішує систему диференціальних рівнянь, що відповідає моделюванню в реальному часі поведінки системи багатьох тіл, інший блок візуалізує знайдені рішення також в режимі реального часу. Кожен блок реалізований у кількох варіантах, оптимізованих під різні системи процесорних команд. Важливо, що тест не є суто синтетичним, а написаний з використанням прийомів та засобів програмування, типових для завдань своєї області (тривимірних графічних додатків).

Блок розв'язання системи диференціальних рівнянь написаний з використанням набору команд співпроцесора x87, а також має варіант, оптимізований для набору SSE2 (з векторизацією циклу: дві ітерації циклу замінюються на одну, але всі операції проводяться з двоелементними векторами). Швидкість роботи цього блоку свідчить про продуктивність зв'язки процесор+пам'ять під час виконання математичних розрахунків з використанням дійсних чисел подвійної точності (характерно для сучасних наукових завдань: геометричних, статистичних, задач моделювання).

Результати цього підтесту показують, що швидкість роботи з інструкціями x87 FPU у Athlon XP вища, проте за рахунок підтримки набору SSE2 (природно, відсутня у Athlon XP) Pentium 4 виявляється набагато швидше. Підкреслимо, що в даному блоці не використовуються SSE-команди, тому результати прогону тесту в режимах із SSE опущені (вони просто збігаються з відповідними MMX/FPU і MMX/SSE2). Відзначимо майже ідеальну масштабованість тесту за частотою CPU тут вплив пам'яті майже зведено до нуля за рахунок ефективного кешування і характеру роботи блоку з інтенсивними обчисленнями при порівняно малому обсязі обміну даними.

Блок візуалізації у свою чергу складається з двох частин: блоку попередньої обробки сцени та блоку трасування променів та відмальовування. Перший написаний С++ і відкомпільований з використанням набору команд співпроцесора x87. Другий написаний на асемблері і має кілька варіантів, оптимізованих під різні набори інструкцій: FPU+GeneralMMX, FPU+EnhancedMMX та SSE+EnhancedMMX (подібний поділ на блоки є типовим для реалізацій задач візуалізації в реальному часі). Сумарна швидкість роботи блоку візуалізації свідчить про продуктивність зв'язування процесор+пам'ять при виконанні геометричних розрахунків з використанням дійсних чисел одинарної точності (типово для тривимірних) графічних програм, оптимізованих під SSE та Enhanced MMX).

Знову ж таки, швидкість роботи з інструкціями x87 FPU у Athlon XP виявляється значно вищою, проте використання при обчисленнях SSE знову виводить уперед Pentium 4, незважаючи на підтримку цього набору процесорами Athlon XP. При цьому за продуктивністю на мегагерц обидва процесори йдуть практично врівень, по сумарній Pentium 4 отримує відрив, відповідний його вищій частоті. Підкреслимо, що в даному блоці не використовуються SSE2-команди, тому результати прогону тесту в режимах із SSE2 опущені (вони просто збігаються з відповідними MMX/FPU і SSE/FPU). Відзначимо відмінну продуктивність зв'язки Pentium 4+ SiS 645, викликану, очевидно, найбільшою швидкістю доступу до пам'яті за малої латентності. Взагалі, процес рендерингу супроводжується досить активним пересиланням даних, що робить внесок чіпсету і типу пам'яті, що використовується в сумарну продуктивність системи значним.

Сумарна продуктивність системи розраховується за формулою: Overall = 1/(1/MathSolving + 1/Rendering), тому дуже значний виграш Pentium 4 при використанні SSE2 у блоці розрахунку фізичної моделімайже не дає приросту продуктивності без залучення SSE у блоці візуалізатора. Зате при виконанні обчислень за допомогою SSE добавка від включення SSE2 становить значну величину. (Відмітимо, що дана характеристикасправедлива для конкретних вибраних умов тестування, можливості ж налаштування тесту дозволяють задати практично будь-яке співвідношення часу прорахунку фізичної моделі та візуалізації (шляхом зміни екранного дозволу або точності розрахунків).) Оскільки Athlon XP не підтримує набір SSE2, його продуктивність досить очевидно залежить від швидкості малювання сцен, де він поступається Pentium 4 при використанні набору SSE, хоча і залишається абсолютним чемпіоном з чистої швидкості виконання операцій за допомогою тільки MMX і FPU. Зазначимо, що з протестованих чіпсетів під Pentium 4 i845D виглядає трохи краще за i850 (ймовірно, через більшу латентність у останнього), а чемпіоном є SiS 645 з вказаної вище причини.

Досить давно вже доступна нова версія популярного кодувальника Lame, але у нас все не було нагоди її застосувати. У рамках підготовки даної статті було проведено тестування і старої версії 3.89, яка використовувалася нами, і останньої офіційно доступної версії 3.91. Результати збіглися повністю (у межах похибки), що цілком узгоджується з відсутністю згадки про швидкісну оптимізацію коду у списку нововведень програми. (До речі, кодувальник вже більше півроку коректно підтримує роботу з усіма доступними розширеними мультимедійними наборами команд і регістрів.) Тест, як бачите, чудово масштабується за частотою процесора, так як і тут здійснюється ефективне попереднє кешування даних, але залишається низка питань щодо досить низької продуктивності Pentium 4 на i850 і SiS 645. Найрозумнішим нам видається припущення, що такий вплив на продуктивність має BIOS плат: продукт від Abit ми ще не бачили у справі, а ось плата від ASUS на i850 нам добре знайома, причому при використанні попередньої версіїпрошивки (ще раз відсилаємо вас до минулого) такого спаду не спостерігалося. Athlon XP у цьому тесті, як і раніше, лідер, причому для перемоги цілком вистачає і версії 2000+.

Нова версія 5.0 кодека DivX вийшла зовсім недавно, але враховуючи величезну популярність цього продукту, неважко передбачити його активне використання вже найближчим часом, без очікування на випуск нових релізів з виправленнями помилок. Що ж, ми прямуємо в руслі народних побажань і переходимо до застосування версії DivX 5.0 Pro. Ми також провели аналогічне тестування з версією DivX 4.12, і результати порівняння кодеків такі: операція кодування прискорюється дуже відчутно більше ніж на хвилину, причому незалежно від процесора, чіпсету і типу пам'яті. Також відзначимо, що DivX 5.0 Pro формує трохи більший вихідний відеофайл. До порівняння власне процесорів у цьому тесті нам додати нічого - все вже було сказано в минулій статті, а от на непогану масштабованість кодування варто звернути увагу.

В архівуванні WinAce, як і при кодуванні MPEG4, вплив підсистеми пам'яті (внаслідок великого обсягу даних, що пересилаються) приблизно в два рази приховує ефект від збільшення частоти процесора. Athlon XP у цьому тесті все ще краще свого візаві.

В архівуванні WinZip відзначимо хіба деяке відставання Pentium 4 на SiS 645 і повну рівність в інших випадках.

Результати Winstones виглядають на рідкість логічно і зрозуміло, але пам'ятаючи про часті незрозумілі провали і сплески в цих тестах у минулому, ми, мабуть, утримаємося від коментарів.

Нагадаю, що досі нам доводилося говорити рішуче "не віримо!" результатам Athlon XP у тесті SYSmark, оскільки через криворукість окремих програмістів версія WME 7.0, що входить до складу додатків групи Internet Content Creation цього тесту, не вміла визначати підтримку набору інструкцій SSE у Athlon XP. На щастя, ми нарешті розпочинаємо тестування в оновленій версії бенчмарку SYSmark 2002, в якій цю проблему вирішено.

Коротко про відмінності у складі додатків тестів:

SYSmark 2001SYSmark 2002
Office Productivity
Dragon NaturallySpeaking Preferred 5
McAfee VirusScan 5.13
Microsoft Access 2000Microsoft Access 2002
Microsoft Excel 2000Microsoft Excel 2002
Microsoft Outlook 2000Microsoft Outlook 2002
Microsoft PowerPoint 2000Microsoft PowerPoint 2002
Microsoft Word 2000Microsoft Word 2002
Netscape Communicator 6.0
WinZip 8.0
Internet Content Creation
Adobe Photoshop 6.0 Adobe Photoshop 6.0.1
Adobe Premiere 6.0
Macromedia Dreamweaver 4
Macromedia Flash 5
Microsoft Windows Media Encoder 7.0Microsoft Windows Media Encoder 7.1

Як бачите, жодних замін немає, тільки оновлення версій. Алгоритм підрахунку підсумкових балів офіційно відомих змін не зазнав, хоча ми припустили б перерахунок деяких коефіцієнтів пропорційності.

Цікаво порівняння результатів старого та нового пакетів в офісному підтесті: по-перше, був, ймовірно, запроваджений якийсь коригуючий коефіцієнт, що призвело до зменшення показників обох сторін. По-друге, очевидно, через перероблений пакет Microsoft Office, Pentium 4 почав вигравати в цьому підтесті, хоча в SYSmark 2001 обидві процесорні платформи йшли врівень.

У підтесті, що створює контент, ситуація ще цікавіша: за рахунок нормального розпізнавання SSE у Athlon XP в MS WME 7.1 процесор AMD додав, зате до складу підтесту нового пакета входить переписана для підтримки SSE2 версія Adobe Photoshop 6.0.1, тому Pentium 4 отримує навіть більший приріст.

У результаті, від сумнівного лідерства у SYSmark Pentium 4 переходить до очевидного лідерства. Зверніть також увагу на те, як здорово зростає продуктивність Pentium-систем у цьому тесті зі зростанням частоти процесора, і на майже відсутній аналогічний ефект для Athlon-системи.

Рендеринг в 3DStudio MAX відмінно масштабується і зазвичай не демонструє ознак залежності від швидкості роботи з пам'яттю, так що нам залишається тільки гадати, що таке навернули в останній прошивці BIOS для ASUS P4T-E інженери компанії. На діаграмі добре видно, що рендеринг на Athlon XP прискорюється пропорційно збільшенню частоти процесора, але за рахунок набагато вищої частоти Pentium 4 2,4 ГГц йде в цьому тесті у відрив, хоча швидкість ще 2,2-гігагерцової моделі була приблизно рівна Athlon XP 2000+.

У SPECviewperf, загалом, нічого цікавого: результати майже скрізь рівні, з легкою перевагою Pentium 4, і лише у DX-06 помітно попереду Athlon XP. Зверніть увагу на те, що швидкість тестів практично не залежить від швидкості процесорів.

При переході на новий процесор Intel ігровий бенчмарк робить невеликий ривок, але це не допомагає йому дотягнутися навіть до результатів Athlon XP 2000+.

Додавання до тестових ігор Return to Castle Wolfenstein, заснованої на двигуні Quake III, ситуацію, звичайно, не змінило. Більше того, відносні показники в цих двох іграх схожі практично один на один. Приплюсуємо сюди ж DroneZ, що відрізняється двигуном, але не характером результатів, і залишається тільки давня Expendable - негусто для Athlon XP ... Відзначимо, що всі ігри приблизно однаково непогано масштабуються за частотою процесора, що теж грає на руку Intel.

Висновки

Прощання ядру Palomino не надто вдалося: не можна сказати, що Athlon XP так сильно відстає від свого суперника, та й далеко не скрізь це відставання взагалі має місце, але тенденції в наявності. Чи з реальною частотою, чи з PR-рейтингом AMD відстає від Intel за чарівними цифрами в назві процесорів, а приріст продуктивності на збільшення частоти (який би «дутий» її не вважали у Pentium 4) у більшості наших тестів дає перевагу в абсолютних показниках саме лінійці Pentium 4. Багато програм «дізналися», нарешті, про підтримку SSE в Athlon XP, що дало деякий сплеск, але це глухий кут, а ось оптимізація під SSE2 ще далеко не завершена, і чим далі - тим більше програм буде переходити з « табору AMD» у «табір Intel».

Втім, піст свій Palomino залишає все ж таки в пристойному стані. Відставання останньої моделі від наявних конкурентів аж ніяк не катастрофічне, ціна приваблива, а ми більше ім інтересом спостерігатиме за спробами AMD повернути лідерство з новим ядром.

Tray Processor

Tray Processor

Intel ships цих процесорів до Original Equipment Manufacturers (OEMs), і OEMs типово pre-install the processor. Intel refers до цих процесорів, як tray or OEM processors. Intel має прямий доступ до підтримки підтримки.

Tray Processor

Intel ships цих процесорів до Original Equipment Manufacturers (OEMs), і OEMs типово pre-install the processor. Intel refers до цих процесорів, як tray or OEM processors. Intel має прямий доступ до підтримки підтримки.

Boxed Processor

Intel Authorized Distributors sell Intel процесори в clearly marked boxes from Intel. We refer to these processors as boxed processors. Вони Typically carry a три-year warranty.

Boxed Processor

Intel Authorized Distributors sell Intel процесори в clearly marked boxes from Intel. We refer to these processors as boxed processors. Вони Typically carry a три-year warranty.

Tray Processor

Intel ships цих процесорів до Original Equipment Manufacturers (OEMs), і OEMs типово pre-install the processor. Intel refers до цих процесорів, як tray or OEM processors. Intel має прямий доступ до підтримки підтримки.

Boxed Processor

Intel Authorized Distributors sell Intel процесори в clearly marked boxes from Intel. We refer to these processors as boxed processors. Вони Typically carry a три-year warranty.

Tray Processor

Intel ships цих процесорів до Original Equipment Manufacturers (OEMs), і OEMs типово pre-install the processor. Intel refers до цих процесорів, як tray or OEM processors. Intel має прямий доступ до підтримки підтримки.

Tray Processor

Intel ships цих процесорів до Original Equipment Manufacturers (OEMs), і OEMs типово pre-install the processor. Intel refers до цих процесорів, як tray or OEM processors. Intel має прямий доступ до підтримки підтримки.

Boxed Processor

Intel Authorized Distributors sell Intel процесори в clearly marked boxes from Intel. We refer to these processors as boxed processors. Вони Typically carry a три-year warranty.

Tray Processor

Intel ships цих процесорів до Original Equipment Manufacturers (OEMs), і OEMs типово pre-install the processor. Intel refers до цих процесорів, як tray or OEM processors. Intel має прямий доступ до підтримки підтримки.

Tray Processor

Intel ships цих процесорів до Original Equipment Manufacturers (OEMs), і OEMs типово pre-install the processor. Intel refers до цих процесорів, як tray or OEM processors. Intel має прямий доступ до підтримки підтримки.

Tray Processor

Intel ships цих процесорів до Original Equipment Manufacturers (OEMs), і OEMs типово pre-install the processor. Intel refers до цих процесорів, як tray or OEM processors. Intel має прямий доступ до підтримки підтримки.

Boxed Processor

Intel Authorized Distributors sell Intel процесори в clearly marked boxes from Intel. We refer to these processors as boxed processors. Вони Typically carry a три-year warranty.

Boxed Processor

Intel Authorized Distributors sell Intel процесори в clearly marked boxes from Intel. We refer to these processors as boxed processors. Вони Typically carry a три-year warranty.

Boxed Processor

Intel Authorized Distributors sell Intel процесори в clearly marked boxes from Intel. We refer to these processors as boxed processors. Вони Typically carry a три-year warranty.

Tray Processor

Intel ships цих процесорів до Original Equipment Manufacturers (OEMs), і OEMs типово pre-install the processor. Intel refers до цих процесорів, як tray or OEM processors. Intel має прямий доступ до підтримки підтримки.

Процесор Pentium 4 2.40GHz

Кількість ядер – 1.

Базова частота ядер Pentium 4 2.40GHz – 2.4 ГГц.

Ціна у Росії

Хочете купити Pentium 4 2.40GHz дешево? Перегляньте список магазинів, які вже продають процесор у вас у місті.

Сімейство

Показати

Тест Intel Pentium 4 2.40GHz

Дані отримані із тестів користувачів, які тестували свої системи як у розгоні, так і без. Таким чином, ви бачите усереднені значення, що відповідають процесору.

Швидкість числових операцій

Для різних завдань потрібні різні сильні сторони CPU. Система з малою кількістю швидких ядер відмінно підійде для ігор, але поступиться системі з великою кількістю повільних ядер у сценарії рендерингу.

Ми вважаємо, що для бюджетного ігрового комп'ютерапідходить процесор із мінімум 4 ядрами/4 потоками. При цьому окремі ігри можуть завантажувати його на 100% і гальмувати, а виконання будь-яких завдань у фоні призведе до просідання ФПС.

В ідеалі покупець повинен прагнути мінімум 6/6 або 6/12, але враховувати, що системи з більш ніж 16 потоками зараз застосовні тільки в професійних завданнях.

Дані отримані із тестів користувачів, які тестували свої системи як у розгоні (максимальне значення в таблиці), так і без (мінімальне). Типовий результат вказаний посередині, у кольоровій смузі вказано позицію серед усіх протестованих систем.

Комплектуючі

Ми зібрали список комплектуючих, які найчастіше вибирають користувачі, збираючи комп'ютер на базі Pentium 4 2.40GHz. Також з цими комплектуючими досягаються найкращі результати у тестах та стабільна робота.

Найпопулярніший конфіг: материнська плата для Intel Pentium 4 2.40GHz – Asus P8Z68-V, відеокарта – GeForce GT 525M.

Порівняння показників IPC

Для тих, хто не знає: IPC (Instructions Per Cycle, кількість інструкцій за такт, що виконуються) – це хороший показник того, наскільки швидко працює процесор, і одночасне поєднання високих значень IPC і тактової частоти забезпечує максимальну продуктивність. Саме це ми спостерігаємо у процесорів Intel Coffee Lake 8 покоління, і хоча AMD явно відстає, коли мова йдепро частоти, ця компанія реально наближається до показників Intel у частині IPC. Можливо, з цієї причини багато хто з вас цікавиться цим аспектом тестування CPU.

Щоб зрозуміти, наскільки далеко AMD просунулась у цьому напрямі, ми вирішили мінімізувати кількість параметрів тестування та водночас максимально наблизити ситуацію до реальних умов роботи. Перший і найбільш очевидний крок тут – привести частоти ядер до єдиного постійного значення, що ми зробили, зафіксувавши всі ядра CPU на частоті 4 ГГц. Всі опції технології Boost були відключені, і таким чином частоти ядер не могли піти за межі 4 ГГц.

Процесори 2 покоління Ryzen тестувалися на материнської плати Asrock X470 Taichi Ultimate, а процесори Coffee Lake- На платі Asrock Z370 Taichi. В обох конфігураціях у всіх тестах використовувалася та сама пам'ять G.Skill FlareX DDR4-3200 з профілем пам'яті "Xtreme" і одна і та ж відеокарта MSI GTX 1080 Ti Gaming X Trio.

Ми одразу можемо сказати, що ця стаття не містить рекомендацій для потенційних покупців – ми проводили тестування з суто дослідницькою метою.

Процесори Coffee Lake спочатку мають явну перевагу у тактовій частоті.

У даний оглядми включили результати тестування процесорів Intel Core i7-8700K, Core i5-8600K та AMD Ryzen 7 2700X, Ryzen 5 2600X та Ryzen 7 1800X, Ryzen 5 1600X.

Отже, тепер процесори 1600X, 2600X та 8700K мають однаковий ресурс: 6 ядер та 12 потоків.

Процесори 1800X і 2700X мають перевагу – 8 ядер та 16 потоків, тоді як 8600K з 6 ядрами та 6 потоками, навпаки, перебуває у невигідному становищі.

Все це слід мати на увазі, коли ми підемо далі. Приступимо до результатів.

Бенчмарки

Почнемо з тесту на безперервну пропускну спроможність пам'яті. Тут бачимо, що процесори 1 і 2 поколінь Ryzen мають практично однакову пропускну здатність – близько 39 ГБ/с. Тим часом процесори Coffee Lake, працюючи з тією ж пам'яттю, обмежуються значенням пропускну здатністьблизько 33 ГБ/с, що у 15% менше проти процесорами Ryzen.

Переходимо до тесту Cinebench R15. Тут бачимо, що процесор 2600X показує вищі результати проти 1600X – на 4% більше багатопоточному режимі і 3% більше однопоточному. А якщо ми подивимося на 8700K, то побачимо, що він на 4% швидше за 2600X в однопотоковому режимі і на 4% повільніше у багатопотоковому.

Як ви могли очікувати, при однаковій тактовій частоті Ryzen процесори з 8 ядрами і 16 потоками в багатопотоковому режимі легко обходять 8700K. Я привів тут ці результати просто тому, що вони мали. За відповідного запиту я міг би провести цей тест, наприклад, з Core i7-7820X.

Наступний пункт – редагування відео в PCMark 10, і цей тест дає чіткіші результати, хоча й до цього ми спостерігали помітну різницю між процесорами 1600X та 1800X. А тут ми бачимо впевнений 10% прогрес при переході від 1600X до 2600X, і це ставить AMD на один рівень з Intel в частині продуктивності IPC (принаймні, в цьому тесті).

Як показують результати Cinebench R15, технологія AMD SMT (Simultaneous Multi-Threading), що використовується по максимуму, виглядає більш ефективною, ніж технологія Intel HT (Hyper-Threading). Тут процесор 1600X був швидше 8700K на 3,5%, а 2600X - на 8%, і для даного прикладу це істотна різниця.

Продуктивність / Продуктивність у додатках

Для наступного тесту ми взяли Excel, і тут процесор 8700K був приблизно на 3% швидше, ніж 1600X - на тій же тактовій частоті. Однак 2600X здатний змагатися з 8700K: він показав такий самий час завершення при виконанні тестового завдання – 2,85 с – вражаючий результат.

У тесті HandBrake результати процесорів AMD Ryzen були не такими блискучими: тут ми бачимо, що 2600X може змагатися тільки з 8600K, а в порівнянні з 8700K виявляється на 15% повільніше.

Переходимо до бенчмарку Corona. Тут ми бачимо, що процесор 2600X може зменшити час рендерингу на 8% порівняно з 1600X, і при цьому виявляється лише на 3% повільніше, ніж 8700K. Таким чином, у цьому тесті Intel поки що утримує перевагу в IPC, але вона мінімальна.

Наступний тест - Blender, і тут 2600X був лише на 2,5% швидше, ніж 1600X, і на 4% повільніше, ніж 8700K. Не надто велика різниця, і знову Intel утримує перевагу в IPC - у цьому тесті воно менше 5%.

У бенчмарку V-Ray бачимо, що процесор 2600X перевершив результат 1600X на 4% і був лише один відсоток повільніше, ніж 8700K, тобто. по суті виявився з ним на одному рівні.

Ігрові бенчмарки

Настав час розглянути ряд ігрових результатів, і процесори AMD відвалюються. Як я вже не раз говорив раніше, кільцева шина Intel Ring Bus з низькою затримкою просто краще підходить для ігор, і ми це бачимо навіть при порівнянні цього рішення Intelз їхньою власною архітектурою на базі Mesh Interconnect, розробленою для процесорів з великою кількістю ядер. Внутрішня шина AMD Infinity Fabric має ряд проблем, і ці проблеми залишаться до тих пір, поки ігрові процесори не вимагатимуть більшої кількості ядер.

Таким чином, хоча процесор 2600X і перевищує 1600X на 8% у грі Ashes of the Singularity, він водночас помітно програє 8700K – на цілих 11% повільніше. Та обставина, що процесори Intel працюють із значно вищою тактовою частотою, разом збільшить цю різницю до 20% або навіть більше.

У грі Assassin's Creed: Originsми бачимо невелику 2% перевагу процесора 2600X над 1600X, в той час як процесор 8700K на цілих 14% швидше.

Ця різниця трохи зменшилася при встановленні високих графічних налаштувань, але все одно, коли ми порівнюємо середні значення частоти кадрів, 8700K виявляється на 12% швидше процесора 2600X.

У Battlefield 1з налаштуваннями ультра ми бачимо, що процесор 2600X на 9% швидше процесора 1600X, але все-таки на 7% повільніше, ніж процесор 8700K.

Ця різниця стає ще більшою при середніх налаштуваннях, оскільки зменшується вплив відеокарти GTX 1080 Ti. Тут процесор 2600X знову демонструє 9% зростання продуктивності щодо 1600X, але тепер він на 10% повільніший за 8700K, що навіть при цих налаштуваннях виглядає як обмеження продуктивності GPU.

Схожу картину ми спостерігаємо у грі Far Cry , Де процесор 2600X на 10% швидше 1600X - це дуже великий прогрес, але навіть тут він виявляється на 8% повільніше, ніж 8700K.

Порівняння енергоспоживання

Цей тест на енергоспоживання проводився не в найреалістичніших умовах, оскільки при встановленні єдиної тактової частоти 4 ГГц багато енергозберігаючих опцій було відключено. З наукової точки зору це також не зовсім чистий експеримент, тому що мені довелося підвищити напругу на процесорах Ryzen понад номінальне значення – для стабілізації всіх ядер на підвищеній частоті 4 ГГц.

Взявши до уваги все вищесказане, бачимо, що з процесорами 1600X і 2600X споживають точно однакову кількість енергії, тоді як система з 8700K споживає на 3% менше, тобто. за зазначених умов цей процесор трохи ефективніший.

У тестуванні з Far CryСпоживана потужність скрізь була майже однаковою – всі процесори доводять загальне енергоспоживання системи приблизно до 380 Вт.

У тесті Blender ми бачимо зниження енергоспоживання на 10% під час переходу від процесора 1600X до 2600X. Для процесора 2600X це вражаюче досягнення, але при цьому він все одно споживає на 21% більше потужностініж процесор 8700K.

На цей раз у тесті HandBrake система з процесором 2600X продемонструвала на 7% більше енергоспоживання, ніж система з 1600X, і на жахливі 32% більше, ніж система з 8700K.

Висновок

Незважаючи на досить великий дефіцит тактової частоти (у порівнянні з аналогами від Intel), процесори 2 покоління Ryzen в тестових додатках не так часто залишаються далеко позаду своїх конкурентів, і тепер ми можемо зрозуміти, чому - порівнявши їх на одній і тій же тактовій частоті 4 ГГц. Наприклад, у додатку Cinebench R15 ми бачимо, що в одноядерному режимі їхня продуктивність нижча всього на 3%, зате в багатоядерному режимі технологія SMT допомагає процесорам AMD працювати до 4% швидше в порівнянні з Intel.

У нашому дослідженні процесори AMD були на 3% повільнішими за Intel у тесті Corona, але в таких бенчмарках, як V-Ray, Excel і редагування відео показали майже однаковий з ними результат. У HandBrake вони були на 15% повільнішими, натомість у PCMark 10 (тест на зображення в іграх фізичних явищ) – на 8% швидше. Звичайно, це питання геймінгу, і я готовий посперечатися - деякі шанувальники AMD сподівалися, що ми спишемо дефіцит ігрової продуктивності головним чином на тактову частоту. На жаль, це негаразд.

Основна проблема тут - у способі з'єднання між собою ядер процесорів AMD або, вірніше, модулів CCX. Шина Intel Ring Bus відрізняється дуже низькою затримкою та при розподілі ресурсів завжди вибирає найкоротші шляхи. Однак, як тільки ми додаємо додаткові ядра, кільцева шина збільшується у розмірах – для з'єднання всіх ядер потрібно більше кілець – і її ефективність знижується. Таким чином, процесори Intel з великим числом ядер (наприклад, 28) потребують оптимального способу з'єднання ядер між собою. І в цих випадках чудово працює архітектура з Mesh Interconnect.

Однак ми вже знаємо, що для 6-, 8- та 10-ядерних процесорів це не найкраще рішення, і саме тому процесори Core i7-7800X, 7820X та 7900X в іграх помітно поступаються 8700K. Процесор 8700K має середній час затримки між ядрами близько 40 нс, а 7800X цей час становить від 70 до 80 нс.

Процесори Ryzen влаштовані трохи складніше: усередині модуля CCX затримка між ядрами близька до того, що ми бачимо у процесора 8700K, і залежить від швидкості роботи пам'яті DDR4. Однак, коли ми виходимо за межі CCX, затримка між ядрами зростає до 110 нс, і це вже пов'язане з пам'яттю DDR4-3200. З більш швидкою пам'яттю затримка між ядрами модулів CCX знижується, оскільки шина AMD Infinity Fabric прив'язана до тактової частоти пам'яті, і DRAM з низькою затримкою також дуже допомагає.

Ще одна проблема полягає в самих іграх, оскільки майже всі популярні ігри розроблені з розрахунку на CPU всього лише з кількома ядрами, і ми тільки починаємо спостерігати деякі кроки, які робляться в напрямку розбиття завдань на частини для паралельної обробки їх ядрами CPU. До появи процесорів Ryzen ігри розроблялися та оптимізувалися майже виключно під процесори Intel. Зараз ситуація поступово змінюється, оскільки покращуються ігрові характеристикипроцесорів Ryzen, але навряд чи ми найближчим часом побачимо їх на одному рівні з процесорами Intel із шиною Ring Bus.

Однак у частині продуктивності IPC AMD виразно скоротила розрив. Кеш зі зменшеною затримкою також реально допомагає, і, таким чином, покупка процесора 2 покоління Ryzen несе в собі деякі переваги перед покупкою Coffee Lake. Цікаво буде спостерігати за битвою між цими процесорами, яка розгорнеться у 2018 р. і далі.




Top