P4 1.8A vs Celeron 1.2

Windows111G

Вопрос: каково соотношение проиизводительности у субжевых процов на чисто процессорных тестах (там факториал посчитать, n-тое простое число, операции над целыми числами, над числами с плавающей точкой...)
Ответ я вообще-то знаю, но в объяснении этого явления я не очень уверен, может кто знает точное объяснение?

stm8783811

А что такое? Я думаю пень целку бьёт? Разве не так?

Windows111G

нет не так

ol4a21

Да ну
Чтой-то не верица
Может владельцы субжей померятся попугаями?

Windows111G

уже померились

ol4a21

Результаты в студию
Чем мерили и кол-во попугаев

Windows111G

Повторюсь сравниваем не комплесным тестом, а там факторилы всякие, n-тое простое число и т.д.
Результаты в этих тестах совпадают с точностью до +/- 10%
Тестировалась прогой TestCPU, которая сейчас на мне расшарена, только в расшареной версии не сохранены результаты P4

zsn66

Исходники?
Чем скомилировано?

ol4a21

Программа - древняя, 2000 г. выпуска
Мой проц не смогла даже толком определить (напр, рамер кэшей показала 0)
В общем, голяк
Более адекватным тестом было бы просто написать С-программу из одного цикла
Даже сандра при всей ее галимости более правдоподобна

Windows111G

это может замечание и в тему, но я его парирую: как мне кажется результат не удивителен, и не так уж и важно на чем он получен. ссылка на програмку тестер только для того что бы было понятно, что сравнивается.
Да и вообще скорее хочется теоретической информации, о том как субжи осужествляют указанные мной вещи, а не споров о корректности сравнений.

ol4a21

результат ИМХО не верен, именно потому что тестилка галимая
надо что-нить посвежее
а то, что спросил Анонимус, имеет достаточное значение

zsn66

Ну покури доку от Интела, другого источника все равно нет в природе, кроме слухов.

Windows111G

ну на счет самому прогу написать, опять встает вопрос с компилятором, может есть тесты с именем, ну навроде 3DMark для графики? (раз уж в это русло разговор зашел, то можно и тесты погонять, а не об архитектуре говорить - чего я изначально хотел)

zsn66

SPECint
SPECfpu
и результаты можно найти для разных процов

Windows111G

общественное значение и имеет, но раз уж я спрашивал, то МНЕ интересно было сравнение архитектур, думал может кто это рюхает и мне расскажет

Windows111G

где их можно найти?
лориен не работает

Windows111G

инета нет
а интересну уже сейчас, и ждать когда инет появится терпения не хватило

zsn66

Статейки есть на эту тему в инете
Их пишут все кому не лень
А здесь скорее всего всем лень

ol4a21

думаю тесты с именем есть
надо посмотреть, чем иксбитовские обзоры делаются
им я пожалуй поверю

Windows111G

>Ну покури доку от Интела, другого источника все равно нет в природе, кроме слухов

Это конечно самая клевая маза, но во первых у меня их нет, а во вторых есть подозрения, что там не так и просто разобраться
хотелось инфы нахалявку без особых интеллектуальных затрат

Filan

У 1.2 Celeron-а ядро tualatin - по большому счёту это Copermine с тех процессом 0.13мк, а в P4 ядро сделано с нуля (так говорит сам Intel). P4 (Nort/Wil) с конвеером длины 20, а P3 (Tual/Cop) - с ~8-12 (память подводит). Т.е. разбор комманды происходит дольше, но алгоритм угадывания переходов улучшен + ядро изначально расчитывалось на выхокие частоты работы. Я всегда считал что P4-1800A (A - это вроде с ядром Wil/0.13мк и L2 512?) ~= P3-1400. И ещё - в P4 делается большой акцент на обработку потоковых данных (SSE2). Есть у меня на работе Celeron-900 (1260)-Copermine (L2 128) и Celeron-1800 (1908)-Nort (L2 128) - по ощущенияям 1908-ый быстрее (хотя на нём DDR333, а на 1260-ом SDRAM133). Завтра специально проведу тест на сандре и выложу в тред. И если 1906 Celeron выиграет у 1260-ого - то и P4-1800A выиграет подавно.

ol4a21

А где ты видел P3-1400

Filan

В прайсах + в заявлении Intel о прекращении их производства.

Windows111G

>P4 (Nort/Wil) с конвеером длины 20, а P3 (Tual/Cop) - с ~8-12 (память подводит). Т.е. разбор комманды происходит дольше, но алгоритм угадывания переходов улучшен + ядро изначально расчитывалось на выхокие частоты работы
Что-то в этом духе я и хотел услышать! Получается, что без улучшенного алгоритма угадывания переходов, на одинаковых частотах P4 считает в два раза медленнее P3!
И когда тест выдал, что практически P4 1.8 считает как Celeron 1.2 мне и подумалось, что реально P4 в полтора раза медленнее. (на рассматриваемых задачах)

ol4a21

Разбор команды может и дольше происходит, зато их и больше одновременно исполняется на длинном конвейере

spirtus

p4 хоть и гавно, но не настолько.
Мне даже проверять неинтересно, потому что я тоже знаю ответ:
1.2 отсосет у 1.8,
А все твои факториалы это производительность FPU, а он у p4 не хуже чем у цела.
Вообще можно так скомпилять тест чтобы все время обманывать блок предсказаний p4, тогда он постоянно будет весь свой длиннющий кальный конвеер сбрасывать и отсосет не то что у cela а у p2.

Filan

Результат теста (Sandra Prof 2003):
Celeron 1260 Copermine L2 128:
Тест арифметики: ALU/FPU - 3411/1698
Тест мультимедиа: IntSSE/FloatSSE - 6330/8231
Celeron 1906 Willemate (кажется так пишется) L2 128:
Тест арифметики: ALU/FPU/SSE2 - 5248/1076/2492
Тест мультимедиа: IntSSE2/FloatSSE2 - 7612/9598
Вывод: FPU P4 сосёт у FPU P3! Но при использовании в P4 вместо FPU SSE2 - P4 выигрывает, как и во всех остальных тестах.
P.S. Твои математические расчёты использовали именно FPU.

Windows111G

А что такое SSE2?
Я знаю, что это набор инструкций, но как узнать, используется он прогой или нет?
Может какие компиляторы специальные есть, использующие SSE2?

durka82

Ты компилятору как раз и сообщаешь, чтобы он использовал этот набор команд процессора (или нет).
Но на машинах, где проц это не поддерживает, она работать не будет

Windows111G

Т.е. существует обратная совместимость:
Есть маза всегда прописывать поддержку SSE2, хуже от этого точно не будет, только (в случае P4) лучше. Я правильно понял?
В связи с этим возникают вопросы:
1. Насколько часто и насколько давно производители ПО поддерживают SSE2? (наверное все сразу и после появления P4?)
2. Как самому в свою прогу на Си включить поддержку SSE2?

bobking

> Может какие компиляторы специальные есть, использующие SSE2?
ICC пытается и иногда даже удачно.

durka82

Нет никакой обратной совместимости, кроме х86!
Ты компилятору указываешь, какие расширения команд (кроме х86) твой код должен поддерживать.
Далее точно не уверен:
то ли он делает столько версий .ехе, сколько нужно для такой поддержки,
то ли использует в самом коде команды ветвления, которые выбирают нужные ветки кода...

and-guzij

Интресно посравнивать ФПУ П4, целов и.т.п против Атлонов.

Windows111G

Сравни! (сандра на мне расшарена)
Celeron 1200 256-L2 FSB-100: ALU 3378, FPU 1617

and-guzij

А как на тест влияет, количество уже запущенного?

Windows111G

хз, да и вообще народ частенько на сандру ругается, у меня ничего кроме IE при тесте запущено не было.
Тут еще про SPECint и SPECfpu говорили - вот бы их найти!
Да, и у кого инет есть: чего там на ихбт используют?
Оставить комментарий
Имя или ник:
Комментарий: