P4 1.8A vs Celeron 1.2
А что такое? Я думаю пень целку бьёт? Разве не так?
нет не так
Чтой-то не верица
Может владельцы субжей померятся попугаями?
уже померились
Чем мерили и кол-во попугаев
Результаты в этих тестах совпадают с точностью до +/- 10%
Тестировалась прогой TestCPU, которая сейчас на мне расшарена, только в расшареной версии не сохранены результаты P4
Чем скомилировано?
Мой проц не смогла даже толком определить (напр, рамер кэшей показала 0)
В общем, голяк
Более адекватным тестом было бы просто написать С-программу из одного цикла
Даже сандра при всей ее галимости более правдоподобна
Да и вообще скорее хочется теоретической информации, о том как субжи осужествляют указанные мной вещи, а не споров о корректности сравнений.
надо что-нить посвежее
а то, что спросил Анонимус, имеет достаточное значение
Ну покури доку от Интела, другого источника все равно нет в природе, кроме слухов.
ну на счет самому прогу написать, опять встает вопрос с компилятором, может есть тесты с именем, ну навроде 3DMark для графики? (раз уж в это русло разговор зашел, то можно и тесты погонять, а не об архитектуре говорить - чего я изначально хотел)
SPECfpu
и результаты можно найти для разных процов
общественное значение и имеет, но раз уж я спрашивал, то МНЕ интересно было сравнение архитектур, думал может кто это рюхает и мне расскажет
лориен не работает
а интересну уже сейчас, и ждать когда инет появится терпения не хватило
Их пишут все кому не лень
А здесь скорее всего всем лень
надо посмотреть, чем иксбитовские обзоры делаются
им я пожалуй поверю
Это конечно самая клевая маза, но во первых у меня их нет, а во вторых есть подозрения, что там не так и просто разобраться
хотелось инфы нахалявку без особых интеллектуальных затрат
У 1.2 Celeron-а ядро tualatin - по большому счёту это Copermine с тех процессом 0.13мк, а в P4 ядро сделано с нуля (так говорит сам Intel). P4 (Nort/Wil) с конвеером длины 20, а P3 (Tual/Cop) - с ~8-12 (память подводит). Т.е. разбор комманды происходит дольше, но алгоритм угадывания переходов улучшен + ядро изначально расчитывалось на выхокие частоты работы. Я всегда считал что P4-1800A (A - это вроде с ядром Wil/0.13мк и L2 512?) ~= P3-1400. И ещё - в P4 делается большой акцент на обработку потоковых данных (SSE2). Есть у меня на работе Celeron-900 (1260)-Copermine (L2 128) и Celeron-1800 (1908)-Nort (L2 128) - по ощущенияям 1908-ый быстрее (хотя на нём DDR333, а на 1260-ом SDRAM133). Завтра специально проведу тест на сандре и выложу в тред. И если 1906 Celeron выиграет у 1260-ого - то и P4-1800A выиграет подавно.
А где ты видел P3-1400
В прайсах + в заявлении Intel о прекращении их производства.
Что-то в этом духе я и хотел услышать! Получается, что без улучшенного алгоритма угадывания переходов, на одинаковых частотах P4 считает в два раза медленнее P3!
И когда тест выдал, что практически P4 1.8 считает как Celeron 1.2 мне и подумалось, что реально P4 в полтора раза медленнее. (на рассматриваемых задачах)
Разбор команды может и дольше происходит, зато их и больше одновременно исполняется на длинном конвейере
Мне даже проверять неинтересно, потому что я тоже знаю ответ:
1.2 отсосет у 1.8,
А все твои факториалы это производительность FPU, а он у p4 не хуже чем у цела.
Вообще можно так скомпилять тест чтобы все время обманывать блок предсказаний p4, тогда он постоянно будет весь свой длиннющий кальный конвеер сбрасывать и отсосет не то что у cela а у p2.
Celeron 1260 Copermine L2 128:
Тест арифметики: ALU/FPU - 3411/1698
Тест мультимедиа: IntSSE/FloatSSE - 6330/8231
Celeron 1906 Willemate (кажется так пишется) L2 128:
Тест арифметики: ALU/FPU/SSE2 - 5248/1076/2492
Тест мультимедиа: IntSSE2/FloatSSE2 - 7612/9598
Вывод: FPU P4 сосёт у FPU P3! Но при использовании в P4 вместо FPU SSE2 - P4 выигрывает, как и во всех остальных тестах.
P.S. Твои математические расчёты использовали именно FPU.
Я знаю, что это набор инструкций, но как узнать, используется он прогой или нет?
Может какие компиляторы специальные есть, использующие SSE2?
Но на машинах, где проц это не поддерживает, она работать не будет
Есть маза всегда прописывать поддержку SSE2, хуже от этого точно не будет, только (в случае P4) лучше. Я правильно понял?
В связи с этим возникают вопросы:
1. Насколько часто и насколько давно производители ПО поддерживают SSE2? (наверное все сразу и после появления P4?)
2. Как самому в свою прогу на Си включить поддержку SSE2?
ICC пытается и иногда даже удачно.
Ты компилятору указываешь, какие расширения команд (кроме х86) твой код должен поддерживать.
Далее точно не уверен:
то ли он делает столько версий .ехе, сколько нужно для такой поддержки,
то ли использует в самом коде команды ветвления, которые выбирают нужные ветки кода...
Интресно посравнивать ФПУ П4, целов и.т.п против Атлонов.
Celeron 1200 256-L2 FSB-100: ALU 3378, FPU 1617
А как на тест влияет, количество уже запущенного?
Тут еще про SPECint и SPECfpu говорили - вот бы их найти!
Да, и у кого инет есть: чего там на ихбт используют?
Оставить комментарий
Windows111G
Вопрос: каково соотношение проиизводительности у субжевых процов на чисто процессорных тестах (там факториал посчитать, n-тое простое число, операции над целыми числами, над числами с плавающей точкой...)Ответ я вообще-то знаю, но в объяснении этого явления я не очень уверен, может кто знает точное объяснение?