Процессор AMD-FX8320 - сколько ядер для вычислений с плавающей точкой?

5065584

Вот такой вопрос. Производитель пишет, что ядер восемь. Сколько ядер определяет операционная система? Сколько из них умеют оперировать с плавающей точкой? Просто я слышал, что у AMD есть линейка процессоров, построенных по принципу "на два целочисленных вычислителя только один для операций с плавающей точкой".

ramsit

У меня два года стоит 8350, все 8 ядер одинаково используются на любых задачах. Отличный проц + электрогрелка в комплекте :)
8320 это тот же 8350, который на конвейере не прошел проверку качества, поэтому он чуть дешевле, но я бы все равно брал бы 8350, а не 8320.

hoha32

8350 это Piledriver, у которого на самом деле не 8 труЪ-ядер, но 4 модуля, где у каждого модуля только один блок FPU. Опасения топикстартера не беспочвенны.

BondarAndrey

К сожалению, на текущий момент AMD сильно отстала в сегменте HPC. Берите 12-ядерные Xeon-ы.

ramsit

8350 это Piledriver, у которого на самом деле не 8 труЪ-ядер, но 4 модуля, где у каждого модуля только один блок FPU. Опасения топикстартера не беспочвенны.
хз, я не замечал какой-либо просадки в fp-вычислениях на 8 потоках, производительность получается примерно кратна количеству потоков.
К сожалению, на текущий момент AMD сильно отстала в сегменте HPC. Берите 12-ядерные Xeon-ы.
12-ядерный ксеон обойдется в 3-4 килобакса, 8350 - 200 баксов. По стоимости флопса АМД все еще лидер, как ни крути

otvertka07

у тебя верный title
вот первый линк из гугла
http://techreport.com/review/23750/amd-fx-8350-processor-rev...

ramsit

у тебя верный title
вот первый линк из гугла
http://techreport.com/review/23750/amd-fx-8350-processor-rev...
Ты что конкретно хочешь доказать?
Судя по тому, что ТС спрашивал про 8320, лишние 20 баксов делают большую погоду, а ты кидаешь линк на сравнение с топовыми процами

Filan

Ты что конкретно хочешь доказать?
http://techreport.com/r.x/amd-fx-8350/aida-mandel.gif
Ещё цитатку забыл:
The FX-8350 takes the top spot in the CPU Hash test, not surprising given the relatively strong performance of the AMD processors in this integer-focused benchmark. The more FPU-intensive fractal tests are a very different story, with the Sandy and Ivy Bridge-based chips topping the charts. Although Vishera's four FPUs should, in theory, be capable of the same number of peak FLOPS per clock as any Sandy or Ivy quad-core, the FX-8350's throughput here is substantially lower, even with the advantage of a higher clock speed. With the aid of the FMA instruction and a 4GHz base clock, at least the FX-8350's four FPUs are able to outperform the six older FPUs on the Phenom II X6 1100T, a feat the FX-8150 can't duplicate.

 
хз, я не замечал какой-либо просадки в fp-вычислениях на 8 потоках, производительность получается примерно кратна количеству потоков.

Доказательство технического утверждения своими ощущениями... ты гуманитарий что ли?

ramsit

http://techreport.com/r.x/amd-fx-8350/aida-mandel.gif
http://techreport.com/r.x/amd-fx-8350/aida-hash.gif :)
Да, и если ты берешься сравнивать с i-5 и i-7, не забывай, что они вдвое дороже
    хз, я не замечал какой-либо просадки в fp-вычислениях на 8 потоках, производительность получается примерно кратна количеству потоков.
Доказательство технического утверждения своими ощущениями... ты гуманитарий что ли?
Ну блин, я щас тебе рожу сравнительные тесты, прогнанные на разных количествах потоков? Когда-то мерял на самых разных задачах, разница в пределах погрешности, на четырех, шести или семи (на восьмом будет б`ольшая погрешность из-за системных процессов)
TC адекватный человек, просто примет к сведению мой экспириенс.

Filan

http://techreport.com/r.x/amd-fx-8350/aida-hash.gif :)

Этот тест выполняется ALU, а не FPU.

Troyn09

медленноват

Filan

Да, и если ты берешься сравнивать с i-5 и i-7, не забывай, что они вдвое дороже
Это ты взял самый дешёвый FX-83xx и самый дорогой i5, чтобы получилось в 2 раза? Да ещё и i5 с i7 в один ценовой сегмент умудрился запихнуть.

ramsit

Этот тест выполняется ALU, а не FPU.
Ну и ладно. Изначальный вопрос-то был - сколько ядер могут реально работать с плавающей точкой, а не сравнение с топовыми процами от интела.
Это ты взял самый дешёвый FX-83xx и самый дорогой i5, чтобы получилось в 2 раза? Да ещё и i5 с i7 в один ценовой сегмент умудрился запихнуть.
Это порядок, говорящий о том, что для ТС интелпроцы неприемлемы по цене. Точные цифры ты и сам прекрасно знаешь.

Filan

Изначальный вопрос-то был - сколько ядер могут реально работать с плавающей точкой
4, только ты начал с этим спорить.
а не сравнение с топовыми процами от интела.

Это сравнение одно из доказательств количества модулей FPU.
С логикой не дружим?
 
Это порядок, говорящий о том, что для ТС интелпроцы неприемлемы по цене.

Как раз порядок цен у них один и тот же: разница "на порядок" - это в 10 раз, но никак не в 1.5-2.
И заметь топикстартер спросил про количество FPU, а не "стоит ли брать этот проц" - ему на этот вопрос и ответили. Обсуждать целесообразность ты начал, переведя тему с количества FPU.

uncle17

разница "на порядок" - это в 10 раз, но никак не в 1.5-2
Знаю программиста с приличным жопытом, который считает как раз наоборот

Troyn09

пичаль чё

margadon

не для всех проходит бесследно знакомство с двоичной системой счисления

ramsit

Это сравнение одно из доказательств количества модулей FPU.
нет, это доказательство, что данный проц слабее i5 и i7. Вот если бы они прогнали один и тот же fp-тест на одном и на восьми потоках, и выяснили, что на восьми потоках быстрее не в восемь раз, чем на одном, а, скажем, только в 4, то это бы говорило о том, что реальных fpu-блоков там только четыре.
Вот я прогнал тест на деление чисел с плавающей точкой, на одном ядре и на семи, на одном получилось 10 секунд, на семи - 12.5 секунд в пересчете на одно ядро. Разница все-таки есть. Хотя я оставил одно ядро под системную фигню, похоже что-то тут все равно есть, но если бы работало строго четыре ядра, цифра была бы ближе к 18 секундам.
Как раз порядок цен у них один и тот же: разница "на порядок" - это в 10 раз, но никак не в 1.5-2.
Давай без буквоедства, порядок может быть и нецелым, в конце концов. 0.3 порядка - как раз вдвое больше :)

uncle17

Давай без буквоедства
Простите, не удержалсо

otvertka07

можешь считать, что твой проц AMD специально сделала с 8 FPU, а всем остальным - с 4 :grin:

Filan

нет, это доказательство, что данный проц слабее i5 и i7. Вот если бы они прогнали один и тот же fp-тест на одном и на восьми потоках, и выяснили, что на восьми потоках быстрее не в восемь раз, чем на одном, а, скажем, только в 4, то это бы говорило о том, что реальных fpu-блоков там только четыре.
Т.е. ты полагаешь, что FPU на FX-83xx в 1.5 раза медленнее (а не в 1.3 раза быстрее), чем на Phenom II? Тогда тем более брать FX-83xx глупо. :-D
Вот я прогнал тест на деление чисел с плавающей точкой, на одном ядре и на семи, на одном получилось 10 секунд, на семи - 12.5 секунд в пересчете на одно ядро. Разница все-таки есть. Хотя я оставил одно ядро под системную фигню, похоже что-то тут все равно есть, но если бы работало строго четыре ядра, цифра была бы ближе к 18 секундам.
Самописный что ли? Покажешь? А мы посмеёмся сколько там последовательных операций ALU приходится на одну операцию FPU.

vall

> хз, я не замечал какой-либо просадки в fp-вычислениях на 8 потоках, производительность получается примерно кратна количеству потоков.
Доказательство технического утверждения своими ощущениями... ты гуманитарий что ли?
От задачи зависит. Во много чего ещё можно упереться и не заметить что fpu шарится между ядрами. //КО

Viktory-s

можешь считать, что твой проц AMD специально сделала с 8 FPU, а всем остальным - с 4
Генератор звёздного поля:
1) 1 поток
sky -AUREOLE_RADIUS 0 -PSF_MAPSIZE 512 -STARCOUNT_ZP 1e7 -MAG_LIMITS 22.0,26.0 -NTHREADS 1
ll done (in 18.6 s: 1478.1 sources/s )
2) 8 потоков
sky -AUREOLE_RADIUS 0 -PSF_MAPSIZE 512 -STARCOUNT_ZP 1e7 -MAG_LIMITS 22.0,26.0 -NTHREADS 8
All done (in 4.1 s: 6701.7 sources/s)
 6701.7/1478.1 = 4.53

Kira


Знаю программиста с приличным жопытом, который считает как раз наоборот

двоичная система, всё такое

otvertka07

что-то пропал куда-то
может, ищет новые контрагрументы :grin:

uncle17

старыми придавило

Viktory-s

что-то пропал куда-то
может, ищет новые контрагрументы
Нет ну он про масштабируемость.
Там она есть, но только наклон кривой не 45 градусов и не от нуля.
Вот пример того же кода с 2-мя потоками:
sky -AUREOLE_RADIUS 0 -PSF_MAPSIZE 512 -STARCOUNT_ZP 1e7 -MAG_LIMITS 22.0,26.0 -NTHREADS 4
All done ( 2834.6 sources/s)
4-мя потоками:
sky -AUREOLE_RADIUS 0 -PSF_MAPSIZE 512 -STARCOUNT_ZP 1e7 -MAG_LIMITS 22.0,26.0 -NTHREADS 4
All done ( 4216.9 sources/s)
6 потоками:
sky -AUREOLE_RADIUS 0 -PSF_MAPSIZE 512 -STARCOUNT_ZP 1e7 -MAG_LIMITS 22.0,26.0 -NTHREADS 6
All done ( 6334.3 sources/s)

Filan

Начнём с того, что у тебя показания расходятся:
Вот пример того же кода с 2-мя потоками:
sky -AUREOLE_RADIUS 0 -PSF_MAPSIZE 512 -STARCOUNT_ZP 1e7 -MAG_LIMITS 22.0,26.0 -NTHREADS 4
All done ( 2834.6 sources/s)
4-мя потоками:
sky -AUREOLE_RADIUS 0 -PSF_MAPSIZE 512 -STARCOUNT_ZP 1e7 -MAG_LIMITS 22.0,26.0 -NTHREADS 4
All done ( 4216.9 sources/s)
6 потоками:
sky -AUREOLE_RADIUS 0 -PSF_MAPSIZE 512 -STARCOUNT_ZP 1e7 -MAG_LIMITS 22.0,26.0 -NTHREADS 6
All done ( 6334.3 sources/s)
Оставить комментарий
Имя или ник:
Комментарий: