Подскажите про архитектуру видюх

yroslavasako

Я вот читаю википедию, там написаны характеристики в universal shader unit. Мне вот интересно, этот юнит, он обрабатывает только один флоат за раз или целый вектор из нескольких?

procenkotanya

Ты можешь посчитать это сам исходя из количества юнитов, частоты, и заявленных gflops. Обычно считается 2 флопа (fused multiply-add) на такт на юнит, т.е. юниты не векторные.

yroslavasako

охренеть. То есть можно забыть про ограничения на ветвления? Или там ещё проблемы будут с непредсказуемостью обращения к памяти и потому возможна просадка?

procenkotanya

В википедийных табличках указаны теоретические флопсы, конечно.

yroslavasako

это да. Но если каждый юнит полноценный процессор, то там получается даже можно цикл фор гонять. Теперь у меня о возможностях куды возникло совсем другое представление.

agaaaa

Но если каждый юнит полноценный процессор, то там получается даже можно цикл фор гонять. Теперь у меня о возможностях куды возникло совсем другое представление.
Не понял с чего ты это взял. Кто тебе сказал, что в каждом юните есть блок контроля управления?

yroslavasako

а кому они тогда нужны будут?
http://developer.amd.com/wordpress/media/2012/10/R700-Family...

serge18

У нвидии в вики под количеством units написано именно количество fp32 вычислительных элементов на всём gpu, ни больше не меньше.
В любом случае, все зависит от того как ты пайплайн будешь нагружать. Набор инструкций не всегда полностью решает. Если будешь использовать все преимущества конвейера векторного или vliw процессора - good for you.
Оставить комментарий
Имя или ник:
Комментарий: