Подскажите про архитектуру видюх
Ты можешь посчитать это сам исходя из количества юнитов, частоты, и заявленных gflops. Обычно считается 2 флопа (fused multiply-add) на такт на юнит, т.е. юниты не векторные.
охренеть. То есть можно забыть про ограничения на ветвления? Или там ещё проблемы будут с непредсказуемостью обращения к памяти и потому возможна просадка?
В википедийных табличках указаны теоретические флопсы, конечно.
это да. Но если каждый юнит полноценный процессор, то там получается даже можно цикл фор гонять. Теперь у меня о возможностях куды возникло совсем другое представление.
Но если каждый юнит полноценный процессор, то там получается даже можно цикл фор гонять. Теперь у меня о возможностях куды возникло совсем другое представление.Не понял с чего ты это взял. Кто тебе сказал, что в каждом юните есть блок контроля управления?
В любом случае, все зависит от того как ты пайплайн будешь нагружать. Набор инструкций не всегда полностью решает. Если будешь использовать все преимущества конвейера векторного или vliw процессора - good for you.
Оставить комментарий
yroslavasako
Я вот читаю википедию, там написаны характеристики в universal shader unit. Мне вот интересно, этот юнит, он обрабатывает только один флоат за раз или целый вектор из нескольких?