Легенда:
новое сообщение
закрытая нитка
новое сообщение
в закрытой нитке
старое сообщение
|
- Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
- Новичкам также крайне полезно ознакомиться с данным документом.
Не понимаю, зачем нужны маленькие stub'ы, ну да ладно. Я не... 18.07.08 15:56 Число просмотров: 3221
Автор: stream <Roman Trunov> Статус: Member
|
> спортивный интерес все же остается: какую бы скорость > показал, например, HD4870, запустив на нем хотя бы 160 > threads (возможно, нужно было бы и больше для скрытия > латентности обращений к look up табличке). Конечно, > пришлось бы делать для него специальные, маленькие stub-ы, > и то, как исполняет условные переходы тот же 4870 - мягко > говоря, не самый эффективный способ, но любопытно ведь. :)
Не понимаю, зачем нужны маленькие stub'ы, ну да ладно. Я не большой спец по gpu, только читал общие описания. В общем виде алгоритм ogr довольно прост, но в нем есть несколько условных переходов:
for (;;)
{
while (something1) work_inside_level();
if (something2) push_level();
else pop_level()
}
в основном крутится цикл внутри некого "уровня", что может неплохо распараллелиться, но из этого циклаочень_частовываливаются, чтобы перейти на "уровень выше" или "уровень ниже". Я не знаю, насколько хорошо отнесется GPU к таким фокусам.
И второй момент - надо готовиться к тому, что размер lookup-таблички будет около 2 мегабайт.
|
|
|