Легенда:
новое сообщение
закрытая нитка
новое сообщение
в закрытой нитке
старое сообщение
|
- Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
- Новичкам также крайне полезно ознакомиться с данным документом.
Я тут как раз закончил отладку ядра под AMD-шные карты,... 26.11.08 18:33 Число просмотров: 4718
Автор: Sla <Sla> Статус: Member
|
> Только-только начал пристраивать простаивающие nvidia > 8600-ы и 8800-ы в проект Folding (я смог осилить их > мануалы!!!) а тут и родной проект зашевилился.... Отрадно. > Тем более что найти человека-программиста, пусть и за > денежку, который может написать CUDA клиента оказалось > сложно. :( Я тут как раз закончил отладку ядра под AMD-шные карты, будет возможность протестировать на чем-нить HD2400+? Скорость пока - дело десятое, важно проверить корректность. Дело вот в чем: все тесты проходит (RV670)::
[Nov 25 18:17:18 UTC] RC5-72: 32/32 Tests Passed (0.312500 seconds)
, однако -bench выдает совершенно несусветную скорость, которой в принципе быть не может - надо разбираться. Тесты пробовал и с большим (в 16 раз) количеством итераций, один фиг. Реальная же скорость пока около 1/2,5 от теоретической - потери идут на передаче результатов, неоптимальный количество потоков и т.д.- это дело решаемо.
Stream, ты не знаешь, есть ли какие дополнительные (длительные) тесты для ядер? Просто пока думаю на выходных сделать дрянь, которая проходила бы блок на CPU, подом на GPU и сравнивала бы места и количество CMC, но вдруг что-то уже есть лучше?
P.S. было бы любопытно поглядеть скорости на CUDA + какая загрузка CPU получается
|
|
|