информационная безопасность
без паники и всерьез
 подробно о проектеRambler's Top100
За кого нас держат?Spanning Tree Protocol: недокументированное применениеВсе любят мед
BugTraq.Ru
Русский BugTraq
 Анализ криптографических сетевых... 
 Модель надежности двухузлового... 
 Специальные марковские модели надежности... 
 Бэкдор в xz/liblzma, предназначенный... 
 Три миллиона электронных замков... 
 Doom на газонокосилках 
главная обзор RSN блог библиотека закон бред форум dnet о проекте
bugtraq.ru / форум / dnet
Имя Пароль
ФОРУМ
все доски
FAQ
IRC
новые сообщения
site updates
guestbook
beginners
sysadmin
programming
operating systems
theory
web building
software
hardware
networking
law
hacking
gadgets
job
dnet
humor
miscellaneous
scrap
регистрация





Легенда:
  новое сообщение
  закрытая нитка
  новое сообщение
  в закрытой нитке
  старое сообщение
  • Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
  • Новичкам также крайне полезно ознакомиться с данным документом.
Я тут как раз закончил отладку ядра под AMD-шные карты,... 26.11.08 18:33  Число просмотров: 4950
Автор: Sla <Sla> Статус: Member
<"чистая" ссылка>
> Только-только начал пристраивать простаивающие nvidia
> 8600-ы и 8800-ы в проект Folding (я смог осилить их
> мануалы!!!) а тут и родной проект зашевилился.... Отрадно.
> Тем более что найти человека-программиста, пусть и за
> денежку, который может написать CUDA клиента оказалось
> сложно. :(
Я тут как раз закончил отладку ядра под AMD-шные карты, будет возможность протестировать на чем-нить HD2400+? Скорость пока - дело десятое, важно проверить корректность. Дело вот в чем: все тесты проходит (RV670)::
[Nov 25 18:17:18 UTC] RC5-72: 32/32 Tests Passed (0.312500 seconds)
, однако -bench выдает совершенно несусветную скорость, которой в принципе быть не может - надо разбираться. Тесты пробовал и с большим (в 16 раз) количеством итераций, один фиг. Реальная же скорость пока около 1/2,5 от теоретической - потери идут на передаче результатов, неоптимальный количество потоков и т.д.- это дело решаемо.

Stream, ты не знаешь, есть ли какие дополнительные (длительные) тесты для ядер? Просто пока думаю на выходных сделать дрянь, которая проходила бы блок на CPU, подом на GPU и сравнивала бы места и количество CMC, но вдруг что-то уже есть лучше?

P.S. было бы любопытно поглядеть скорости на CUDA + какая загрузка CPU получается
<dnet> Поиск 






Rambler's Top100
Рейтинг@Mail.ru


  Copyright © 2001-2024 Dmitry Leonov   Page build time: 1 s   Design: Vadim Derkach