Да все верно! Незачто. Что-то днетов-цы нехотят работать,...05.07.09 23:20 Число просмотров: 2503 Автор: hazkep Статус: Незарегистрированный пользователь
> P.S. Карта - подразогнанная 4850, дрова 9.4? Да все верно! Незачто. Что-то днетов-цы нехотят работать, бету для Windows выпускать. Жду уже не дождусь. Хотя, конечно, лучше бы чтобы OGR считались на видяхе, хоть какой-то смысл :)
Так никто и не хочет прогнать мой тест под вистой? :( Жаль.
Дело такое, что делаю поддержку нескольких GPU, а функции запуска программы GPU несколько странно работают под XP - начинают торчать в драйвере вместо ожидания в основной программе. Есть непроверенные сведения, что это баг в драйвере XP, а в висте все ОК.
> Vista SP1 x86, ATI 9.4. Может ему дрова свежие нужны? Это, блин, склероз :( Извиняюсь. Совсем забыл, что для отладки само ядро-то в отдельный файл выкинуто. Надо добавить туда файлик отсюда: http://rapidshare.de/files/47755591/r72.rar.html
9.4 должно пойти. Но хорошо бы и на 9.6 проверить...
Initializing enviroment...
Loading IL program
Found RV770 device at 710 MHz (10 SIMDs, wavefront size=64)
831 MB of cached, 831 MB uncached RAM available
Compiling...
Linking...
Program info:
Scratch regs needed: 0
Number of shared GPRs: 0
Slow mode: no
Number of wavefronts per SIMD: 0
Is max wavefronts per SIMD?: no
***Testing 100 iters (48x48)**** Run 0: 1.592451 ms
Run 1: 1.397873 ms
Thread 0: idle, 0.001816 ms
Run 0: 0.018927 ms
Thread 1: idle, 0.000908 ms
Run 1: 0.012502 ms
Thread 0: idle, 0.000908 ms
Run 0: 0.011314 ms
Thread 1: idle, 0.001187 ms
Run 1: 0.011175 ms
Thread 0: idle, 0.000838 ms
Thread 1: idle, 0.000629 ms
***Testing 200 iters (48x48)**** Run 0: 0.010825 ms
Run 1: 0.010895 ms
Thread 0: idle, 0.001187 ms
Run 0: 0.009917 ms
Thread 1: idle, 0.000908 ms
Run 1: 0.011105 ms
Thread 0: idle, 0.000908 ms
Run 0: 0.009848 ms
Thread 1: idle, 0.000908 ms
Run 1: 0.010476 ms
Thread 0: idle, 0.001327 ms
Thread 1: idle, 0.000629 ms
***Testing 400 iters (48x48)**** Run 0: 0.011454 ms
Run 1: 0.010686 ms
Thread 0: idle, 0.001257 ms
Run 0: 0.010337 ms
Thread 1: idle, 0.001537 ms
Run 1: 0.013619 ms
Thread 0: idle, 0.001257 ms
Run 0: 0.012432 ms
Thread 1: idle, 0.001257 ms
Run 1: 0.010546 ms
Thread 0: idle, 0.000908 ms
Thread 1: idle, 0.000629 ms
***Testing 800 iters (48x48)**** Run 0: 0.010895 ms
Run 1: 0.010546 ms
Thread 0: idle, 0.001117 ms
Run 0: 0.010057 ms
Thread 1: idle, 0.000908 ms
Run 1: 0.009778 ms
Thread 0: idle, 0.000838 ms
Run 0: 0.009778 ms
Thread 1: busy, 1.846883 ms
Run 1: 0.017181 ms
Thread 0: busy, 4.877715 ms
Thread 1: busy, 19.144682 ms
***Testing 1600 iters (48x48)**** Run 0: 0.013340 ms
Run 1: 0.011105 ms
Thread 0: busy, 8.412592 ms
Run 0: 0.010546 ms
Thread 1: busy, 23.741705 ms
Run 1: 0.010756 ms
Thread 0: busy, 23.920568 ms
Run 0: 0.012851 ms
Thread 1: busy, 24.036574 ms
Run 1: 0.012571 ms
Thread 0: busy, 23.163349 ms
Thread 1: busy, 38.253814 ms
***Testing 3200 iters (48x48)**** Run 0: 0.014527 ms
Run 1: 0.011803 ms
Thread 0: busy, 47.238336 ms
Run 0: 0.015854 ms
Thread 1: busy, 61.424147 ms
Run 1: 0.010686 ms
Thread 0: busy, 61.810859 ms
Run 0: 0.012921 ms
Thread 1: busy, 62.094065 ms
Run 1: 0.021441 ms
Thread 0: busy, 61.405290 ms
Thread 1: busy, 76.389108 ms
***Testing 6400 iters (48x48)**** Run 0: 0.031149 ms
Run 1: 0.013410 ms
Thread 0: busy, 124.075546 ms
Run 0: 0.029333 ms
Thread 1: busy, 137.315636 ms
Run 1: 0.021581 ms
Thread 0: busy, 137.557078 ms
Run 0: 0.017670 ms
Thread 1: busy, 137.450011 ms
Run 1: 0.016692 ms
Thread 0: busy, 138.222246 ms
Thread 1: busy, 151.569613 ms
***Testing 12800 iters (48x48)**** Run 0: 0.027657 ms
Run 1: 0.013689 ms
Thread 0: busy, 273.791082 ms
Run 0: 0.030660 ms
Thread 1: busy, 289.172437 ms
Run 1: 0.019835 ms
Thread 0: busy, 289.431827 ms
Run 0: 0.022279 ms
Thread 1: busy, 288.521027 ms
Run 1: 0.018019 ms
Thread 0: busy, 287.921998 ms
Thread 1: busy, 304.788737 ms
Огромное спасибо!!!05.07.09 17:09 Автор: Sla <Sla> Статус: Member Отредактировано 05.07.09 17:10 Количество правок: 1
Действительно, под вистой отрабатывает правильно. Под XP скорость в 2 потока равна примерно половине 2/3 от скорости одного, остальное время торчит где-то в драйвере. Ну и соответственно busy/idle тоже отрабатывается правильно (под XP сплошное idle с торчанием непонятно где).
P.S. Карта - подразогнанная 4850, дрова 9.4?
Да все верно! Незачто. Что-то днетов-цы нехотят работать,...05.07.09 23:20 Автор: hazkep Статус: Незарегистрированный пользователь
> P.S. Карта - подразогнанная 4850, дрова 9.4? Да все верно! Незачто. Что-то днетов-цы нехотят работать, бету для Windows выпускать. Жду уже не дождусь. Хотя, конечно, лучше бы чтобы OGR считались на видяхе, хоть какой-то смысл :)
[OGR] ждут06.07.09 09:44 Автор: aLEXt <Alex Trusty> Статус: Member Отредактировано 06.07.09 09:44 Количество правок: 1
> > P.S. Карта - подразогнанная 4850, дрова 9.4? > Да все верно! Незачто. Что-то днетов-цы нехотят работать, > бету для Windows выпускать. Жду уже не дождусь. Хотя, > конечно, лучше бы чтобы OGR считались на видяхе, хоть > какой-то смысл :)
Огры на видяхе не сильно быстрее получатся. А ждут они - от нвидии решения проблемы с приоритетами. А может и вовсе - OpenCL ждут, хз.
Почему от Nvidia? Нам нужна ATI :))06.07.09 12:45 Автор: hazkep Статус: Незарегистрированный пользователь
Нет. Я посмотрел туда и пока что бросил - переделывать придётся сильно иоченьаккуратно, у меня пока что нет такой возможности. По thisprob одновременно лазят головная нить/процесс (которая делает checkpoints, загружает новые блоки и выгружает посчитанные) и собственно cruncher (который, в частности, должен нормально отработать ситуацию, что посчитанный блок выгрузили, а новый ещё не загрузили). Сломать синхронизацию и посадить трудновоспроизводимый баг гораздо легче, чем кажется (что, собственно, и произошло недавно).
Пока что могу рекомендовать попробовать при нефатальной ошибке возвращать RESULT_WORKING, будто бы ничего не случилось, а при фатальной - RaiseExitRequestTrigger() и опять же RESULT_WORKING. В самом крайнем случае попробуй поправить Run_RC5_72(), обрабатывая все ошибки там.
Понятно, спасибо09.07.09 22:22 Автор: Sla <Sla> Статус: Member