Поздравлять-то пока почти не с чем: то, как дистрибутовцы исправили код, сделало виндового клиента неработоспособным. Ну ладно, может им виднее то, как можно с точностью до нескольких процентов измерить временной промежуток 10-20 мс обычным таймером, но зачем было проверку на 0-то убирать? В худшем случае худо-бедно ползал бы со скоростью 50М на 4870, а убрали - у него после деления получается, что успеет сделать 0 итераций и торжественно болтается в цикле, в надежде, что когда-то сможет прожевать блок нулевыми шагами. Мда. Я теперь даже в некоторой растеряности.
Я тут подправил таймерный код, + кое-какие переделки, выкинул 1 ядро. Если кто-то сможет протестировать у себя, посмотреть на скорость, загрузку CPU и лаги GUI, тому скажу спасибо :)
http://rapidshare.de/files/45884139/r72.rar.html
Протестируйте, еще, пожалуйста, этот микробенчик. Он поможет подобрать оптимальное количество потоков для каждой из моделей видеокарт.
У меня сейчас есть результаты RV630 и RV670, но неплохо бы провериться. RV770 и RV610 (ни 2400 ни 3200) нет :(
Программка создает лог, вот его, плз, киньте в личку. Просто многовато, наверное, для форума там будет.
тест здесь: rapidshare.de/files/45988965/microbench.rar.html
P.S. Чуть не забыл - во время теста, желательно, окошки не двигать (вообще GPU не грузить). :)
Бенч. Сокращенный вариант - иначе не получается выложить.11.03.09 14:24 Автор: hazkep Статус: Незарегистрированный пользователь
--** Started logging **-------------------------------------
v06.03
Benchmarking
Initializing enviroment...
Loading IL program
Found RV770 device at 710 MHz (10 SIMDs, wavefront size=64)
831 MB of cached, 831 MB uncached RAM available
Compiling...
Linking...
Allocating LOCAL buffers
Program info:
Scratch regs needed: 0
Number of shared GPRs: 0
Slow mode: no
Number of wavefronts per SIMD: 0
Is max wavefronts per SIMD?: no
Best size: 896x896 (486509 KKeys/sec)
Deallocating resources
Прикол, этот бенч каждый раз разные результаты выдает11.03.09 16:03 Автор: hazkep Статус: Незарегистрированный пользователь
> Я в одинаковых условиях 8 раз заупускал ни разу не совпало. Это не беда - важен порядок величины. например, для RV630 24x24 и 48x48 - очень близко, поэтому даже от шевелений мышью можно получить то одно быстрее, то другое. Главное, что становится понятнее как вычислить этот размер... Но мне надо оттуда не только последнюю строку. :( Важно еще на скольких итерациях он это получил. Кинь полную версию в приват, плз.
P.S. Дошло почему не получается в приват. Тогда хотя бы кусок небольшой, где есть именно тот домен, который оказался лучшим
Отправил 3 лога тебе в личку, обрати внимание на большой...15.03.09 12:48 Автор: hazkep Статус: Незарегистрированный пользователь
> Отправил 3 лога тебе в личку, обрати внимание на большой > разброс. Подряд запускал бенч, мышкой не шевелил. Да, нехило его колбасит. но вот эти 490М - близко к тому, что должно быть теоретически, а 430М - мало. Возможно, что-то тормозит, надо будет подумать.
На неделе обещают Catalyst 9.3 выпустить, надо будет с ним еще попробовать. Кстати, попробуй, плз, клиента отсюда http://bugtraq.ru/cgi-bin/forum.mcgi?type=sb&b=1&m=154501&id=22897&cp=dYS16PVg2nVPc -перекомпилил по Stream SDK 1.4 и поставил размер домена нечто среднее из этих тестов.
Miraj, спасибо! Что странно, для RV630 у меня лучшим был...11.03.09 12:49 Автор: Sla <Sla> Статус: Member
> Что-то пишет, как-то ругается? r72.log создает? Какая > версия дров? :) на том компе я пускал с самого начала твои бенчи, дрова остались те же! пишет что приложение не кореектно настроенно! повторная инсталяция может решить эту проблему!
[RC5] на том компе я пускал с самого начала твои бенчи, дрова...11.03.09 16:45 Автор: Sla <Sla> Статус: Member