BugTraq.Ru: форум / dnet / [RC5] бенчик 3200 (500мг)

информационная безопасность
без паники и всерьез

подробно о проекте

Анализ криптографических сетевых...

Модель надежности двухузлового...

Специальные марковские модели надежности...

FreeBSD полностью избавляется от...

Рекордный июльский патч - первая...

Вредоносные плагины в маркетплейсе...

bugtraq.ru / форум / dnet

Имя

Пароль

если вы видите этот текст, отключите в настройках форума использование JavaScript


ФОРУМ


регистрация

Легенда:

новое сообщение

закрытая нитка

новое сообщение

в закрытой нитке

старое сообщение

Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
Новичкам также крайне полезно ознакомиться с данным документом.

[RC5] бенчик 3200 (500мг) 16.12.08 07:41 Число просмотров: 5318
Автор: maestro_sochi <maestro> Статус: Member

<"чистая" ссылка>

v12.12

Benchmarking

Initializing enviroment...

Loading IL program

Found RV610 device at 500 MHz (2 SIMDs, wavefront size=64)

28 MB of cached, 4 MB uncached RAM available

Compiling...

Linking...

Allocating LOCAL buffers

Program info:

Scratch regs needed: 0

Number of shared GPRs: 0

Number of shared GPRs total: 0

Slow mode: no

Number of wavefronts per SIMD: 0

Is max wavefronts per SIMD?: no

---Benchmarking core, peak size (no readback)---

Using optimal size (8x16)

Iters: 1024, time=125 ms, 8192 iters/sec, 4 Mkeys/sec

Iters: 2048, time=250 ms, 8192 iters/sec, 4 Mkeys/sec

Iters: 4096, time=515 ms, 7953 iters/sec, 4 Mkeys/sec

Using optimal size (16x8)

Iters: 1024, time=125 ms, 8192 iters/sec, 4 Mkeys/sec

Iters: 2048, time=250 ms, 8192 iters/sec, 4 Mkeys/sec

Iters: 4096, time=500 ms, 8192 iters/sec, 4 Mkeys/sec

Iters: 8192, time=1016 ms, 8062 iters/sec, 4 Mkeys/sec

---Trying grid (24x24)---

Iters: 256, time=109 ms, 2348 iters/sec, 5 Mkeys/sec

Iters: 512, time=219 ms, 2337 iters/sec, 5 Mkeys/sec

Iters: 1024, time=437 ms, 2343 iters/sec, 5 Mkeys/sec

Iters: 2048, time=875 ms, 2340 iters/sec, 5 Mkeys/sec

---Trying grid (32x32)---

Iters: 256, time=187 ms, 1368 iters/sec, 5 Mkeys/sec

Iters: 512, time=375 ms, 1365 iters/sec, 5 Mkeys/sec

Iters: 1024, time=766 ms, 1336 iters/sec, 5 Mkeys/sec

---Trying grid (40x40)---

Iters: 256, time=281 ms, 911 iters/sec, 5 Mkeys/sec

Iters: 512, time=563 ms, 909 iters/sec, 5 Mkeys/sec

---Trying grid (48x48)---

Iters: 256, time=421 ms, 608 iters/sec, 5 Mkeys/sec

Iters: 512, time=813 ms, 629 iters/sec, 5 Mkeys/sec

---Trying grid (56x56)---

Iters: 256, time=578 ms, 442 iters/sec, 5 Mkeys/sec

---Trying grid (64x64)---

Iters: 256, time=734 ms, 348 iters/sec, 5 Mkeys/sec

---Trying grid (72x72)---

Iters: 256, time=938 ms, 272 iters/sec, 5 Mkeys/sec

---Trying grid (80x80)---

Iters: 256, time=1156 ms, 221 iters/sec, 5 Mkeys/sec

****Calculating readback speed*****

Using optimal size (8x16)

Iters: 2048, time=1984 ms, 1032 iters/sec

Using optimal size (16x8)

Iters: 2048, time=1985 ms, 1031 iters/sec

---Trying grid (24x24)---

Iters: 1024, time=1016 ms, 1007 iters/sec

---Trying grid (32x32)---

Iters: 1024, time=1063 ms, 963 iters/sec

---Trying grid (40x40)---

Iters: 1024, time=1125 ms, 910 iters/sec

---Trying grid (48x48)---

Iters: 1024, time=1203 ms, 851 iters/sec

---Trying grid (56x56)---

Iters: 1024, time=1250 ms, 819 iters/sec

---Trying grid (64x64)---

Iters: 1024, time=1328 ms, 771 iters/sec

---Trying grid (72x72)---

Iters: 1024, time=1407 ms, 727 iters/sec

---Trying grid (80x80)---

Iters: 1024, time=1500 ms, 682 iters/sec

****Benchmarking full cycle (1b4******

Using optimal size (8x16)

Iters: 1024, time=125 ms, 8192 iters/sec, 4 Mkeys/sec

Iters: 2048, time=250 ms, 8192 iters/sec, 4 Mkeys/sec

Iters: 4096, time=515 ms, 7953 iters/sec, 4 Mkeys/sec

Using optimal size (16x8)

Iters: 1024, time=125 ms, 8192 iters/sec, 4 Mkeys/sec

Iters: 2048, time=250 ms, 8192 iters/sec, 4 Mkeys/sec

Iters: 4096, time=516 ms, 7937 iters/sec, 4 Mkeys/sec

---Trying grid (24x24)---

Iters: 256, time=109 ms, 2348 iters/sec, 5 Mkeys/sec

Iters: 512, time=219 ms, 2337 iters/sec, 5 Mkeys/sec

Iters: 1024, time=453 ms, 2260 iters/sec, 5 Mkeys/sec

Iters: 2048, time=875 ms, 2340 iters/sec, 5 Mkeys/sec

---Trying grid (32x32)---

Iters: 256, time=203 ms, 1261 iters/sec, 5 Mkeys/sec

Iters: 512, time=375 ms, 1365 iters/sec, 5 Mkeys/sec

Iters: 1024, time=766 ms, 1336 iters/sec, 5 Mkeys/sec

---Trying grid (40x40)---

Iters: 256, time=281 ms, 911 iters/sec, 5 Mkeys/sec

Iters: 512, time=578 ms, 885 iters/sec, 5 Mkeys/sec

---Trying grid (48x48)---

Iters: 256, time=406 ms, 630 iters/sec, 5 Mkeys/sec

Iters: 512, time=828 ms, 618 iters/sec, 5 Mkeys/sec

---Trying grid (56x56)---

Iters: 256, time=578 ms, 442 iters/sec, 5 Mkeys/sec

---Trying grid (64x64)---

Iters: 256, time=750 ms, 341 iters/sec, 5 Mkeys/sec

---Trying grid (72x72)---

Iters: 256, time=938 ms, 272 iters/sec, 5 Mkeys/sec

---Trying grid (80x80)---

Iters: 256, time=1156 ms, 221 iters/sec, 5 Mkeys/sec

Deallocating resources

<dnet>

[OGR] Появились 508 клиенты (беты) 26.11.08 11:50 [HandleX, Heller]
Автор: Ritual Статус: Незарегистрированный пользователь
Отредактировано 26.11.08 11:50 Количество правок: 1

<"чистая" ссылка>

2-9102-508 new: x86: OGR-NG mmx core

Пока только для экзотических платформ ;-)

[rc5] на бигзилле появилась ссылка на тестовую версию по вынь. 13.12.08 14:30
Автор: panam Статус: Незарегистрированный пользователь

<"чистая" ссылка>

[RC5] +1 бетта 16.12.08 20:50
Автор: Miraj <Михаил> Статус: Member

<"чистая" ссылка>

http://bugs.distributed.net/attachment.cgi?id=423&action=view
Вот тут прячется

[RC5] Бенч 8200 на новой версие:) 17.12.08 07:56
Автор: maestro_sochi <maestro> Статус: Member

<"чистая" ссылка>

dnetc v2.9102-508-GTR-08121316 for Win32 (WindowsNT 5.1).
Please provide theentireversion descriptor when submitting bug reports.
The distributed.net bug report pages are at http://bugs.distributed.net/
Using email address (distributed.net ID) 'хххххх@mail.ru'

[Dec 17 04:34:34 UTC] Automatic processor detection found 1 processor.
[Dec 17 04:34:34 UTC] Automatic processor type detection found
a GeForce 8200 (1 MPs) processor.
[Dec 17 04:34:34 UTC] RC5-72: Running micro-bench to select fastest core...
[Dec 17 04:36:20 UTC] RC5-72: using core #9 (CUDA 2-pipe 64-thd busy wait).
[Dec 17 04:36:20 UTC] RC5-72: Loaded random 53:9C9C1903:00000000:1*2^32
[Dec 17 04:36:20 UTC] RC5-72: 0 packets remain in buff-in.r72
[Dec 17 04:36:20 UTC] RC5-72: 0 packets are in buff-out.r72
[Dec 17 04:36:20 UTC] 1 cruncher has been started.
.....10%.....20%
[Dec 17 04:37:17 UTC] RC5-72: using core #0 (CUDA 1-pipe 64-thd busy wait).
[Dec 17 04:37:36 UTC] RC5-72: Benchmark for core #0 (CUDA 1-pipe 64-thd bus ...
0.00:00:16.65 [15,899,775 keys/sec]
[Dec 17 04:37:36 UTC] RC5-72: using core #1 (CUDA 1-pipe 64-thd sleep 100us).
[Dec 17 04:37:56 UTC] RC5-72: Benchmark for core #1 (CUDA 1-pipe 64-thd sle ...
0.00:00:17.32 [13,951,542 keys/sec]
[Dec 17 04:37:56 UTC] RC5-72: using core #2 (CUDA 1-pipe 64-thd sleep dynamic).
[Dec 17 04:38:15 UTC] RC5-72: Benchmark for core #2 (CUDA 1-pipe 64-thd sle ...
0.00:00:16.57 [14,721,387 keys/sec]
[Dec 17 04:38:15 UTC] RC5-72: using core #3 (CUDA 1-pipe 128-thd busy wait).
[Dec 17 04:38:35 UTC] RC5-72: Benchmark for core #3 (CUDA 1-pipe 128-thd bu ...
0.00:00:16.89 [15,899,775 keys/sec]
[Dec 17 04:38:35 UTC] RC5-72: using core #4 (CUDA 1-pipe 128-thd sleep 100us).
[Dec 17 04:38:53 UTC] RC5-72: Benchmark for core #4 (CUDA 1-pipe 128-thd sl ...
0.00:00:16.54 [12,429,560 keys/sec]
[Dec 17 04:38:53 UTC] RC5-72: using core #5 (CUDA 1-pipe 128-thd sleep dyna ...
[Dec 17 04:39:14 UTC] RC5-72: Benchmark for core #5 (CUDA 1-pipe 128-thd sl ...
0.00:00:17.34 [12,437,855 keys/sec]
[Dec 17 04:39:14 UTC] RC5-72: using core #6 (CUDA 1-pipe 256-thd busy wait).
[Dec 17 04:39:32 UTC] RC5-72: Benchmark for core #6 (CUDA 1-pipe 256-thd bu ...
0.00:00:16.48 [8,744,976 keys/sec]
[Dec 17 04:39:32 UTC] RC5-72: using core #7 (CUDA 1-pipe 256-thd sleep 100us).
[Dec 17 04:39:51 UTC] RC5-72: Benchmark for core #7 (CUDA 1-pipe 256-thd sl ...
0.00:00:16.32 [8,196,096 keys/sec]
[Dec 17 04:39:51 UTC] RC5-72: using core #8 (CUDA 1-pipe 256-thd sleep dyna ...
[Dec 17 04:40:10 UTC] RC5-72: Benchmark for core #8 (CUDA 1-pipe 256-thd sl ...
0.00:00:16.54 [8,287,756 keys/sec]
[Dec 17 04:40:11 UTC] RC5-72: using core #9 (CUDA 2-pipe 64-thd busy wait).
[Dec 17 04:40:30 UTC] RC5-72: Benchmark for core #9 (CUDA 2-pipe 64-thd bus ...
0.00:00:16.45 [16,138,272 keys/sec]
[Dec 17 04:40:30 UTC] RC5-72: using core #10 (CUDA 2-pipe 64-thd sleep 100us).
[Dec 17 04:40:49 UTC] RC5-72: Benchmark for core #10 (CUDA 2-pipe 64-thd sl ...
0.00:00:17.32 [12,404,494 keys/sec]
[Dec 17 04:40:49 UTC] RC5-72: using core #11 (CUDA 2-pipe 64-thd sleep dyna ...
[Dec 17 04:41:08 UTC] RC5-72: Benchmark for core #11 (CUDA 2-pipe 64-thd sl ...
0.00:00:17.31 [12,621,983 keys/sec]
[Dec 17 04:41:09 UTC] RC5-72: using core #12 (CUDA 2-pipe 128-thd busy wait).
[Dec 17 04:41:28 UTC] RC5-72: Benchmark for core #12 (CUDA 2-pipe 128-thd b ...
0.00:00:16.73 [7,494,144 keys/sec]
[Dec 17 04:41:28 UTC] RC5-72: using core #13 (CUDA 2-pipe 128-thd sleep 100us).
[Dec 17 04:41:47 UTC] RC5-72: Benchmark for core #13 (CUDA 2-pipe 128-thd s ...
0.00:00:16.32 [7,360,512 keys/sec]
[Dec 17 04:41:47 UTC] RC5-72: using core #14 (CUDA 2-pipe 128-thd sleep dyn ...
[Dec 17 04:42:06 UTC] RC5-72: Benchmark for core #14 (CUDA 2-pipe 128-thd s ...
0.00:00:16.32 [7,356,432 keys/sec]
[Dec 17 04:42:06 UTC] RC5-72: using core #15 (CUDA 4-pipe 64-thd busy wait).
[Dec 17 04:42:24 UTC] RC5-72: Benchmark for core #15 (CUDA 4-pipe 64-thd bu ...
0.00:00:16.32 [8,327,184 keys/sec]
[Dec 17 04:42:24 UTC] RC5-72: using core #16 (CUDA 4-pipe 64-thd sleep 100us).
[Dec 17 04:42:43 UTC] RC5-72: Benchmark for core #16 (CUDA 4-pipe 64-thd sl ...
0.00:00:16.32 [8,208,384 keys/sec]
[Dec 17 04:42:43 UTC] RC5-72: using core #17 (CUDA 4-pipe 64-thd sleep dyna ...
[Dec 17 04:43:02 UTC] RC5-72: Benchmark for core #17 (CUDA 4-pipe 64-thd sl ...
0.00:00:16.51 [8,287,756 keys/sec]
[Dec 17 04:43:02 UTC] RC5-72: using core #18 (CUDA 4-pipe 128-thd busy wait).
[Dec 17 04:43:21 UTC] RC5-72: Benchmark for core #18 (CUDA 4-pipe 128-thd b ...
0.00:00:16.71 [7,461,583 keys/sec]
[Dec 17 04:43:21 UTC] RC5-72: using core #19 (CUDA 4-pipe 128-thd sleep 100us).
[Dec 17 04:43:40 UTC] RC5-72: Benchmark for core #19 (CUDA 4-pipe 128-thd s ...
0.00:00:16.34 [7,356,432 keys/sec]
[Dec 17 04:43:40 UTC] RC5-72: using core #20 (CUDA 4-pipe 128-thd sleep dyn ...
[Dec 17 04:43:59 UTC] RC5-72: Benchmark for core #20 (CUDA 4-pipe 128-thd s ...
0.00:00:16.32 [7,360,512 keys/sec]

Значит, заработало? 16М и то не плохо. Если, конечно, GUI с... 17.12.08 16:51
Автор: Sla <Sla> Статус: Member

<"чистая" ссылка>

Значит, заработало? 16М и то не плохо. Если, конечно, GUI с ней в фоне тормозить не будут.

[RC5] Значит, заработало!!!! 17.12.08 18:01
Автор: maestro_sochi <maestro> Статус: Member

<"чистая" ссылка>

> Значит, заработало? 16М и то не плохо. Если, конечно, GUI с
> ней в фоне тормозить не будут.
а вот тормоза ужасные!!!!!
но косяк в том что проц ведь не считает кгда куда работает... а у меня все процессоры 2х ядерные или 4х минимум по 25 мегакеев выдают! смысла включать куду нет... только если все вместе будет считать! есть такая надежда?

Если я правильно помню багзиллу, то там добились снижения... 17.12.08 19:11
Автор: Sla <Sla> Статус: Member

<"чистая" ссылка>

> минимум по 25 мегакеев выдают! смысла включать куду нет...
> только если все вместе будет считать! есть такая надежда?
Если я правильно помню багзиллу, то там добились снижения загрузки CPU <1%, но тормозит-то не из-за проца, а потому что видюхе не дают времени для отрисовки экрана. У меня в экспериментах с ATI такая же ситуация, думаю, можно ее попробовать победить, например, втыкая небольшую паузу после обработки очередного блока, но скорость упадет. Хотя без этого, использовать клиент можно лишь как числодробильню , либо как screensaver. :(

было бы хорошо если в кудовом клиенте такая же была... 18.12.08 09:17
Автор: maestro_sochi <maestro> Статус: Member

<"чистая" ссылка>

> Если я правильно помню багзиллу, то там добились снижения
> загрузки CPU <1%, но тормозит-то не из-за проца, а
> потому что видюхе не дают времени для отрисовки экрана. У
> меня в экспериментах с ATI такая же ситуация, думаю, можно
> ее попробовать победить, например, втыкая небольшую паузу
> после обработки очередного блока, но скорость упадет. Хотя
> без этого, использовать клиент можно лишь как
> числодробильню , либо как screensaver. :(
было бы хорошо если в кудовом клиенте такая же была реализация как в обычном что в начале орабатываеться все что более высокого приоритета а потом уже сами блоки! реально?

[RC5] было бы хорошо если в кудовом клиенте такая же была... 18.12.08 17:44
Автор: Sla <Sla> Статус: Member
Отредактировано 18.12.08 17:47 Количество правок: 1

<"чистая" ссылка>

>более высокого приоритета а потом уже сами блоки!
> реально?
К сожалению, GPU (по крайней мере AMD-шные, но Nvidia, вероятно, тоже) не умеют обрабатывать несколько программ одновременно. и они не могут отложить обработку одного уже запущенного задания, чтобы заняться другим. Поэтому, ИМХО, реально сделать только так: кормить маленькими порциями, с небольшими паузами, чтобы в эти паузы он успевал заниматься своими обычными делами. А сейчас GPU получают работу на время порядка секунды, и, как следствие, в это время не могут рисовать окошки и пр.

Мнение 21.12.08 21:35
Автор: hazkep Статус: Незарегистрированный пользователь

<"чистая" ссылка>

Слишком много вопросов остается по CUDA клиентам, скрытно его не установить, потому что тормозит. А как быть с играми? ;) На своем компе тоже особо не разгуляешься, разве что запускать когда уходишь, но забывать постоянно будешь...

[RC5] Мнение 21.12.08 23:43
Автор: Miraj <Михаил> Статус: Member

<"чистая" ссылка>

> Слишком много вопросов остается по CUDA клиентам, скрытно
> его не установить, потому что тормозит. А как быть с
> играми? ;) На своем компе тоже особо не разгуляешься, разве
> что запускать когда уходишь, но забывать постоянно

Ставить серьезные видюхи в сервера)
А в линукс версии cuda клиент? тот что выложен в пре-релизах тормозит прорисовку?
ИМХО решается проблема с прорисовкой програмерами!

Я не знаю что там с Linux, но на Windows тормозит на любом... 22.12.08 10:44
Автор: hazkep Статус: Незарегистрированный пользователь

<"чистая" ссылка>

> Ставить серьезные видюхи в сервера)
> А в линукс версии cuda клиент? тот что выложен в
> пре-релизах тормозит прорисовку?
> ИМХО решается проблема с прорисовкой програмерами!
> Ставить серьезные видюхи в сервера)
> А в линукс версии cuda клиент? тот что выложен в
> пре-релизах тормозит прорисовку?
> ИМХО решается проблема с прорисовкой програмерами!
Я не знаю что там с Linux, но на Windows тормозит на любом ядре клиент и грузит 50% процессора. Пробую все версии, которые выходят.

да ладно, Вынь-клиенты тестовые не тормозят 22.12.08 13:05
Автор: panam Статус: Незарегистрированный пользователь

<"чистая" ссылка>

Пробую последние выложенные в бигзилле на -bench на машине со старым-престарым двухядерником и 2-мя Ультрами - не тормозит. И проц меньше грузит.
Под Линукс - Иксы совсем тупят. и клиент останавливают. Но это я мог накосячить с установками... А под 2 карты Иксы вообще заводиться отказались без напильника. Но я Иксы бросил, ибо не нужны. А в консоле работает шустро. И проца одноядерника 3000+ на две 9800gtx+ не хватает.....

У меня Vista x64 может в этом дело...А там где XP нету видео... 22.12.08 15:47
Автор: hazkep Статус: Незарегистрированный пользователь

<"чистая" ссылка>

> Пробую последние выложенные в бигзилле на -bench на машине
> со старым-престарым двухядерником и 2-мя Ультрами - не
> тормозит. И проц меньше грузит.
У меня Vista x64 может в этом дело...А там где XP нету видео нормального. Ну если под XP не тормозит - хорошо, есть пару мест где поставить можно, когда доделают клиент. Но опять же как он будет себя вести когда человек захочет поиграть? не скажешь же чтобы он сервис клиента останавливал каждый раз. :)

В флдинге это как-то реализовано. когда GPU-клиент в фоне... 18.12.08 17:51
Автор: Miraj <Михаил> Статус: Member

<"чистая" ссылка>

> Поэтому, ИМХО,
> реально сделать только так: кормить маленькими порциями, с
> небольшими паузами, чтобы в эти паузы он успевал заниматься
> своими обычными делами. А сейчас GPU получают работу на
> время порядка секунды, и, как следствие, в это время не
> могут рисовать окошки и пр.

В флдинге это как-то реализовано. когда GPU-клиент в фоне висит, работать совершенно комфортно, и прорисовка не тормозит...

Интересно, конечно, будет посмотреть исходники, но скорее... 18.12.08 17:54
Автор: Sla <Sla> Статус: Member

<"чистая" ссылка>

> В флдинге это как-то реализовано. когда GPU-клиент в фоне
> висит, работать совершенно комфортно, и прорисовка не
> тормозит...
Интересно, конечно, будет посмотреть исходники, но скорее всего так и сделано - как кооперативная многозадачность. Хотя, возможно, карты NV в этом отличаются от ATI

Фолдинг считал на своей ATI 3650... 18.12.08 19:10
Автор: Miraj <Михаил> Статус: Member

<"чистая" ссылка>

Тогда тем более интересно посмотреть исходники :) 18.12.08 19:15
Автор: Sla <Sla> Статус: Member

<"чистая" ссылка>

Тогда может тут посмотреть-поспрашивать? 18.12.08 19:38
Автор: Miraj <Михаил> Статус: Member

<"чистая" ссылка>

http://foldingforum.org/
http://folding.typepad.com/news/code-development/
http://folding.typepad.com/

Предлогаю покурить ссылки =) Мой инглиш на 3, так что глубоко копать ен могу(((

[RC5] 18.12.08 21:22
Автор: Sla <Sla> Статус: Member

<"чистая" ссылка>

Спасибо, попробую :) Но сначала надо хоть что-то выложить, чтобы затаившиеся глюки отлавливать

1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 »

Page build time: 0 s

Design: Vadim Derkach