Действие происходило под Win98SE на двух машинах:
1. Duron-750 @840MHz (112x7.5)
default core - #0 (GARSP 5.13-A)
a) "старый" dnetc v2.8015-469-GTR-01051421 for Win32 (Windows 4.10).
[Sep 28 12:26:03 UTC] OGR: using core #0 (GARSP 5.13-A).
[Sep 28 12:26:22 UTC] OGR: Benchmark for core #0 (GARSP 5.13-A)
0.00:00:17.12 [5,906,393 nodes/sec]
[Sep 28 12:26:22 UTC] OGR: using core #1 (GARSP 5.13-B).
[Sep 28 12:26:41 UTC] OGR: Benchmark for core #1 (GARSP 5.13-B)
0.00:00:16.76 [5,613,017 nodes/sec]
---
b) "новый" dnetc v2.8019-473-GTR-02080201 for Win32 (Windows 4.10).
[Sep 28 12:12:59 UTC] OGR: using core #0 (GARSP 5.13-A).
[Sep 28 12:13:18 UTC] OGR: Benchmark for core #0 (GARSP 5.13-A)
0.00:00:16.74 [6,271,326 nodes/sec]
[Sep 28 12:13:18 UTC] OGR: using core #1 (GARSP 5.13-B).
[Sep 28 12:13:37 UTC] OGR: Benchmark for core #1 (GARSP 5.13-B)
0.00:00:16.74 [6,271,326 nodes/sec]
---
2. K6-2+/533 @550MHz (100x5.5)
default core - #1 (GARSP 5.13-B)
a) "старый" dnetc v2.8015-469-GTR-01051421 for Win32 (Windows 4.10).
[Sep 28 12:26:40 UTC] OGR: using core #0 (GARSP 5.13-A).
[Sep 28 12:27:00 UTC] OGR: Benchmark for core #0 (GARSP 5.13-A)
0.00:00:16.94 [2,487,984 nodes/sec]
[Sep 28 12:27:00 UTC] OGR: using core #1 (GARSP 5.13-B).
[Sep 28 12:27:19 UTC] OGR: Benchmark for core #1 (GARSP 5.13-B)
0.00:00:17.15 [2,575,945 nodes/sec]
---
b) "новый" dnetc v2.8019-473-GTR-02080201 for Win32 (Windows 4.10).
[Sep 28 12:20:28 UTC] OGR: using core #0 (GARSP 5.13-A).
[Sep 28 12:20:47 UTC] OGR: Benchmark for core #0 (GARSP 5.13-A)
0.00:00:16.99 [3,414,810 nodes/sec]
[Sep 28 12:20:47 UTC] OGR: using core #1 (GARSP 5.13-B).
[Sep 28 12:21:06 UTC] OGR: Benchmark for core #1 (GARSP 5.13-B)
0.00:00:16.99 [3,360,526 nodes/sec]
---
Весьма очевидные выводы:
1) новая версия работает (на AMD) быстрее, что особенно заметно на k6-2.
2) на k6-2 в новой версии core #0 работает на 1.5-2% быстрее core #1, выбираемого по умолчанию. Вероятно, это осталось от прошлой версии, где core #1 действительно быстрее.
3) весьма интересно, что на Duron'е оба алгоритма в новом клиенте выдают в точности одинаковую скорость (прогонял раз 10 - отклонение не превышает 30-40 knodes, причем вобестороны)
4) в OGRе возможности K7 используются не так эффективно, как в RC5 (там производительность этих двух машин отличалась не в 1.8 (6.2M/3.4M), а более чем в 3 раза (3.1M/950k)). Насчет возможности дальнейшей оптимизации OGRа судить не берусь, т.к. исходники не читал.
|