Недавно стоял проц P4-3.2 ГГц 512к 800FSB (Northwood), по бенчмарку OGR выдавало чуть выше 23 Mnodes/sec.
Поменял его на P4-3.4ГГц 1024к 800FSB.
Automatic processor identification tag: 6547:0F34
name: Intel Pentium 4 (Prescott)
features: MMX SSE SSE2 SSE3 Hyper-Threading(2)
Estimated processor clock speed (0 if unknown): 3400 MHz
Number of processors detected by this client: 2
Number of processors supported by this client: 128
---
Делаю бенчмарк и что я вижу ? %)
OGR-P2: Benchmark for core #2 (GARSP 6.0-asm-rt1-gen)
0.00:00:16.90 [19,330,185 nodes/sec]
---
Я не понимаю что это, неправильный процессор? 3.4ггц работает медленней, чем 3.2ггц ? гы-гы
Или может быть клиент слабо разбирается в Прескотах или частоты для него уже запредельные??
Кто может сравнить у себя например на равных частотах Нортвуды и Прескоты отзовитесь !
[OGR] А не в HT ли дело?19.09.05 22:20 Автор: J'JF <Dmytro Volhushyn> Статус: Elderman
Чтобы посмотреть в скакой скоростью считаются ОГРы можно в конфиге клиента указать
[display]
detached=no
progress-indicator=rate
Будет видна текущая скорость обсчета.
Так вот если включить два потока
[processor-usage]
max-threads=2
То скорость у меня примерно такая : [Oct 08 09:15:14 UTC] OGR-P2: rate: 24,025,442 nodes/sec
Но если отключить НТ с помощью max-threads=1 , то выходит так: [Oct 08 09:16:16 UTC] OGR-P2: rate: 19,156,751 nodes/sec
И это понятно.
Цитата: У процессора Pentium 4 есть три арифметических и логических модуля (ALU), которые работают с кодом integer. Два из этих ALU могут выполнять операции дважды за такт. Они используются для простых инструкций, которые легко выполнить за половину такта, и за счет этого Pentium 4 достигает высоких скоростей. В процессоре Prescott операция shift/rotate была добавлена в быстрый модуль ALU, так что она значительно убыстрена.
Во всех Р4 до прескотов целочисленные операции производились в одном медленном ALU. А в прескотах сделали тоже самое но в 2-х быстрых ALU. Поэтому и увеличивается скорость когда НТ включен. Работает два потока параллельно выполняя операции за полтакта.
А уж перебирать линейки Голомба это самая настоящая целочисленная работа.
Советую на процессорах P4-Prescott принудительно включать HT. Это увеличит вашу скорость.
Думаю вполне доступно18.09.05 23:25 Автор: Killer{R} <Dmitry> Статус: Elderman
Это все замечательно, куча всяких тестов, но там нет одного, того что мне нужно, тест скорости в клиенте днета на разных ядрах процессоров.
Неужто прескоты сливаю по полной или клиента надо лучше для него оптимизировать?
[OGR] и все же21.09.05 13:00 Автор: jammer <alex naumov> Статус: Elderman
> там нет одного, того что мне нужно, тест скорости в клиенте днета на разных ядрах процессоров. Неужто прескоты сливаю по полной или клиента надо лучше для него оптимизировать?
наоборот, прескотты рулят. вот, по конкретной сцылке:
"До процессора Prescott на медленном ALU обычно выполнялась операция shift/rotate. Эта операция применяется например при умножении на 2; если вам нужно произведение числа, то вы просто меняете биты этого числа.
В процессоре Prescott операция shift/rotate была добавлена в быстрый модуль ALU, так что она значительно убыстрена."
значительно - это от 3х до 7ми раз, насколько мне известно.