Легенда:
новое сообщение
закрытая нитка
новое сообщение
в закрытой нитке
старое сообщение
|
- Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
- Новичкам также крайне полезно ознакомиться с данным документом.
 |  |  |  |
Интеловые процы имеют как никакой другой полноценный набор... 19.05.05 18:09 Число просмотров: 1267
Автор: DPP <Dmitry P. Pimenov> Статус: The Elderman
|
Интеловые процы имеют как никакой другой полноценный набор сдвиговых микрокоманд.
Вот они, сдвиговые команды для архитектуры Интел-86 (шестнадцатиричные коды):
C0 и C1 - на сколько двигать уаказывается непосредственно в коде команды.
D0 и D1 - сдвиг всегда на 1.
D2 и D3 - на сколько двигать уаказывается непосредственно в CL.
Первый столбец для 8 разрядного операнда, второй - для 16 разрядного.
Двоичные субкоды:
md000rm - ROL Циклический сдвиг влево без бита переноса.
md001rm - ROR Циклический сдвиг вправо без бита переноса.
md010rm - RCL Циклический сдвиг влево с битом переноса.
md011rm - RCR Циклический сдвиг вправо с битом переноса.
md100rm - SHL Нециклический сдвиг влево.
md101rm - SHR Нециклический сдвиг вправо.
md110rm
md111rm - RAR
|
<hardware>
|
Странная производительность P-IV по сравнению с P-III. 18.05.05 19:11 [ZloyShaman]
Автор: DPP <Dmitry P. Pimenov> Статус: The Elderman Отредактировано 18.05.05 19:13 Количество правок: 1
|
Две конфигурации:
1. P-IV 2.8Ггц 1Мб кэш, 1Ггб DDR двухканальная, Вин2000Сервер.
2. P-III 1Ггц 256Кб кеш, 512Мб SDRAM РС100, Вин2000Проф.
Тестовая программа - стандартный виндовый калькулятор в инженерном режиме.
Тест - вычисление факториала от 55000!
Время вычислений на 1 конфигурации 52 сек, на 2 конфигурации 57 сек.
Мешающих процессов небыло - загрузка процов до тестов почти нулевая.
При выполнении теста загрузка проца 1 конфинурации чуть выше 50% в целом (видит 2 процессора, поскольку проц ГиперТрэйдинговый) и около 100% одного из них, если смотреть поотдельности. Вторая конфигурация грузится на все 100%.
Странно, у П4 и технология более современная, и архитектура круче, и кэша в 4 раза больше, и оперативка в восемь раз быстрее, и частота почти в три раза выше.
Почему же разници в скорости почти не видно (10%)?
Калькулятор, скорее всего не использует никакую плавающую арифметику, сопроцессор и ССЕ/ССЕ2, но на обычных задачах то он должен быть быстрее. Я то ожидал раза в 3 - 4.
Может что-то с этим серваком не так, который на базе П4?
|
 |
AthlonXP 1900+ 512 PC2100 RAM 31 сек. (+++) 09.06.05 08:38
Автор: catlion <catlion> Статус: Member Отредактировано 09.06.05 08:41 Количество правок: 2
|
Только вот что интересно.
Стоит английская XP SP2, примерно секунд через 10 вылетает окошко что "операция может занять слишком много времени. Продолжить?"
Замерять нужно после появления окошка или как? :)
PS. Линуксовые калькуляторы тупо выдали ошибку))))
|
 |  |
Считать начинает мгновенно. Если процесс не успевает... 09.06.05 13:53
Автор: DPP <Dmitry P. Pimenov> Статус: The Elderman
|
> Только вот что интересно. > Стоит английская XP SP2, примерно секунд через 10 вылетает > окошко что "операция может занять слишком много времени. > Продолжить?"
Считать начинает мгновенно. Если процесс не успевает завершиться за 10 сек, то выскакивет окошко, но процесс на прекращается. Это все для того, чтоб дать понять пользователю, что калькулятор не "завис", а просто считает. А так же для того, чтоб легко было прервать эту операцию. Причем после закрывания этого окошка, оно заново выскочит через те же 10 сек после закрытия.
> Замерять нужно после появления окошка или как? :)
Сразу и не обращать внимание на окошко или по мере его появления закрывать его.
> PS. Линуксовые калькуляторы тупо выдали ошибку))))
Какие?
У bc, говорят, есть опция "-l".
|
 |  |  |
Все графические. KCalc, XCalc, гномовый. 10.06.05 05:27
Автор: catlion <catlion> Статус: Member
|
Все графические. KCalc, XCalc, гномовый.
Доберусь до работы, буду мучить bc
|
 |
странно 06.06.05 17:09
Автор: wizzard Статус: Незарегистрированный пользователь
|
> Две конфигурации: > 1. P-IV 2.8Ггц 1Мб кэш, 1Ггб DDR двухканальная, > Вин2000Сервер. > 2. P-III 1Ггц 256Кб кеш, 512Мб SDRAM РС100, Вин2000Проф. > Тестовая программа - стандартный виндовый калькулятор в > инженерном режиме. > Тест - вычисление факториала от 55000! > Время вычислений на 1 конфигурации 52 сек, на 2 > конфигурации 57 сек. > Мешающих процессов небыло - загрузка процов до тестов почти > нулевая. > При выполнении теста загрузка проца 1 конфинурации чуть > выше 50% в целом (видит 2 процессора, поскольку проц > ГиперТрэйдинговый) и около 100% одного из них, если > смотреть поотдельности. Вторая конфигурация грузится на все > 100%. > Странно, у П4 и технология более современная, и архитектура > круче, и кэша в 4 раза больше, и оперативка в восемь раз > быстрее, и частота почти в три раза выше. > Почему же разници в скорости почти не видно (10%)? > Калькулятор, скорее всего не использует никакую плавающую > арифметику, сопроцессор и ССЕ/ССЕ2, но на обычных задачах > то он должен быть быстрее. Я то ожидал раза в 3 - 4. > Может что-то с этим серваком не так, который на базе П4?
у меня такой-же проц.(1конф.) и выполняется за 15сек. в обычном калк.
p.s. win-xp-prof-sp2
|
 |  |
Может в сервисном паке покруче алгоритм впихнули - не знаю,... 06.06.05 18:45
Автор: DPP <Dmitry P. Pimenov> Статус: The Elderman
|
> > Две конфигурации: > > 1. P-IV 2.8Ггц 1Мб кэш, 1Ггб DDR двухканальная, > > Вин2000Сервер. > > 2. P-III 1Ггц 256Кб кеш, 512Мб SDRAM РС100,
> у меня такой-же проц.(1конф.) и выполняется за 15сек. в > обычном калк. > p.s. win-xp-prof-sp2
Может в сервисном паке покруче алгоритм впихнули - не знаю, но у большинства ответивших на 3ГГц 22 секунды считает, странно все это.
|
 |
хыхы... у меня тоже 52 секунды и полный проц забит. камень... 06.06.05 07:10
Автор: mult Статус: Незарегистрированный пользователь
|
хыхы... у меня тоже 52 секунды и полный проц забит. камень Pentium 2.0 GHz, 512 MB....
наверное дело в калькуляторе. чтобы не обидно было, он решает все с одинаковой скорости на всех процах (%
|
 |  |
Должен был секунд за 35-40. 06.06.05 10:57
Автор: DPP <Dmitry P. Pimenov> Статус: The Elderman
|
> хыхы... у меня тоже 52 секунды и полный проц забит. камень > Pentium 2.0 GHz, 512 MB.... > наверное дело в калькуляторе. чтобы не обидно было, он > решает все с одинаковой скорости на всех процах (% Должен был секунд за 35-40.
Попробуйте на первом пентиуме, сразу будет ясно, что скорость вычислений все-таки зависит от скорости процессора.
|
 |
Все правильно так и должно было быть: 29.05.05 18:09
Автор: Sergey - guest Статус: Незарегистрированный пользователь
|
> Две конфигурации: > 1. P-IV 2.8Ггц 1Мб кэш, 1Ггб DDR двухканальная, > Вин2000Сервер. > 2. P-III 1Ггц 256Кб кеш, 512Мб SDRAM РС100, Вин2000Проф. ....
> Время вычислений на 1 конфигурации 52 сек, на 2 > конфигурации 57 сек.
Все правильно так и должно было быть:
HT: - значит один поток может отхватить не более 50% ресурсов проца.
Кеша 2-го уровня хватит, чтобы загрузить основной код и данные полностью на этих конфигурациях.
Архитектура P4 сильно отличается от P3 и поддерживает большие частоты за счет того, что на исполнение кода требуется раза в полтора больше тактов.
Соответственно P3 должен был дать сходные либо несколько лучшие результаты.
Что на собственно и получилось.
|
 |  |
Зачем же тогда НТ придумали? Чтоб проц с такой же тактовой... 30.05.05 10:25
Автор: DPP <Dmitry P. Pimenov> Статус: The Elderman
|
> Все правильно так и должно было быть: > > HT: - значит один поток может отхватить не более 50% > ресурсов проца.
Зачем же тогда НТ придумали? Чтоб проц с такой же тактовой частотой в два раза медленнее считал (за исключением тех задач, когда одновременно будет считать две задачи)?
> Кеша 2-го уровня хватит, чтобы загрузить основной код и > данные полностью на этих конфигурациях. > Архитектура P4 сильно отличается от P3 и поддерживает > большие частоты за счет того, что на исполнение кода > требуется раза в полтора больше тактов.
Среднестатистически - может быть. Его заточили под поточность. Если код непрерывный, то и количество тактов на операцию в среднем такое же как и у предыдущих релизов (от П-1 до П-3).
> Соответственно P3 должен был дать сходные либо несколько > лучшие результаты. > > Что на собственно и получилось.
Все таки причина где-то в перегреве заключалась.
|
 |  |
ниче не правильно 29.05.05 18:19
Автор: Killer{R} <Dmitry> Статус: Elderman
|
почитай остальные массаги треда.. ближе к концу
|
 |
Атлон 2600+ не разогнаный 1900Мгц. 29сек 29.05.05 17:00
Автор: mentat[bugtraq.ru] <Александр> Статус: Elderman
|
|
 |  |
Хм ??? 03.06.05 19:26
Автор: LOnG <LOnG> Статус: Member Отредактировано 03.06.05 19:33 Количество правок: 1
|
P-IV 2.4Ггц 1Мб кэш, 768Мб, Вин2000Проф - 31 сек
P-III 1.2Ггц 256Мб кэш, 256Мб, Вин98SE - 68 сек
Оперативка ?
|
 |
Сдается мне, что "непонятки" в алгоритме работы калькулятора... 29.05.05 15:03
Автор: Garick <Yuriy> Статус: Elderman
|
Как видно результат получается не целочисленный, а експонентциальный (?).
Надо бы поискать и посмотреть исходники калькулятора.
Есть предположение, что существует максимальное целое число, которое может "проглатить" калькулятор. И соотв максимальное число, для которого считают факториал. Для этих чисел (из которых вычисляют факториал и меньших "критического") используется алгоритм "тупого" классического целочисленного умножения. А для больших чисел алгоритм, использующий ряды и нецелочисленную математику. Тк длина ряда постоянна -вычисление из 55000 и 25000 должно занимать одинаковое время. Надо проверить.
А вот почему увеличение частоты и типа ядра не дает резкого прироста производительности? Исходники надо искать:-) ИМХО не оптимальный код.
|
 |  |
исходники 29.05.05 15:31
Автор: Killer{R} <Dmitry> Статус: Elderman
|
что их искать-то...
http://killer-r.at.tut.by/calc.zip
Похоже что FPU там вообще не юзается. А вычисления таки с бесконечной точностью. О чем свидетельствует такой здоровый коммент-заголовок в scimath.c Ж)
|
 |
P3/733slot,112Mhz,256Ram,Chaint6BTM BX440,W98=72sec! 29.05.05 09:29
Автор: ed007 Статус: Незарегистрированный пользователь
|
|
 |
2хХ2,66 /400 среднее из 3-х измерений 31 сек. Нагрузка не актуальна, тк сервер в работе. Но вроде потоки не распределяются по лог процам 19.05.05 16:04
Автор: Garick <Yuriy> Статус: Elderman
|
|
 |
а может, а может.. Ж) 19.05.05 11:03
Автор: Killer{R} <Dmitry> Статус: Elderman
|
может у 2000й плохо с НТ? см. мой пост внизу с рузельтатами под ХР
|
 |  |
С НТ все в порядке - когда два одновременно работают, то дольше процентов на 20 считают. 20.05.05 12:46
Автор: DPP <Dmitry P. Pimenov> Статус: The Elderman
|
|
 |
А может опять виновато отсутствие «аппаратных» битовых сдвигов? В этой арифметике должно активно применяться… 19.05.05 06:30
Автор: HandleX <Александр М.> Статус: The Elderman Отредактировано 19.05.05 07:17 Количество правок: 1
|
|
|
|