Легенда:
новое сообщение
закрытая нитка
новое сообщение
в закрытой нитке
старое сообщение
|
- Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
- Новичкам также крайне полезно ознакомиться с данным документом.
Это все-таки не вопрос, а утверждение, причем не совсем... 19.11.07 10:55 Число просмотров: 3367
Автор: stream Статус: Незарегистрированный пользователь
|
> Вот вопрос(ы): > Во многих других процессорах нет встроенных аппаратных > команд циклического сдвига, и они должны эмулировать их (по > крайней мере) двумя сдвигами и логическим ИЛИ. Эта фора > является причиной того, что многие процессоры считают RC5 > медленнее, чем этого можно было бы ожидать, основываясь на > обычных тестах. Это также является основной причиной того, > что клиент RC5 не годится на роль программы тестирования > производительности процессора. > Заметим, что архитектура IA32 используется в процессорах > Intel 80386, 80486, Pentium, Pentium Pro, Pentium II, > Pentium III и Pentium 4, однако у Pentium 4 нет аппаратной > реализации циклического сдвига.
Это все-таки не вопрос, а утверждение, причем не совсем точное. В P4 есть, как он называет, "аппаратная реализация циклического сдвига" (см. "microcode 0" ниже), только она какая-то кривая и тормозная.
ROR r32,i => 1 uop, microcode 0, latency 4
ROR r32,cl => 2 uop, microcode 0, latency 6
Т.е. популярный сдвиг на переменное кол-во бит в регистре CL исполняется 2 такта вместо одного на остальных процессорах, а также у этих команд жуткая латентность - если написать два сдвига подряд, между ними будут доп. тормоза в 4/6 тактов.
И в P4 так везде. Совершенно дерьмовая архитектура, дутые мегагерцы - латентность на самых банальных командах (грубо говоря, процессор на самом деле не может полноценно работать на такой частоте, и поэтому сам вставляет в критических точках задержки).
> А Core2Duo?
Это очень правильная архитектура, как я понимаю, они отказались от идей P4 и развивают линию PII/PIII. Любой сдвиг там исполняется один такт без доп. задержек. При меньших мегагерцах тактовой все работает гораздо быстрее.
> Что ему ответить или ссылки какие дать
www.agner.org/optimize/ - мануалы по всем растактовкам всех команд всех процессоров.
|
|
|