Легенда:
новое сообщение
закрытая нитка
новое сообщение
в закрытой нитке
старое сообщение
|
- Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
- Новичкам также крайне полезно ознакомиться с данным документом.
яничегонепонял 25.02.04 12:06 Число просмотров: 2332
Автор: Yurii <Юрий> Статус: Elderman Отредактировано 25.02.04 12:07 Количество правок: 1
|
> Именно так я оценивал почему P4 тормозит в RC5-64, > действительно ли код должен настолько медленно работать, > или имеется непонятный/понятный оверхэд. Имеено таким > образом было срезано около 40% в RC5-64 - тупой > перераскладкой ассемблера + замена некоторых неудобных с > точки зрения P4 инструкций. Алгоритм не менялся.
Т.е. ты клиента под П4 оптимизировал на 40%?
> Теперь то же самое для P4 и P4 Prescott. У них латенси > вращения поменялась с 4 на 1. Понятно что эффект обязан > быть при равных частотах. Если он не сходится с ожидаемыми > цифрами, опять надо смотреть кто съел законный прирост. > Далее владея цифрами производительности в тактах на > элемент, умножаем его на некий коэффициент частоты, > предполагая полную линейную маштабируемость задачи от > частоты ( что верно, т.к. задача чисто "молотильная" потому > и Целероны выступают по сравнению с P4 не очень плохо).
Угу. Я про то и говорил.
> Дальше было сложней. После этого я согласен с некоторой > натяжкой назвать P4 тормозом в RC5. Но только ПОСЛЕ, а не > априори. Можно ведь припомнить КАК замечательно работают > вещественные вычисления у АМД.
Да только RC5 клиент FPU не использует. :)
> Незачем пинать на то, что FPU у P4 медленный - > он медленный по дизайну
Конечному пользователю все равно по дизайну он медленный
или по техническим сложностям.
Честно говоря, я не понял, что ты имел в виду в этом постере.
|
|
|