Легенда:
новое сообщение
закрытая нитка
новое сообщение
в закрытой нитке
старое сообщение
|
- Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
- Новичкам также крайне полезно ознакомиться с данным документом.
Re: Много тут... 06.12.01 00:14 Число просмотров: 964
Автор: RedAndr UfaTeam <Андрей Рыжков> Статус: Member
|
> Из наших тестов мне не ясно только одно - как код, который > расходует больше тактов, в итоге дает больше keys/sec ? Да, это то и самое странное...
> > Что то не очень :( > Очень и очень плохо... На P3 получается ~200 так, вместо ~710. > Для меня самое важное, то что пустой цикл на P4 тратит в > ТРОЕ больше чем на P3. Как не крути, а это - показатель. > В "Optimization Reference Manual" по P4 действительно > написано, что лучше изберать сдвигов, умножений и делений, > но судя по тестам, получается что их лучше вообще не > использовать :-) Что то я не пойму господ из интела, что они наделали в новом своём процессоре? Сдвиги нельзя, умножать, делить тоже... Что ж тогда делать? Не все же задачи можно к SSE2 привести. Или нет?
> > Постепенно прихожу к неутешительному выводу о фиговости П4. > IMHO аналогично! RC6 - это мощная арифметическая нагрузка, > где хороший CPU может сильно выиграть... Похоже что P4 > только и умеет что данные копировать :-) Как не странно мои задачи (квантовая химия) П4 считает быстрее не только П3, но и Атлона. Вероятно как раз за счёт более быстрой памяти. Ну и на этом спасибо! ;))
> > > SSE2 - тоже вариант, но у меня пока P-III :-( > > Может тогда просто SSE? > SSE от MMX отличается только поддержкой плавающей точки, > что в случае с RC5/6 ничего не дает. А SSE2 добавляет 32x4, > a это уже "в тему". > Чтобы сделать подбор RC5 на SSE2, нужно постараться свести > алгоритм к операциям над квартетами чисел. Ну в случае RC5, я думаю, тут всё просто. Можно просто запустить в параллель четыре задачки. Не так ли?
|
|
|