BugTraq.Ru: форум / dnet / По поводу Pentium 4

информационная безопасность
без паники и всерьез

подробно о проекте

Анализ криптографических сетевых...

Модель надежности двухузлового...

Специальные марковские модели надежности...

Бэкдор в xz/liblzma, предназначенный...

Три миллиона электронных замков...

Doom на газонокосилках

bugtraq.ru / форум / dnet

Имя

Пароль


ФОРУМ


	все доски
	FAQ
	IRC
	новые сообщения

	site updates
	guestbook
	beginners
	sysadmin
	programming
	operating systems
	theory
	web building
	software
	hardware
	networking
	law
	hacking
	gadgets
	job
	dnet
humor
miscellaneous
scrap

регистрация

Легенда:

новое сообщение

закрытая нитка

новое сообщение

в закрытой нитке

старое сообщение

Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
Новичкам также крайне полезно ознакомиться с данным документом.

По поводу Pentium 4 20.03.02 08:01 Число просмотров: 1543
Автор: xelator Статус: Незарегистрированный пользователь

<"чистая" ссылка>

> Насколько мне известно, когда используешь SSE2 набор, то не
> можешь использовать FPU. Иными словами, эта система
> подкоманд использует FPU.
Опять неверно. Это же вроде прописные истины. Так было в MMX.
Регистры MMX есть регистры FPU x87 поэтому одновременно использовать
MMX и FPU команды, мягко говоря, не рекомендуется. Да, и MMX функционально не использует FPU. Для него есть отдельный Execution Unit.

Вообще говоря, каюсь, MMX содержит операции на 64битными целыми, но с указаными выше ограничениям. Прелесть SSE2 - в их отсутствии и в том,
что можно делать одновременно 2 операции над 64битным целым или одну над 128битным, если это сдвиг. Это важная фича для RC5 на этапе key expansion.

> Далее, если все это правда
> (народ, что скажете?), то 64 битная целая арифметика всегда
> была частью FPU. Т.е. начиная с 486 любая IA 32 содержит 64
> битную целую арифметику.
>
Неправда. И вывод неверный. В FPU можно эмулировать целочисленное
сложение, умножение и деление если режим его работы округление к нулю.
Но как насчет сдвигов? А ротейтов? Не выйдет. Сразу же - делать одни
операции в FPU потом скидывать в память потом читать в целочисленный регистр делать сдвиг и абратно в FPU слишком дорого. Лучше эмуляция
через пару 32битных числа.
Для пущей честности, левый сдвиг на k бит можно эмулировать умножением на 2^k в вещественной арифметике, правый сдиг на k - умножением на 2^(-k) с последущим конвертацией результата к целому с округлением к нулю (truncate). Соответственно, rotate можно эмулировать 2 предыдущими командами и сложением их результата. Операции с парой 32битных чисел все равно гораздно быстрей.

И по чей-то злостной воле упорно блуждают абсурднейшие слухи о том, что в P4 нет аппаратной инструкции rotate. Хоть отдельный FAQ пиши на эту тему. ;-(( Есть она! ЕСТЬ!!!!!!!.

> А ты погляди на SuSE Linux - его уже портировали на Hammer.
> Вместе со многими вещами. Кстати, по-моему, где-то на АМД
> есть Билкины обещания насчет Hammer. Здесь только могу
> добавить, что это только обещания.
Я на это могу ответить, что MS Visual C до сих пор даже MMX-коды делать
не научился. Отсюда вывод, что вряд ли x86-64 набору больше повезет.
Что же касается ПодЛинукса, то все равно GCC не обеспечит нужной производительности и надо будет писать на ASM'e. До сих пор я не видел у АМД толкового мануала о том, как что-либо оптимизировать под их процы.
Он есть, но в нем написаны вещи типа - делай такую макро-операцию так-то, проц знает эту последовательность машинных команд и выполнит ее быстро. А насчет универсальных приемов с упором на архитектуру - НЕТ.
Если я делаю какие-то нестандартные операции, отличные от перевода целого числа в вещественное или подсчет количества ненулевых битов регистре, то я остаюсь в полном безвестном творческом пPолете.

<dnet>

Поиск

По поводу Pentium 4 - Pavel [SPB] 12.03.02 08:13 [1980]
- По поводу Pentium 4 - Mishka 17.03.02 23:08 [1694]
  - По поводу Pentium 4 - StR 18.03.02 19:09 [1414]
    - По поводу Pentium 4 - A6PAMOB 19.03.02 08:52 [1514]
      - По поводу Pentium 4 - StR 19.03.02 13:04 [1326]
        По поводу Pentium 4 - xelator 19.03.02 15:27 [1405]
        По поводу Pentium 4 - Mishka 19.03.02 16:25 [1372]
        По поводу Pentium 4 - xelator 20.03.02 08:01 [1543]
        По поводу Pentium 4 - Mishka 20.03.02 22:25 [1666]
        По поводу Pentium 4 - xelator 21.03.02 16:16 [1572]
        По поводу Pentium 4 - Mishka 22.03.02 06:44 [1423]
        По поводу Pentium 4 - Mishka 22.03.02 06:20 [1506]
        По поводу Pentium 4 - StR 20.03.02 18:09 [1312]
- По поводу Pentium 4 - StR 12.03.02 18:24 [1429]
  - У меня p4 а толку нет. [url] - GorynYch 13.03.02 10:48 [1377]
    - PIV1400 = PIII683!!!. - Kobazev 18.03.02 13:04 [1746]
    - Ну ни фига себе! Надо разобраться - Kost без куки 13.03.02 11:43 [1333]
      - Ну ни фига себе! Надо разобраться - GorynYch 13.03.02 11:48 [1373]
        Ну ни фига себе! Надо разобраться - Mosich 13.03.02 12:36 [1362]
        Ну ни фига себе! Надо разобраться - GorynYch 13.03.02 12:51 [1667]
        Все просто... - black_leon_works 13.03.02 13:05 [1362]
        OK, посмотрим насколько вырастут надои... (-) - GorynYch 13.03.02 13:22 [1354]
- По поводу Pentium 4 - Mosich 12.03.02 09:14 [1290]
  - По поводу Pentium 4 - douglas 12.03.02 14:59 [1356] [штраф:10]
    - По поводу Pentium 4 - StR 12.03.02 18:20 [1327]
    - По поводу Pentium 4 - black_leon_works 12.03.02 16:16 [1265]
      - По поводу Pentium 4 - douglas 12.03.02 22:33 [1376]
        А деталька (случайно) не "процессор" называется??? :) (-) - Sandy 13.03.02 00:47 [1336]
        А деталька (случайно) не "процессор" называется??? :) - Mosich 13.03.02 02:29 [1378]
        А деталька (случайно) не "процессор" называется??? :) - black_leon_works 13.03.02 11:09 [1295]
        А деталька (случайно) не "процессор" называется??? :) - e-Rust 13.03.02 14:38 [1346]

Page build time: 0 s

Design: Vadim Derkach