BugTraq.Ru: форум / site updates / Извиняюсь, что не в тему, а про оптимизацию.

информационная безопасность
без паники и всерьез

подробно о проекте

Анализ криптографических сетевых...

Модель надежности двухузлового...

Специальные марковские модели надежности...

Бэкдор в xz/liblzma, предназначенный...

Три миллиона электронных замков...

Doom на газонокосилках

bugtraq.ru / форум / site updates

Имя

Пароль


ФОРУМ


	все доски
	FAQ
	IRC
	новые сообщения

	site updates
guestbook
beginners
sysadmin
programming
operating systems
theory
web building
software
hardware
networking
law
hacking
gadgets
job
dnet
humor
miscellaneous
scrap

регистрация

Легенда:

новое сообщение

закрытая нитка

новое сообщение

в закрытой нитке

старое сообщение

Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
Новичкам также крайне полезно ознакомиться с данным документом.

Извиняюсь, что не в тему, а про оптимизацию. 24.08.07 10:42 Число просмотров: 5678
Автор: DPP <Dmitry P. Pimenov> Статус: The Elderman
Отредактировано 24.08.07 10:45 Количество правок: 2

<"чистая" ссылка>

> А если еще и в оптимизацию податься, которая мешает читать
> ))
>

Извиняюсь, что не в тему, а про оптимизацию.

> move ebx, x ; (x>>1) // вот здесь то, равно как

1. Если к функции обратились, передав значения через память, значит эти данные недавно были размещены в памяти, значит они в кеше первого уровня, доступ к которому во много раз быстрее, чем к ОЗУ.

> и в move ecx,y и висит "основной тормоз" -- ОЗУ ;)
> xor edx,edx ; а вот и один (через две строки)
> move eax,ebx
> move ecx, y ; (y>>1)
> or eax, ecx ; получит (x|y)&1
> inc edx
>
> shr ebx,dl

2. После инкремента регистра d, сразу же идет его использование в сдвиге. Эти инструкции не распараллелятся. Инкремент полезно поднять на одну-две инструкции повыше. Лучше вообще в регистр константу заносить. Это быстрее не будет, медленнее тоже, как и компактнее, разве что инструкций поменьше.

> and al, dl

3. При сдвиге на 1 лучше константу подсовывать. У 86 процов вроде как отдельная инструкция для этого есть. В любом случае даже простые константы не синтезировать, а подсовывать в поток инструкций. Мне запомнилось, что сложение двух регистров и константы на довольно древних процессорах может быть выполнено за один такт (или за нулевое время), поскольку оно делается еще на этапе выборки и дешифрации адреса.
lea ax, [bx]+[bp]+N
будет быстрее, чем
mov ax, bp
add ax, bx
add ax, N
к тому же эти инструкции на двухконвеерных процессорах даже не распараллеляться.

> shr ecx, dl ; хэ, что-т напоминает ;)
> add ebx,al
> nop
> add ebx, ecx ; == retval

Просьба поправить, если я ошибся.

Поиск

Клиника плохого кода [url] - dl 22.08.07 12:55 [12363]
- ИМХО, в статье ничего нет, кроме неаргументированн... - Estellehtaon 18.03.08 12:50 [6380]
  - Re: ИМХО, в статье ничего нет, кроме неаргументиро... - Линда Кайе 09.05.08 17:50 [5949]
- Опечатка в тексте - n0xi0uzz 28.08.07 09:41 [6826]
  - fixed, спасибо (-) - dl 28.08.07 10:07 [6564]
    - очепятка "по Фрейду"? ;-) (-) - leo 29.08.07 16:49 [6702]
- Даже хочется поблагодарить за тему. Сам хотел поднять... - DPP 23.08.07 13:04 [6716]
  - Абсолютно согласен. Но у меня даже желание как-то... (-) - kstati 23.08.07 20:54 [6380]
    - Ну не стОит так драматизаровать. Мне думается, что... - DPP 24.08.07 12:05 [6949]
- *****!!! (-) - Zef 23.08.07 05:54 [6455]
  - А можно подробнее? (-) - Fighter 23.08.07 16:47 [6435]
    - 5 респектов. (-) - Zef 24.08.07 03:39 [5878]
    - Мат на форуме запрещен ). Имхо - у хороших авторов... (-) - kstati 23.08.07 20:51 [5746]
      - С имхо - полностью не согласен. Коротко и красиво... (-) - Fighter 24.08.07 17:03 [6207]
        Не согласен с несогласием ) Почитай Сократа. Тот п... (-) - kstati 15.09.07 20:38 [5818]
        Не согласен с Сократом. Он Стругацких не читал. :)... (-) - Fighter 16.09.07 00:10 [5919]
  - лаконично и понятно (-) - kstati 23.08.07 07:38 [6020]
- [off] Очень понравилось предложение "Компиляция по... (-) - Fighter 22.08.07 20:27 [6005]
- Ну просто отлично. Я в шоке - smartov 22.08.07 18:49 [6319]
  - Я бы вам не доверил реализацию двоичного поиска, н... - crontab 22.08.07 19:51 [6138]
    - В данной статье автор обсуждал индусский код и то,... - smartov 23.08.07 11:48 [6910]
      - a/2 + b/2 вообще неверно - Martha 29.08.07 13:45 [5694]
        На десяток строк ниже посмотрите. Вот прямая ссылка... - DPP 29.08.07 14:16 [5589]
    - В начальных условиях было сказано лишь, что требуется... - Heller 23.08.07 11:42 [5720]
    - Видимо тов. smartov хотел донести следующую... - DPP 23.08.07 11:40 [5675]
      - Совершенно верно - smartov 23.08.07 11:51 [5825]
  - и величина погрешности при вычислениях увеличивает... - orkatt 22.08.07 19:04 [5515]
    - Я гляжу тут люди сидят абы языком ляпнуть. - smartov 23.08.07 11:37 [5739]
      - Только что проверил с GCC - (a + b) / 2 транслируется в... - crontab 23.08.07 15:57 [5719]
        Извиняюсь, но с "чутьем" тут перегнуто. Есть прави... - DPP 23.08.07 16:36 [5932]
        Да, перегнул. По стандарту достаточно и того, что оба... - crontab 23.08.07 17:34 [5364]
        Ну не знаю. Сам процессор не проектировал, вот выписка из... [url] - DPP 24.08.07 11:10 [5695]
        Для беззнаковых погрешность та же - единица, и, "н... - kstati 23.08.07 21:08 [5627]
        Извиняюсь, что не в тему, а про оптимизацию. - DPP 24.08.07 10:42 [5678]
- "Но бойтесь единственно только того, кто скажет я... - amirul 22.08.07 14:08 [5847]
  - Про Паскаль. - Fighter 22.08.07 20:41 [5758]
    - BCPL (-) - dl 22.08.07 22:03 [5362]
      - Точно! (-) - Fighter 22.08.07 22:09 [5296]
  - Если a и b близки к INT_MAX, то результат получится... - crontab 22.08.07 14:39 [5761]
    - Прошу прощения - сказал не проверив. Мне почему то... - amirul 22.08.07 16:47 [5557]
      - Я бы сказал, что в турбо паскаль оно напрямую попало из... - dl 22.08.07 17:48 [5712]
      - Нет, в TP была своя схема объектных модулей (юнито... - crontab 22.08.07 17:38 [5646]
        Да, заимствование определенно не из C++, но особых... - amirul 22.08.07 20:12 [5633]
        В Си в любом хедере можно написать все что угодно... - crontab 22.08.07 20:49 [5830]
        Здесь важно понимать одну вещь: новичек вряд ли напишет... - amirul 23.08.07 11:28 [5890]
        Динамические языки это те, которые победят мир IT ;-) - HandleX 28.08.07 15:23 [5353]
        Скорость работы программы и скорость ее работы связаны... - DPP 28.08.07 16:15 [5696]
        Зарядить писькОметры!!! ;-) - HandleX 28.08.07 18:11 [5564]
        Однако! Простим самому калькулятору, что выводит не все... - DPP 28.08.07 19:27 [5578]
        Попробуй, под вендой хороша бесплатная реализация... [url] - HandleX 28.08.07 19:45 [5497]
        Несколько неточностей по поводу DCOM. [upd] - Den 22.08.07 18:39 [5869]
        .NET предлагает т.н. Remoting, который по мнению M... - crontab 22.08.07 18:53 [5586]
        А на чем базируется этот самый Remoting??? [upd2] - Den 22.08.07 18:54 [5633]
        у меня на работе есть одна программка которая отка... - Attid 19.09.07 10:57 [5870]
        Для начала попробовать дать пользователю права Power Users (-) - Den 20.09.07 18:27 [5468]

Page build time: 0 s

Design: Vadim Derkach