информационная безопасность
без паники и всерьез
 подробно о проектеRambler's Top100
Портрет посетителяSpanning Tree Protocol: недокументированное применениеСетевые кракеры и правда о деле Левина
BugTraq.Ru
Русский BugTraq
 Анализ криптографических сетевых... 
 Модель надежности двухузлового... 
 Специальные марковские модели надежности... 
 Очередное исследование 19 миллиардов... 
 Оптимизация ввода-вывода как инструмент... 
 Зловреды выбирают Lisp и Delphi 
главная обзор RSN блог библиотека закон бред форум dnet о проекте
bugtraq.ru / форум / dnet
Имя Пароль
если вы видите этот текст, отключите в настройках форума использование JavaScript
ФОРУМ
все доски
FAQ
IRC
новые сообщения
site updates
guestbook
beginners
sysadmin
programming
operating systems
theory
web building
software
hardware
networking
law
hacking
gadgets
job
dnet
humor
miscellaneous
scrap
регистрация





Легенда:
  новое сообщение
  закрытая нитка
  новое сообщение
  в закрытой нитке
  старое сообщение
[RC5] См. ветку http://www.bugtraq.ru/cgi-bin/forum.mcgi?type=sb&b=1&m=97473 27.04.04 13:44  Число просмотров: 2055
Автор: Garick <Yuriy> Статус: Elderman
<"чистая" ссылка>
<dnet>
[RC5] Объясните пожалуйста, должен ли включенный HT увеличивать скорость. 27.04.04 12:41  
Автор: Guest Статус: Незарегистрированный пользователь
<"чистая" ссылка>
Если включаю 2 потока - то в сумме получается 1800-1900 тыс. ключей/сек. При этом оба процессора заняты на 100%. Если включаю 1 поток, то дает 3500 тыс. ключей/сек. При этом 1 процессор занят на 100%, второй практически свободен.
Проц - P4 2600 Northwood
ОС - XP prof sp1
Клиент - 483.
Спасибо.
[RC5] См. ветку http://www.bugtraq.ru/cgi-bin/forum.mcgi?type=sb&b=1&m=97473 27.04.04 13:44  
Автор: Garick <Yuriy> Статус: Elderman
<"чистая" ссылка>
Извиняюсь, что не дам ответа, которого Вы ждете, а дополню... 27.04.04 13:21  
Автор: DPP <Dmitry P. Pimenov> Статус: The Elderman
<"чистая" ссылка>
> Если включаю 2 потока - то в сумме получается 1800-1900
> тыс. ключей/сек. При этом оба процессора заняты на 100%.

Извиняюсь, что не дам ответа, которого Вы ждете, а дополню еще одним вопросом.

> Если включаю 1 поток, то дает 3500 тыс. ключей/сек. При

Ожидать от НТ увеличение производительности при решении вычислительной задачи в два раза бессмысленно, это понятно. Хотелось бы видеть хотя бы небольшое увеличение, суммарное, разумеется. Распараллеливая задачу на обычном процессоре (без НТ) можно ожидать только потерю производительности на небольшую величину, связанную с небольшими накладными вычислительными потерями на переключение процессов. Но ведь на то оно и НТ, чтобы минимизировать потери на переключение. Мало того, хотелось бы ожидать прирост этой производительности, как обещают инженеры Интела на несколько десятков процентов.

Может у Вас что-то не так настроено/сконфигурено аппаратно. Странно, но от распараллеливания у Вас получается только потеря производительности почти аж в два раза!

Мой дополнительный вопрос тем счастливым обладателям П4 с НТ заключается в том, какой максимальный прирост/потерю вычислительной производительности они видели на рассчетных задачах при их распараллеливании с использованием НТ?

> этом 1 процессор занят на 100%, второй практически
> свободен.

Было бы странным увидеть значение меньше 100%, хотя тогда бы все как-то объяснялось.

> Проц - P4 2600 Northwood
> ОС - XP prof sp1
> Клиент - 483.
> Спасибо.
Простое объяснение. 27.04.04 20:20  
Автор: mss <Сергей> Статус: Member
<"чистая" ссылка>
НТ даёт прирост производительность обычным задачам за счёт раскидывания вычислений по нескольких (дублированным) блокам процессора. Что и позволяет за счёт параллельной работы двух программ получать ускорение.

А коровка - УЖЕ оптимизирована под конкретные типы процессоров, и использует насколько возможно "распараллеливание" вычислений на все имеющиеся арифметические/логические блоки.

Если посмотреть на имеющиеся ядра:
RC5:-1) Auto select 0) SES 1-pipe 1) SES 2-pipe
2) DG 2-pipe 3) DG 3-pipe 4) DG 3-pipe alt
5) SS 2-pipe

то очевидно, что цифры 1, 2 и 3 - это и есть число распараллеленных конвейеров.

А если попытаться запустить с помощью НТ двух клиентов, то они только мешать друг другу будут.
[RC5] НТ не дает прироста быкам... 27.04.04 13:51  
Автор: Garick <Yuriy> Статус: Elderman
<"чистая" ссылка>
> Ожидать от НТ увеличение производительности при решении
> вычислительной задачи в два раза бессмысленно, это понятно.
> Хотелось бы видеть хотя бы небольшое увеличение, суммарное,
> разумеется. Распараллеливая задачу на обычном процессоре
> (без НТ) можно ожидать только потерю производительности на
> небольшую величину, связанную с небольшими накладными
> вычислительными потерями на переключение процессов. Но ведь
> на то оно и НТ, чтобы минимизировать потери на
> переключение. Мало того, хотелось бы ожидать прирост этой
> производительности, как обещают инженеры Интела на
> несколько десятков процентов.

Вычислительный блок проца остался ведь ОДИН и смысл НТ в том что параллелить дешифровщик команд, грубо говоря ускорять операции, не связанные с вычислениями.
[RC5] Извиняюсь, что не дам ответа, которого Вы ждете, а дополню... 27.04.04 13:27  
Автор: Guest Статус: Незарегистрированный пользователь
<"чистая" ссылка>
Проясню немного ситуацию:
До определенного момента все было ОК. 1-ый поток - 3.500 тыс ключей/сек, 2-ой поток 2.500 тыс ключей/сек. Падение случилось при смене клиента. Обратная замена не помогла.
Имеет ли смысл попробовать переставить виндюки "с нуля"?
Тогда снимаю свой дополнительный вопрос. НТ просто супер! Около 70%! 27.04.04 13:30  
Автор: DPP <Dmitry P. Pimenov> Статус: The Elderman
<"чистая" ссылка>
[RC5] НТ просто супер! Около 70%! 27.04.04 13:35  
Автор: rustamu Статус: Незарегистрированный пользователь
<"чистая" ссылка>
Guest = rustamu (зарегистрировался на форуме)
Хотя, хотя.. Это могло быть и помутнение рассудка и, например просто неправильное прочтение логов
Da Yo banner wrote!!! Ну не может один HT работать как два обычных проца по определению. 27.04.04 13:55  
Автор: Den <Денис Т.> Статус: The Elderman
<"чистая" ссылка>
Проц НТ имеет только одно ядро, но два контекста проца и естественно разделяет вычислительную мощность ядра между двумя контекстами, используя для второго контекста незадействованные первым области ядра.
Еще как может! Первый простой пример: один поток -... 28.04.04 10:44  
Автор: DPP <Dmitry P. Pimenov> Статус: The Elderman
Отредактировано 28.04.04 10:49  Количество правок: 1
<"чистая" ссылка>
> Проц НТ имеет только одно ядро, но два контекста проца и

Еще как может! Первый простой пример: один поток - целочисленный, второй с плавающей точкой или мультимедийный, он тоже на ФПУ работает. Второй пример похитрее: из-за латентности памяти простой процессора может составлять несколько десятков тактов (клоковость памяти помножим на множитель), получается что не только два, а три и четыре потока можно запустить плюс ФПУ. Так что реально добиться бОльшего, если еще немного подкрутить НТ до 4 процов, на задаче дНЕТ легко получить 4-х кратный прирост, поскольку большие числа не в регистрах, а, естественно, в памяти сидят.

> естественно разделяет вычислительную мощность ядра между
> двумя контекстами, используя для второго контекста
> незадействованные первым области ядра.

Ну таких областей мало, инструкции обычно перемешаны и АЛУ работает на всю катушку, и конвееры оба забиты - обычные потоки легко параллелятся. Вот если бы еще один - два конвеера добавить... Кто-то из разработчиков хотел это сделать.
1




Rambler's Top100
Рейтинг@Mail.ru


  Copyright © 2001-2025 Dmitry Leonov   Page build time: 0 s   Design: Vadim Derkach