BugTraq.Ru: форум / theory / Я имел ввиду, например, следующее. Определяем хэш функцию...

информационная безопасность
без паники и всерьез

подробно о проекте

Анализ криптографических сетевых...

Модель надежности двухузлового...

Специальные марковские модели надежности...

Бэкдор в xz/liblzma, предназначенный...

Три миллиона электронных замков...

Doom на газонокосилках

bugtraq.ru / форум / theory

Имя

Пароль


ФОРУМ


	все доски
	FAQ
	IRC
	новые сообщения

	site updates
	guestbook
	beginners
	sysadmin
	programming
	operating systems
	theory
web building
software
hardware
networking
law
hacking
gadgets
job
dnet
humor
miscellaneous
scrap

регистрация

Легенда:

новое сообщение

закрытая нитка

новое сообщение

в закрытой нитке

старое сообщение

Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
Новичкам также крайне полезно ознакомиться с данным документом.

Я имел ввиду, например, следующее. Определяем хэш функцию... 22.10.05 02:45 Число просмотров: 3366
Автор: lunc <Alexander Krizhanovsky> Статус: Member

<"чистая" ссылка>

> > С такой модификацией.
> > Считаем какой-то вес (хоть сумму символов, хоть еще
> что) не
> > для всего сообщения, а для некоторых кусков (нужно
> выбрать
> > оптимальный их размер). Сравнивать не только значения
> > весов, но и количество "совпавших" элементов, их общее
> > количество и схожесть их между собой.
> > Пример:
> > abcd | emkf | fdmp | zz
> > добавляем в начало:
> > zzza | bcde | mkff | dmpz | z
> >
> > Таким образом сильно будут отличапться только
> > первыйэлемент.
> Честно говоря не заметил, чтобы остальные элементы, кроме
> первого, были сильно похожи. Как по хешам, так и по
> количеству повторяющихся символов. То ли я не так понял, то
> ли где-то ошибка.
Я имел ввиду, например, следующее. Определяем хэш функцию типа:
a1 ^ (a2 << 2) ^ (a3 << 4) ^ (a4 << 6)
ai -- это символ в блоке. Например для 2 сообщений: при каждои попадании при первом сообщении значение ячейки хэш таблицы увеличивается на 1, при втором уменьшается на 1 (начальное значение 0). Проходим хэш -- считаем не нулевые ячейки (пусть это будет N). Может быть здесь будет лучше для каждой ячейки хэш таблицы задавать не точное значение, а интервал значений хыш функции (ну или сразу функцию такую задать).

> Этот вариант возможен, если выбирать
> длинные блоки, но это чаще всего невозможно из-за малого
> размера сообщений.
По моему, вообще чем меньше сообщение, тем сложнее определить его отклонение -- в моем варианте я бы ввел функцию, зависящую от длинны сообщения для определения является ли N флудовым значением.
Блоки нужны для большей (по моему мнению) устойчивости, как к сильным изменениям в одной части сообщения, так и к маленьким равномерно распределенным изменениям.

Поиск

Степень "похожести" двух строк - Heller 21.10.05 14:03 [2920]
- Ищи "fuzzy string searching" - amirul 24.10.05 13:39 [3475]
  - точнее, ищи шинглы - paganoid 24.10.05 14:06 [3690]
- Придумал решение! - Heller 21.10.05 23:52 [3414]
  - А если флудер начнёт постить циклическки 2 и более... (-) - HandleX 22.10.05 09:21 [3527]
- С такой модификацией. - lunc 21.10.05 15:10 [3425]
  - Не совсем понятно - Heller 21.10.05 22:55 [3280]
    - Я имел ввиду, например, следующее. Определяем хэш функцию... - lunc 22.10.05 02:45 [3366]
- Уже пробегало на форуме, поищи... (-) - HandleX 21.10.05 15:03 [3400]
  - Я помню только это: [url] - Heller 21.10.05 22:16 [3370]

Page build time: 0 s

Design: Vadim Derkach