Легенда:
новое сообщение
закрытая нитка
новое сообщение
в закрытой нитке
старое сообщение
|
- Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
- Новичкам также крайне полезно ознакомиться с данным документом.
Я имел ввиду, например, следующее. Определяем хэш функцию... 22.10.05 02:45 Число просмотров: 3366
Автор: lunc <Alexander Krizhanovsky> Статус: Member
|
> > С такой модификацией. > > Считаем какой-то вес (хоть сумму символов, хоть еще > что) не > > для всего сообщения, а для некоторых кусков (нужно > выбрать > > оптимальный их размер). Сравнивать не только значения > > весов, но и количество "совпавших" элементов, их общее > > количество и схожесть их между собой. > > Пример: > > abcd | emkf | fdmp | zz > > добавляем в начало: > > zzza | bcde | mkff | dmpz | z > > > > Таким образом сильно будут отличапться только > > первыйэлемент. > Честно говоря не заметил, чтобы остальные элементы, кроме > первого, были сильно похожи. Как по хешам, так и по > количеству повторяющихся символов. То ли я не так понял, то > ли где-то ошибка. Я имел ввиду, например, следующее. Определяем хэш функцию типа:
a1 ^ (a2 << 2) ^ (a3 << 4) ^ (a4 << 6)
ai -- это символ в блоке. Например для 2 сообщений: при каждои попадании при первом сообщении значение ячейки хэш таблицы увеличивается на 1, при втором уменьшается на 1 (начальное значение 0). Проходим хэш -- считаем не нулевые ячейки (пусть это будет N). Может быть здесь будет лучше для каждой ячейки хэш таблицы задавать не точное значение, а интервал значений хыш функции (ну или сразу функцию такую задать).
> Этот вариант возможен, если выбирать > длинные блоки, но это чаще всего невозможно из-за малого > размера сообщений. По моему, вообще чем меньше сообщение, тем сложнее определить его отклонение -- в моем варианте я бы ввел функцию, зависящую от длинны сообщения для определения является ли N флудовым значением.
Блоки нужны для большей (по моему мнению) устойчивости, как к сильным изменениям в одной части сообщения, так и к маленьким равномерно распределенным изменениям.
|
|
|