Легенда:
новое сообщение
закрытая нитка
новое сообщение
в закрытой нитке
старое сообщение
|
- Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
- Новичкам также крайне полезно ознакомиться с данным документом.
С такой модификацией. 21.10.05 15:10 Число просмотров: 3422
Автор: lunc <Alexander Krizhanovsky> Статус: Member
|
> Второй вариант - вычислять контрольную сумму каждого > сообщения (просто складывая ASCII-коды символов). Если > контрольные суммы идущих подряд сообщений отличаются > незначительно, опять же - флуд. Однако такой вариант тоже > неоднозначен.
С такой модификацией.
Считаем какой-то вес (хоть сумму символов, хоть еще что) не для всего сообщения, а для некоторых кусков (нужно выбрать оптимальный их размер). Сравнивать не только значения весов, но и количество "совпавших" элементов, их общее количество и схожесть их между собой.
Пример:
abcd | emkf | fdmp | zz
добавляем в начало:
zzza | bcde | mkff | dmpz | z
Таким образом сильно будут отличапться только первыйэлемент. Здесь нужно будет создавать дерево или хэш для сохранения веов.
Для выбора кнстант, по которым можноопределить похожие элементы, можно обучить систему -- анализировать сообщения разных пользователей, корректировать свою чувствительность.
|
|
|