Легенда:
новое сообщение
закрытая нитка
новое сообщение
в закрытой нитке
старое сообщение
|
- Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
- Новичкам также крайне полезно ознакомиться с данным документом.
А мож байеса прикрутить? 31.01.05 14:16 Число просмотров: 2273
Автор: amirul <Serge> Статус: The Elderman
|
> Минимальная фильтрация уже есть, в основном по адресам. > Плюс чем больше словарь, тем больше будет уходить времени > на обработку очередного постинга.
Думаю, открытых реализаций - хуча. Для самообучения можно считать первоначальным критерием нежелательности поста - отправление в скрап при незарегистрированности пользователя. Неудобства с ложными срабатываниями (а нормально обученный байесовый фильтр дает их ОЧЕНЬ мало) решаются регистрацией на форуме. Этот фильтр будет отсеивать не только спамеров, но и любые нежелательные посты (которые похожи на те, что УЖЕ отправлены в скрап на столько-то процентов). При этом отсеиваться будут любые боты (программные или аппаратные - ну, те у которых две руки две ноги). Им легче пойти постить на оставшиеся 1000 форумов, чем заморачиваться и долго подбирать текст для обхода фильтра.
При правильной организации словаря (хеш-таблица) вычисление апостериорной вероятности нежелательности письма будет происходить весьма быстро и не скажется ни на нагрузке на сервер (тот же запрос к БД на добавление поста должен отрабатываться дольше) ни на визуальной задержке при добавлении.
> > P.S. или вообще доступ на запись дать только > > зарегистрированным > > Это точно вряд ли.
|
|
|