информационная безопасность
без паники и всерьез
 подробно о проектеRambler's Top100
Страшный баг в WindowsАтака на InternetSpanning Tree Protocol: недокументированное применение
BugTraq.Ru
Русский BugTraq
 Анализ криптографических сетевых... 
 Модель надежности двухузлового... 
 Специальные марковские модели надежности... 
 Три миллиона электронных замков... 
 Doom на газонокосилках 
 Умер Никлаус Вирт 
главная обзор RSN блог библиотека закон бред форум dnet о проекте
bugtraq.ru / форум / guestbook
Имя Пароль
ФОРУМ
если вы видите этот текст, отключите в настройках форума использование JavaScript
регистрация





Легенда:
  новое сообщение
  закрытая нитка
  новое сообщение
  в закрытой нитке
  старое сообщение
  • Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
  • Новичкам также крайне полезно ознакомиться с данным документом.
А мож байеса прикрутить? 31.01.05 14:16  Число просмотров: 2197
Автор: amirul <Serge> Статус: The Elderman
<"чистая" ссылка>
> Минимальная фильтрация уже есть, в основном по адресам.
> Плюс чем больше словарь, тем больше будет уходить времени
> на обработку очередного постинга.

Думаю, открытых реализаций - хуча. Для самообучения можно считать первоначальным критерием нежелательности поста - отправление в скрап при незарегистрированности пользователя. Неудобства с ложными срабатываниями (а нормально обученный байесовый фильтр дает их ОЧЕНЬ мало) решаются регистрацией на форуме. Этот фильтр будет отсеивать не только спамеров, но и любые нежелательные посты (которые похожи на те, что УЖЕ отправлены в скрап на столько-то процентов). При этом отсеиваться будут любые боты (программные или аппаратные - ну, те у которых две руки две ноги). Им легче пойти постить на оставшиеся 1000 форумов, чем заморачиваться и долго подбирать текст для обхода фильтра.

При правильной организации словаря (хеш-таблица) вычисление апостериорной вероятности нежелательности письма будет происходить весьма быстро и не скажется ни на нагрузке на сервер (тот же запрос к БД на добавление поста должен отрабатываться дольше) ни на визуальной задержке при добавлении.

> > P.S. или вообще доступ на запись дать только
> > зарегистрированным
>
> Это точно вряд ли.
<guestbook>
2 dl: про спамеров 31.01.05 10:44  
Автор: !mm <Ivan Ch.> Статус: Elderman
Отредактировано 31.01.05 11:14  Количество правок: 1
<"чистая" ссылка>
может быть фильтровать сообщения незарегистрированных юзеров по содержанию?
словарь, специально для таких целей сделанный, я выслать могу :)

P.S. или вообще доступ на запись дать только зарегистрированным
можно еще стандартную защиту от ботов прикрутить 31.01.05 15:49  
Автор: Killer{R} <Dmitry> Статус: Elderman
<"чистая" ссылка>
картинка с замалеванным контрольным словом которое надо прочитать и руками вбить
это единственная защита от ботов, которой тут нет :) 31.01.05 17:46  
Автор: dl <Dmitry Leonov>
<"чистая" ссылка>
И вряд ли будет, потому как заставлять вбивать цифры с картинки при каждом постинге - это гарантированно убить форум. Полностью запрещать постинг незарегистрированным пользователям мне тоже пока не хочется.
имх, не поможет - судя по всему, 90% сообщений добавляют не боты, а люди. ручками. 31.01.05 16:36  
Автор: !mm <Ivan Ch.> Статус: Elderman
<"чистая" ссылка>
словарь не панацея 31.01.05 13:31  
Автор: dl <Dmitry Leonov>
<"чистая" ссылка>
> может быть фильтровать сообщения незарегистрированных
> юзеров по содержанию?
> словарь, специально для таких целей сделанный, я выслать
> могу :)

Минимальная фильтрация уже есть, в основном по адресам. Плюс чем больше словарь, тем больше будет уходить времени на обработку очередного постинга.

> P.S. или вообще доступ на запись дать только
> зарегистрированным

Это точно вряд ли.
А мож байеса прикрутить? 31.01.05 14:16  
Автор: amirul <Serge> Статус: The Elderman
<"чистая" ссылка>
> Минимальная фильтрация уже есть, в основном по адресам.
> Плюс чем больше словарь, тем больше будет уходить времени
> на обработку очередного постинга.

Думаю, открытых реализаций - хуча. Для самообучения можно считать первоначальным критерием нежелательности поста - отправление в скрап при незарегистрированности пользователя. Неудобства с ложными срабатываниями (а нормально обученный байесовый фильтр дает их ОЧЕНЬ мало) решаются регистрацией на форуме. Этот фильтр будет отсеивать не только спамеров, но и любые нежелательные посты (которые похожи на те, что УЖЕ отправлены в скрап на столько-то процентов). При этом отсеиваться будут любые боты (программные или аппаратные - ну, те у которых две руки две ноги). Им легче пойти постить на оставшиеся 1000 форумов, чем заморачиваться и долго подбирать текст для обхода фильтра.

При правильной организации словаря (хеш-таблица) вычисление апостериорной вероятности нежелательности письма будет происходить весьма быстро и не скажется ни на нагрузке на сервер (тот же запрос к БД на добавление поста должен отрабатываться дольше) ни на визуальной задержке при добавлении.

> > P.S. или вообще доступ на запись дать только
> > зарегистрированным
>
> Это точно вряд ли.
я об этом думал 31.01.05 14:54  
Автор: dl <Dmitry Leonov>
<"чистая" ссылка>
Но пока постараюсь обойтись более простыми способами, варианты еще остались.
Словарь - можно, доступ на запись только для регистрированных - вряд ли 31.01.05 11:19  
Автор: amirul <Serge> Статус: The Elderman
<"чистая" ссылка>
1




Rambler's Top100
Рейтинг@Mail.ru


  Copyright © 2001-2024 Dmitry Leonov   Page build time: 0 s   Design: Vadim Derkach