информационная безопасность
без паники и всерьез
 подробно о проектеRambler's Top100
Сетевые кракеры и правда о деле ЛевинаЗа кого нас держат?Spanning Tree Protocol: недокументированное применение
BugTraq.Ru
Русский BugTraq
 Анализ криптографических сетевых... 
 Модель надежности двухузлового... 
 Специальные марковские модели надежности... 
 Блокировка российских аккаунтов... 
 Отзыв сертификатов ЦБ РФ, ПСБ,... 
 Памятка мирным людям во время информационной... 
главная обзор RSN блог библиотека закон бред форум dnet о проекте
bugtraq.ru / форум / guestbook
Имя Пароль
ФОРУМ
если вы видите этот текст, отключите в настройках форума использование JavaScript
регистрация





Легенда:
  новое сообщение
  закрытая нитка
  новое сообщение
  в закрытой нитке
  старое сообщение
  • Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
  • Новичкам также крайне полезно ознакомиться с данным документом.
нда... 17.10.02 16:48  Число просмотров: 1157
Автор: dl <Dmitry Leonov>
<"чистая" ссылка>
> Все таки кажется, что иногда возникнет ситуевина, когда
> разобрать слово будет трудно, например если бы это были не
> стихи, то по смыслу было бы догадаться труднее (личное
> мнение). Может фильтрованные слова сделать более похожие на
> первоначальный смысл?

Да вроде и так весьма похоже :) В любом случае, все в руках автора - символы @#$ можно расставлять ведь и самостоятельно.

> > Наконец, фильтр настолько примитивный, что автор, если
> ему
> > совсем уж невмочь, что его корежат, может легко его
> обойти.
> Кстати, могут появиться оригиналы, которые будут пытаться
> обойти фильтр, выдумывая всякие хитрости и сложные слова.

Да ради бога, пусть изгаляются. Фильтр направлен против бездумного использования мата в качестве фона. Это 90 с лишним процентов случаев.
<guestbook>
1dl - считаю нецелесообразным "антимат в юморе 16.10.02 15:40  
Автор: hex.sex <Computer-Hitler> Статус: Elderman
<"чистая" ссылка>
Присоединяюсь. 16.10.02 22:54  
Автор: ZloyShaman <ZloyShaman> Статус: Elderman
<"чистая" ссылка>
а это уже где-то помешало восприятию авторской мысли? :) 16.10.02 16:04  
Автор: dl <Dmitry Leonov>
<"чистая" ссылка>
да, и не раз 16.10.02 16:15  
Автор: hex.sex <Computer-Hitler> Статус: Elderman
<"чистая" ссылка>
примеры в студию, pls 16.10.02 23:48  
Автор: dl <Dmitry Leonov>
<"чистая" ссылка>
Насколько я помню, смысл там вполне сохраняется, а $опа выглядит ничуть не хуже оригинала :)
Не вопрос. Вот пример. 17.10.02 10:43  
Автор: Inkognito <ака сотовый фрикер> Статус: Member
<"чистая" ссылка>
> Насколько я помню, смысл там вполне сохраняется, а $опа
> выглядит ничуть не хуже оригинала :)
Позвольте не согласиться.

Вот тут
неубедительно 17.10.02 15:20  
Автор: dl <Dmitry Leonov>
<"чистая" ссылка>
Во-первых, фильтр отработал там всего два раза на шесть десятков строк.
Во-вторых, потери смысла даже в этих двух местах не наблюдаю (даже интереснее стало - "слово из пяти букв, в творительном падеже оканчивающееся на У" :)
Наконец, фильтр настолько примитивный, что автор, если ему совсем уж невмочь, что его корежат, может легко его обойти.
Ламерский вопрос тут можно ? 17.10.02 16:38  
Автор: PS <PS> Статус: Elderman
<"чистая" ссылка>
Вот выгреб ты из базы запрашиваемый пост. И что дальше ? бежишь по ВСЕМ словам этого поста (причем тут надо еще сделать логику отделения слов друг от друга - не трудно но процессорное время жрет), и каждое слово сравниваешь со всеми словами из словаря (причем сам словарь у тебя может оказаться на диске) ?
Средний пост содержит ~50 слов, те что в юморе - гораздо больше.
Сколько слов в словаре ? 5, 7, 10, 20 ?
пусть 100 слов поста на 10ть словаря. 1000 проверок + логика работы с пробелами, <CR>, <TAB>, ect... + логика замены слов.
А ведь я уверен - подключений и запросов на сервер более 10ти за 1сек...

Это из-за этого скрипта у меня в последнее время форум тормозит ? ;)

P.S. пришлось самому переносить. никакого суппорта ;( ;)
Ламерский вопрос тут можно ? 17.10.02 16:51  
Автор: dl <Dmitry Leonov>
<"чистая" ссылка>
> Вот выгреб ты из базы запрашиваемый пост. И что дальше ?
> бежишь по ВСЕМ словам этого поста (причем тут надо еще
> сделать логику отделения слов друг от друга - не трудно но
> процессорное время жрет), и каждое слово сравниваешь со
> всеми словами из словаря (причем сам словарь у тебя может
> оказаться на диске) ?
> Средний пост содержит ~50 слов, те что в юморе - гораздо
> больше.
> Сколько слов в словаре ? 5, 7, 10, 20 ?
> пусть 100 слов поста на 10ть словаря. 1000 проверок +
> логика работы с пробелами, <CR>, <TAB>, ect...
> + логика замены слов.
> А ведь я уверен - подключений и запросов на сервер более
> 10ти за 1сек...
> Это из-за этого скрипта у меня в последнее время форум
> тормозит ? ;)
> P.S. пришлось самому переносить. никакого суппорта ;( ;)

Регулярные выражения работают все-таки достаточно быстро, вручную по словам я не бегаю. В словаре полтора десятка комбинаций, прошитых в скрипте.
А еще один вопрос можно? 17.10.02 22:12  
Автор: Skeeve [Moscow SubTeam] <Vladimir Medvedev> Статус: Elderman
<"чистая" ссылка>
> > А ведь я уверен - подключений и запросов на сервер
> более 10ти за 1сек...

> Регулярные выражения работают все-таки достаточно быстро,
> вручную по словам я не бегаю. В словаре полтора десятка
> комбинаций, прошитых в скрипте.

А когда происходит фильтрация - при помещении в базу или при извлечении из нее сообщений?
Или иначе - в базе хранится мат или уже заменяющие символы?
А еще один вопрос можно? 17.10.02 22:30  
Автор: dl <Dmitry Leonov>
<"чистая" ссылка>
> А когда происходит фильтрация - при помещении в базу или
> при извлечении из нее сообщений?
> Или иначе - в базе хранится мат или уже заменяющие символы?

На лету при отображении сообщений. Если б фильтрация происходила только при сохранении, вопрос о производительности вообще бы не стоял.
Дальше есть два варианта развития - через некоторое время после окончательной фиксации словаря перенести фильтр на этап сохранения (пробежав при этом по всем старым сообщениям), либо добавить настройку, разрешающую смотреть сквозь фильтр.
И что то мне подсказывает 17.10.02 17:05  
Автор: PS <PS> Статус: Elderman
<"чистая" ссылка>
> Регулярные выражения работают все-таки достаточно быстро,
> вручную по словам я не бегаю. В словаре полтора десятка
> комбинаций, прошитых в скрипте.

И что то мне подсказывает что скрипт написан на perl, который является интерпретатором...
Уже несколько месяцев пытаюсь донести: может не надо накручивать форум всякими "прибамбахами"...
Уже на глаз стало сильно различаться скорость отклика которая была год назад и сейчас.
И что то мне подсказывает 17.10.02 19:26  
Автор: dl <Dmitry Leonov>
<"чистая" ссылка>
> И что то мне подсказывает что скрипт написан на perl,
> который является интерпретатором...
> Уже несколько месяцев пытаюсь донести: может не надо
> накручивать форум всякими "прибамбахами"...
> Уже на глаз стало сильно различаться скорость отклика
> которая была год назад и сейчас.

Скрипты исполняются из-под mod_perl, так что потерь на интерпретацию при каждом обращении практически нет. Возможно, начинает сказываться объем базы сообщений.
нда... 17.10.02 15:57  
Автор: Inkognito <ака сотовый фрикер> Статус: Member
<"чистая" ссылка>
> Во-первых, фильтр отработал там всего два раза на шесть
> десятков строк.
> Во-вторых, потери смысла даже в этих двух местах не
> наблюдаю (даже интереснее стало - "слово из пяти букв, в
> творительном падеже оканчивающееся на У" :)
Все таки кажется, что иногда возникнет ситуевина, когда разобрать слово будет трудно, например если бы это были не стихи, то по смыслу было бы догадаться труднее (личное мнение). Может фильтрованные слова сделать более похожие на первоначальный смысл?
> Наконец, фильтр настолько примитивный, что автор, если ему
> совсем уж невмочь, что его корежат, может легко его обойти.
Кстати, могут появиться оригиналы, которые будут пытаться обойти фильтр, выдумывая всякие хитрости и сложные слова.
нда... 17.10.02 16:48  
Автор: dl <Dmitry Leonov>
<"чистая" ссылка>
> Все таки кажется, что иногда возникнет ситуевина, когда
> разобрать слово будет трудно, например если бы это были не
> стихи, то по смыслу было бы догадаться труднее (личное
> мнение). Может фильтрованные слова сделать более похожие на
> первоначальный смысл?

Да вроде и так весьма похоже :) В любом случае, все в руках автора - символы @#$ можно расставлять ведь и самостоятельно.

> > Наконец, фильтр настолько примитивный, что автор, если
> ему
> > совсем уж невмочь, что его корежат, может легко его
> обойти.
> Кстати, могут появиться оригиналы, которые будут пытаться
> обойти фильтр, выдумывая всякие хитрости и сложные слова.

Да ради бога, пусть изгаляются. Фильтр направлен против бездумного использования мата в качестве фона. Это 90 с лишним процентов случаев.
Дим, а ты какой оригинал имеешь в виду? :)))) 16.10.02 23:52  
Автор: ZloyShaman <ZloyShaman> Статус: Elderman
<"чистая" ссылка>
тот самый, о котором никто конечно же не догадался :) 17.10.02 00:00  
Автор: dl <Dmitry Leonov>
<"чистая" ссылка>
1




Rambler's Top100
Рейтинг@Mail.ru


  Copyright © 2001-2022 Dmitry Leonov   Page build time: 0 s   Design: Vadim Derkach