Легенда:
новое сообщение
закрытая нитка
новое сообщение
в закрытой нитке
старое сообщение
|
- Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
- Новичкам также крайне полезно ознакомиться с данным документом.
походу так всё и есть 22.11.05 00:26 Число просмотров: 2707
Автор: NKritsky <Nickolay A. Kritsky> Статус: Elderman
|
И тебе поздорову!
> Доброго здоровья! > Многие уже сталкивались с вопросом фильтрации тегов. Задача > в основном одна - реализовать возможность использования > правильно составленных структур, не влияющих на > безопасность сайта. Я к ним отношу, например, простые > ссылки на http/https/ftp ресурсы. > Для правильной фильтрации решил ознакомиться с > соответствующими стандартами. > Нашел доходчивое описание формата URL в RFC1738 > В качестве "фильтра" решил использовать PCRE. > Первая версия регулярного выражения была написана, что > называется "в лоб" > Как описано в RFC, так и задаю в пкре-регкспе. Результат > потрясающий - партен более полутора килобайт. > Решил оптимизировать конструкции. Например в пятом разделе > (это страница 17) описывается непосредственно формат URL. > Пример:
<skipped>
> Вот и возникает вопрос. > Что бы отбросить, для уменьшения размера партенов > - следовательно - увеличения скорости работы? > Конечно же, оптимальный по скорости вариант - > "/<a\shref=(.*?) > >(.*?)<\/a>/" , > Но его качество оставляет желать лучшего. > Может быть все не так уж и плохо? и регексп на четыре сотни > символов это не "ужас" ? ;)
Я почитал, посмотрел, - похоже что не ужас. Просто в BNF это всё немножко прикольней читается за чет использования "макросов". А что скорость парсинга - есть претензии? Тестировал?
|
|
|