информационная безопасность
без паники и всерьез
 подробно о проектеRambler's Top100
Страшный баг в WindowsSpanning Tree Protocol: недокументированное применение
BugTraq.Ru
Русский BugTraq
 Анализ криптографических сетевых... 
 Модель надежности двухузлового... 
 Специальные марковские модели надежности... 
 Microsoft Authenticator прекращает... 
 Очередное исследование 19 миллиардов... 
 Оптимизация ввода-вывода как инструмент... 
главная обзор RSN блог библиотека закон бред форум dnet о проекте
bugtraq.ru / форум / programming
Имя Пароль
если вы видите этот текст, отключите в настройках форума использование JavaScript
ФОРУМ
все доски
FAQ
IRC
новые сообщения
site updates
guestbook
beginners
sysadmin
programming
operating systems
theory
web building
software
hardware
networking
law
hacking
gadgets
job
dnet
humor
miscellaneous
scrap
регистрация





Легенда:
  новое сообщение
  закрытая нитка
  новое сообщение
  в закрытой нитке
  старое сообщение
RegExp HELP! как \".\" включая \".\\\".\" 22.01.04 07:51  
Автор: vitaliy_m Статус: Незарегистрированный пользователь
<"чистая" ссылка>
Надо грамотно разобрать лог Апача, где очень много побобного:
... "-" "...Windows NT 5.0; \".......\" ..."
Как с этими \" боротся? Я уже два дня над этим ... Ж%-[]
а если позаменять все \" на просто " 22.01.04 13:58  
Автор: ZaDNiCa <indeed ZaDNiCa> Статус: Elderman
<"чистая" ссылка>
и дальше уже потом спокойно обрабатывавать лог?
А парность кавычек при этом не потеряется? 22.01.04 16:57  
Автор: amirul <Serge> Статус: The Elderman
<"чистая" ссылка>
> и дальше уже потом спокойно обрабатывавать лог?
Насколько я понял проблема как раз в том, чтобы найти пару открывающая-закрывающая, пропуская при этом все проэскейпленные.

Когда закавыченный кусок вырезан, разэскейпировать внутренности - как раз не проблема.
Угу, протормозил, виноват 22.01.04 18:51  
Автор: Ktirf <Æ Rusakov> Статус: Elderman
<"чистая" ссылка>
Для этого случая у Фридла в "Регулярных выражениях" была какая-то колбаса, но сейчас я ее по памяти не воспроизведу :(
Совершенно верно - так не покатит 22.01.04 18:31  
Автор: vitaliy_m Статус: Незарегистрированный пользователь
<"чистая" ссылка>
Согласен, по-моему, проще сначала унифицировать разделители 22.01.04 15:44  
Автор: Ktirf <Æ Rusakov> Статус: Elderman
<"чистая" ссылка>
Они и так унифицированны (User Agent ограничен двойными кавычками) 22.01.04 18:34  
Автор: vitaliy_m Статус: Незарегистрированный пользователь
<"чистая" ссылка>
Не уверен, но просто нужно искать любое количество \\\" и других символов, ограниченных двумя \" 22.01.04 11:48  
Автор: amirul <Serge> Статус: The Elderman
<"чистая" ссылка>
> Надо грамотно разобрать лог Апача, где очень много
> побобного:
> ... "-" "...Windows NT 5.0; \".......\" ..."
> Как с этими \" боротся? Я уже два дня над этим ... Ж%-[]
Что-то типа такого/\\"(?:\\\\\\")*\\"/
Насчет альтернативы с точкой я не уверен, лучше туда включить все, кроме \ и "

Greedy поиск найдет самую длинную подстроку, соотвествующую данному регексу
Не работает - там бекслеши внунтри есть 22.01.04 18:44  
Автор: vitaliy_m Статус: Незарегистрированный пользователь
Отредактировано 22.01.04 18:45  Количество правок: 1
<"чистая" ссылка>
> Что-то типа такого/\\"(?:\\\\\\")*\\"/
> Насчет альтернативы с точкой я не уверен, лучше туда
> включить все, кроме \ и "
Ну оно примерно так и было /\"([^\"]*)\"/ Только так поиск отваливается на проэскейпленных ковычках.

/\"([^\"\\]*)\"/ то же не кактит - на вот таком клиенте:

"Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0; \xd2\xce \"\xcd\xce\xc2\xc8\xcd\xc8\" (\xb2\xed\xf4\xee\xf0\xec\xe0\xf6\xb3\xe9\xed\xe8\xe9 \xe2\xb3\xe4\xe4\xb3\xeb))"
Не, для этого случая есть специальный паттерн в регвырах 22.01.04 18:52  
Автор: Ktirf <Æ Rusakov> Статус: Elderman
Отредактировано 22.01.04 18:54  Количество правок: 1
<"чистая" ссылка>
Фридл, "Регулярные выражения" - там очень изящная обработка получается - штука называется "раскрутка циклов", если ничего не путаю.
1




Rambler's Top100
Рейтинг@Mail.ru


  Copyright © 2001-2025 Dmitry Leonov   Page build time: 0 s   Design: Vadim Derkach