Легенда:
новое сообщение
закрытая нитка
новое сообщение
в закрытой нитке
старое сообщение
|
- Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
- Новичкам также крайне полезно ознакомиться с данным документом.
[Perl] все хранить в уникоде, запросы делать в той кодировке,... 29.06.06 20:51 Число просмотров: 2451
Автор: TLoD,Snake Статус: Незарегистрированный пользователь
|
> > Как корректно разрулить вопрос с кодировками? То есть > будет > > ли HTML::Parser корректно разбирать файлы, не зная что > там > > внутрях? В основном, конечно вопрос касаемо юникода. > > Если пытаться энкодить все получаемое в UTF8, то > насколько > > я понимаю, может получиться, что отправляя последующие > > запросы я буду давать параметры запроса в неверной > > кодировке и ничего не получать обратно.. То есть > > неюникодные ресурсы могут на меня за такое обидеться. > > Как сделать универсально? > > все хранить в уникоде, запросы делать в той кодировке, > какую просят.
Тогда соответственно два вопроса, как и чем переводить то, что получено в юникод (UTF8?)? Надеяться, что чарсет будет в хедерах?
И, соответственно, как потом переводить юникод обратно? Это получается надо где-то хранить метку в каком чарсете делать последующие запросы с этой страницы?
Опять же, получается, надо будет отдавать HTML::Parser-у юникодный файл. Если он хавает юникодный фал нормально, то получается он настолько же нормально отдаст мне все данные, которые будут тоже в юникоде и я их совершенно прозрачно запихиваю их в параметры запроса в LWP.
Схема работы должна быть примерно такова:
LWP -> File -> HTTP::Parser -> (Storable) -> LWP
|
|
|