информационная безопасность
без паники и всерьез
 подробно о проектеRambler's Top100
Spanning Tree Protocol: недокументированное применениеСетевые кракеры и правда о деле ЛевинаГде водятся OGRы
BugTraq.Ru
Русский BugTraq
 Анализ криптографических сетевых... 
 Модель надежности двухузлового... 
 Специальные марковские модели надежности... 
 Бэкдор в xz/liblzma, предназначенный... 
 Три миллиона электронных замков... 
 Doom на газонокосилках 
главная обзор RSN блог библиотека закон бред форум dnet о проекте
bugtraq.ru / форум / programming
Имя Пароль
ФОРУМ
если вы видите этот текст, отключите в настройках форума использование JavaScript
регистрация





Легенда:
  новое сообщение
  закрытая нитка
  новое сообщение
  в закрытой нитке
  старое сообщение
  • Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
  • Новичкам также крайне полезно ознакомиться с данным документом.
[Perl] Вопрос: как распознать язык сообщения? 29.06.02 17:32  Число просмотров: 920
Автор: ex_c_eption Статус: Незарегистрированный пользователь
<"чистая" ссылка>
Лучше всего конечно дать возможность юзеру выбирать язык. Все остальные методы - гемморойные и не 100%.
Еще можно смотреть на CodePage в которой работал юзер.
<programming>
[Perl] Вопрос: как распознать язык сообщения? 27.06.02 11:39  
Автор: vond Статус: Незарегистрированный пользователь
<"чистая" ссылка>
Прикручиваю к почтовому веб-интерфейсу проферку орфографии aspell/pspell.
Надо чтобы автоматически выбирался нужный словарь.
Please, подкиньте идеи, ссылки - как распознать язык, на котором написано сообщение.
[Perl] Вопрос: как распознать язык сообщения? 29.06.02 17:32  
Автор: ex_c_eption Статус: Незарегистрированный пользователь
<"чистая" ссылка>
Лучше всего конечно дать возможность юзеру выбирать язык. Все остальные методы - гемморойные и не 100%.
Еще можно смотреть на CodePage в которой работал юзер.
тривиальная идея 28.06.02 00:52  
Автор: 123mitya Статус: Незарегистрированный пользователь
<"чистая" ссылка>
> Прикручиваю к почтовому веб-интерфейсу проферку орфографии
> aspell/pspell.
> Надо чтобы автоматически выбирался нужный словарь.

использовать UTF8 , таким образом однозначно отделяя латиницу от кириллицы. Потом, в зависимости от результатов, натравливать *spell с определенными группами словарей.
Однозначно определить язык невозможно. Но... 28.06.02 06:25  
Автор: HandleX <Александр М.> Статус: The Elderman
<"чистая" ссылка>
Можно это делать с высокой долей вероятности. Для этого нужно использовать таблицы частотного распределения символов в текстах.
Ты сам их можешь создать, прелопатив тексты, подобные почтовым.
Вот как это делает FAR Manager, к примеру? Если надо автоматически определять язык (русский), то обязательно в него доставляется словарь Dist_Rus.reg - это он и есть. Посмлтри на него, может поможет ;-))))))))
1




Rambler's Top100
Рейтинг@Mail.ru


  Copyright © 2001-2024 Dmitry Leonov   Page build time: 0 s   Design: Vadim Derkach