информационная безопасность
без паники и всерьез
 подробно о проектеRambler's Top100
Все любят медСтрашный баг в WindowsАтака на Internet
BugTraq.Ru
Русский BugTraq
 Анализ криптографических сетевых... 
 Модель надежности двухузлового... 
 Специальные марковские модели надежности... 
 Шестой Perl превратится в Raku,... 
 Kik закрывается, все ушли на криптофронт 
 Sophos открывает Sandboxie 
главная обзор RSN блог библиотека закон бред форум dnet о проекте
bugtraq.ru / форум / programming
Имя Пароль
ФОРУМ
если вы видите этот текст, отключите в настройках форума использование JavaScript
регистрация





Легенда:
  новое сообщение
  закрытая нитка
  новое сообщение
  в закрытой нитке
  старое сообщение
  • Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
  • Новичкам также крайне полезно ознакомиться с данным документом.
Однозначно определить язык невозможно. Но... 28.06.02 06:25  Число просмотров: 647
Автор: HandleX <Александр Майборода> Статус: The Elderman
<"чистая" ссылка>
Можно это делать с высокой долей вероятности. Для этого нужно использовать таблицы частотного распределения символов в текстах.
Ты сам их можешь создать, прелопатив тексты, подобные почтовым.
Вот как это делает FAR Manager, к примеру? Если надо автоматически определять язык (русский), то обязательно в него доставляется словарь Dist_Rus.reg - это он и есть. Посмлтри на него, может поможет ;-))))))))
<programming>
[Perl] Вопрос: как распознать язык сообщения? 27.06.02 11:39  
Автор: vond Статус: Незарегистрированный пользователь
<"чистая" ссылка>
Прикручиваю к почтовому веб-интерфейсу проферку орфографии aspell/pspell.
Надо чтобы автоматически выбирался нужный словарь.
Please, подкиньте идеи, ссылки - как распознать язык, на котором написано сообщение.
[Perl] Вопрос: как распознать язык сообщения? 29.06.02 17:32  
Автор: ex_c_eption Статус: Незарегистрированный пользователь
<"чистая" ссылка>
Лучше всего конечно дать возможность юзеру выбирать язык. Все остальные методы - гемморойные и не 100%.
Еще можно смотреть на CodePage в которой работал юзер.
тривиальная идея 28.06.02 00:52  
Автор: 123mitya Статус: Незарегистрированный пользователь
<"чистая" ссылка>
> Прикручиваю к почтовому веб-интерфейсу проферку орфографии
> aspell/pspell.
> Надо чтобы автоматически выбирался нужный словарь.

использовать UTF8 , таким образом однозначно отделяя латиницу от кириллицы. Потом, в зависимости от результатов, натравливать *spell с определенными группами словарей.
Однозначно определить язык невозможно. Но... 28.06.02 06:25  
Автор: HandleX <Александр Майборода> Статус: The Elderman
<"чистая" ссылка>
Можно это делать с высокой долей вероятности. Для этого нужно использовать таблицы частотного распределения символов в текстах.
Ты сам их можешь создать, прелопатив тексты, подобные почтовым.
Вот как это делает FAR Manager, к примеру? Если надо автоматически определять язык (русский), то обязательно в него доставляется словарь Dist_Rus.reg - это он и есть. Посмлтри на него, может поможет ;-))))))))
1






Rambler's Top100
Рейтинг@Mail.ru


  Copyright © 2001-2019 Dmitry Leonov   Page build time: 0 s   Design: Vadim Derkach