информационная безопасность
без паники и всерьез
 подробно о проектеRambler's Top100
Сетевые кракеры и правда о деле ЛевинаАтака на Internet
BugTraq.Ru
Русский BugTraq
 Анализ криптографических сетевых... 
 Модель надежности двухузлового... 
 Специальные марковские модели надежности... 
 Microsoft Authenticator прекращает... 
 Очередное исследование 19 миллиардов... 
 Оптимизация ввода-вывода как инструмент... 
главная обзор RSN блог библиотека закон бред форум dnet о проекте
bugtraq.ru / форум / programming
Имя Пароль
если вы видите этот текст, отключите в настройках форума использование JavaScript
ФОРУМ
все доски
FAQ
IRC
новые сообщения
site updates
guestbook
beginners
sysadmin
programming
operating systems
theory
web building
software
hardware
networking
law
hacking
gadgets
job
dnet
humor
miscellaneous
scrap
регистрация





Легенда:
  новое сообщение
  закрытая нитка
  новое сообщение
  в закрытой нитке
  старое сообщение
Однозначно определить язык невозможно. Но... 28.06.02 06:25  Число просмотров: 1041
Автор: HandleX <Александр М.> Статус: The Elderman
<"чистая" ссылка>
Можно это делать с высокой долей вероятности. Для этого нужно использовать таблицы частотного распределения символов в текстах.
Ты сам их можешь создать, прелопатив тексты, подобные почтовым.
Вот как это делает FAR Manager, к примеру? Если надо автоматически определять язык (русский), то обязательно в него доставляется словарь Dist_Rus.reg - это он и есть. Посмлтри на него, может поможет ;-))))))))
<programming>
[Perl] Вопрос: как распознать язык сообщения? 27.06.02 11:39  
Автор: vond Статус: Незарегистрированный пользователь
<"чистая" ссылка>
Прикручиваю к почтовому веб-интерфейсу проферку орфографии aspell/pspell.
Надо чтобы автоматически выбирался нужный словарь.
Please, подкиньте идеи, ссылки - как распознать язык, на котором написано сообщение.
[Perl] Вопрос: как распознать язык сообщения? 29.06.02 17:32  
Автор: ex_c_eption Статус: Незарегистрированный пользователь
<"чистая" ссылка>
Лучше всего конечно дать возможность юзеру выбирать язык. Все остальные методы - гемморойные и не 100%.
Еще можно смотреть на CodePage в которой работал юзер.
тривиальная идея 28.06.02 00:52  
Автор: 123mitya Статус: Незарегистрированный пользователь
<"чистая" ссылка>
> Прикручиваю к почтовому веб-интерфейсу проферку орфографии
> aspell/pspell.
> Надо чтобы автоматически выбирался нужный словарь.

использовать UTF8 , таким образом однозначно отделяя латиницу от кириллицы. Потом, в зависимости от результатов, натравливать *spell с определенными группами словарей.
Однозначно определить язык невозможно. Но... 28.06.02 06:25  
Автор: HandleX <Александр М.> Статус: The Elderman
<"чистая" ссылка>
Можно это делать с высокой долей вероятности. Для этого нужно использовать таблицы частотного распределения символов в текстах.
Ты сам их можешь создать, прелопатив тексты, подобные почтовым.
Вот как это делает FAR Manager, к примеру? Если надо автоматически определять язык (русский), то обязательно в него доставляется словарь Dist_Rus.reg - это он и есть. Посмлтри на него, может поможет ;-))))))))
1




Rambler's Top100
Рейтинг@Mail.ru


  Copyright © 2001-2025 Dmitry Leonov   Page build time: 0 s   Design: Vadim Derkach