Распознавание кодировок
libenca
Спасибо
А есть что-нибуть подобное enca только мультиязычное? Т.е что бы не надо было привязыватся к определенному языку?
Content-Language:
хотя какой там CL, если кодировку угадывать надо.
Блин, да это очень громоздкая должна быть функциональность. Хоть как-то множество возможных языков сократить можно?
Я и сам понимаю что такая вряд ли есть, но научник думает почему-то по другому Впрочем я уже его переубедил =)
ыы. по частоте встречаемости букв чтоли?n-грамм.
порой такое приходит что и без m-грамм не разберёшься =)
http://libcharguess.sourceforge.net/
вот вроде распознавалка мультиязычная и мультикодировочная. что думаете ?;)
вот вроде распознавалка мультиязычная и мультикодировочная. что думаете ?;)
Крутая вещь вроде как, это обертка для Mozilla charset detection algorithm. Мультиязычная, на сайте можно посмотреть че да как(в смысле мозиловском) =)
Оставить комментарий
Vincet86
Нужна с++ библиотека для распознавания кодировки по тексту, ну и приветствовалось бы конечно что бы она и конвертить умела) Но основное это автоматическое распознавание кодировки. Никто не встречал таковой?