использование kdict, locale, koi8-r, utf-8

Elina74

Поставил себе dict - сервер. Это сервер для поиска, например перевода слов на разные языки. Словари у меня только в кодировке utf-8. А система работает в некой локали "С", которая, как я подозреваю на самом деле koi8-r.
Проблема в чем? Когда я из командной строки перевожу, например, слово father, получаю в том числе перевод типа

From English-Russian Freedict dictionary [eng-rus]:
father [fи▒к░ц╟и≥r]
п╬я┌п╣я├
п╬я┌п╣я├
Когда пытаюсь сделать перевод с русского на английский, получаю сообщение
The request is not a valid UTF-8 string
Когда пользуюсь kdict - некая GUI-шная прога, с английского на русские слова она переводит хорошо. А вот на вход русские слова не берет. Также ругается на кодировку. Подавай ему UTF-8.
Что вообще можно сделать в такой ситуации?

IvladV71

iconv не пробовал?

Elina74

Не знаю, как из командной строки им пользоваться... в смысле перекодировать не файл, а слово из командной строки.

IvladV71

| ?

IvladV71

и нах перекодировать из ком строки, если можно всю базу слов перекодить?

Elina74

Че-то я не смог

iconv -fUTF-8 -tKOI8-R eng-rus.dict.dz
iconv: illegal input sequence at position 1

iconv -f UTF-8 -t KOI8-R eng-rus.dict.dz
iconv: illegal input sequence at position 1
В том файле с самого начала несколько строк на английском, потом такое:

ABC
п╟п╥п╠я┐п╨п╟; п╟п╩я└п╟п╠п╦я┌
Abyssinia
п╜я└п╦п╬п©п╦я▐

Chupa

> iconv -fUTF-8 -tKOI8-R eng-rus.dict.dz
ты б её сначала разморозил разгзиповал то есть

maggi14

попробуй gdict и прочие dict-клиенты

IvladV71

а ты уверен, что словари не заархивлены?

Elina74

Уверен, не зазипованные. Там вполне читаемые английские словарные статьи, упорядоченные по алфавиту, после которых нечитаемый перевод.

Makc500

ты наверое из mc смотришь?

IvladV71

или less

Elina74

Ага... gedit сказал, что не может определить кодировку и умер.

Chupa

> и нах перекодировать из ком строки, если можно всю базу слов перекодить?
кстати, если там есть транскрипция, то нахаляву в koi8-r перегнать вряд ли получится
да и без транскрипции левые символы запросто попадаться могут

IvladV71

а кат, тейл или вим чё говорит?

Elina74

Есть транскрипция.
Как распаковать *.dz?

Elina74

а кат, тейл или вим чё говорит?
крякозябли показывают.

IvladV71

везде или тока в русских словах?

IvladV71

gunzip?

Elina74


gunzip -d eng-rus.dict.dz
gunzip: eng-rus.dict.dz: unknown suffix -- ignored
сделал финт ушами:

less eng-rus.dict.dz > tmp
в результате получил распакованный (?) файл, большего объема
когда попытался перекодировать его, получил такое:
ABC
азбука; алфабит
Abyssinia
Эфиопия
Adam's apple
адамовояблоко
Addis Ababa
Аддисiconv: illegal input sequence at position 1766
т.е. перекодировка закончилась, не успев начаться.
Оставить комментарий
Имя или ник:
Комментарий: