Юникод и текстовый редактор

fotoalex

Конкретизирую свое затруднение:
Заигрался я в Ил-2: забытые сражения.
Скачал из инета кампанию 100 исторически правдоподобных миссий за немецкого летчика.
Кампания англоязычноая (тексты предвылетного инструктажа) , но на неком русском форуме она потихоньку, общими усилиями, переводиться.
Чтобы этот инструктаж был виден в игре, нужно записать в соответсвующий файл текст в формате юникод (это вроде как в ридми написано - при редактировании текстов используйте юникод)
Русский текст в формате юникод выглядит так:
Description \n\u041F\u043E\u0434 \u0443\u0434\u0430\u0440\u0430\u043C\u0438 \u043F\u0440\u0435\u0432\u043E\u0441\u0445\u043E\u0434\u044F\u0449\u0438\u0445 \u0441\u0438\u043B \u043F\u0440\u043E\u0442\u0438\u0432\u043D\u0438\u043A\u0430, \u043D\u0430\u0448\u0438 \u0432\u043E\u0439\u0441\u043A\u0430 \u043E\u0441\u0442\u0430\u0432\u0438\u043B\u0438 \u043D.\u043F \u0424\u0435\u043E\u0434\u043E\u0441\u0438\u044F.\n\n\u0414\u0430\u0442\u0430: 10 \u043C\u0430\u044F 1942\n\u0412\u0440\u0435\u043C\u044F:
(взято из файла "родной" миссии)
========
Вопрос: как перевести текст из обычного читаемого формата в юникод?

artimon

Это не Юникод.
Юникод, это когда один символ кодируется несколькими байтами. Двумя в UTF-16 или от 1 до 5 в UTF-8.
Может я соврал в деталях, но смысл такой.

fotoalex

а что, и с чем это едят?

irina-sokolov

используешь прогу native2ascii.exe

fotoalex

а что за прога?
у нас в фдсе (по результатам поиска) есть только на одном компе и он сейчас выключен (

Belladonna

Судя по всему, это RTF

irina-sokolov

ставишь или смотришь внутрь любого дистрибутива jsdk. У меня 1.3.1_02 стоит. Там в директории bin лежит.

Ramses

unicode.org
man sed
man awk
---
...Всё в наших RU.KAX...

fotoalex

если честно, мне не стало легче.
За прогу спасибо, но под 2000-ой виндой она запускается и тут же закрывается.
Пойду спать, завтра буду разбираться
Вопрос тогда меняется: как перевести текст из обычного формата (кои-8, виндоуз) в непонятный (\u043F\u0440\u0435\u0432\u043E\u0441\u0445\u043E\u0434\u044F\u0449\u0438\u0445 \u0441\u0438\u043B \u043F\u0440\u)?

irina-sokolov

давно так не смеялся
ты в cmd запусти. Если не поможет, добавь в конце /?

fotoalex

тогда специально для тебя продолжение:
После запуска:
Error opening registry key 'Software\Javasoft\Java Runtime Enviroment'
Error: could not find java.dll
Error: could not find Java 2 Runtime Environment.
=
Ну это я уже понимаю, что написано

irina-sokolov

тогда придется поставить jsdk
или попросить кого-нибудь.

fotoalex

Наверное я буду брифинги к миссиям из самолетного форума читать.
Хотя оставлю озвученные вопросы открытыми, jsdk не предлагать

artimon

Маза вспомнить про sed, perl или awk.

Belladonna

вариант а)Пишешь текст в Win1251
Берёшь визуалку и пишешь программу, использующую функцию MultibyteToWideChar или WideCharToMultiByte, не помню точно... читаешь Win1251, преобразовываешь - получаешь Юникодовую строку, её записываешь её в другой файл по формату "\\u%d",wc для каждого символа...
вариант б)Пишешь текст в Блокноте... сохраняешь в Unicode-формате
Берёшь любой язык программирования и пишешь следующую прогу:
- считать 2 байта как целое число rd (ну или считать 2 символа a и b и перевести rd = 256*a+b)
- записать в выходной файл по формату "\\u%d",rd
Наслаждаться

irina-sokolov

есть еще jre
Оставить комментарий
Имя или ник:
Комментарий: