Определить, в какой кодировке текст
Значит это полный П.
В свое время тоже пытался нечто подобное сделать.
Не опознаваемый Штирлицем файл не удалось восстановить чем-либо другим.
Судя по всему, где-то отрезалась часть информации.
У меня такая проблема была с почтовым сообщением, и я подозреваю, что там кто-то по дороге обрезал 8-й бит.
Не знаю, бывает ли сейчас такое.
Не опознаваемый Штирлицем файлУ меня вообще сложилось впечатление, что он некоторые кодировки просто не знает - по крайней мере как-то он не смог перекодировать текст, который я после некоторого перебора перекодировал за одну операцию.
Но тут так не получилось
![](/images/graemlins/frown.gif)
Еще раньше у него были проблемы, когда присутствовала латинница (мб это кстати как раз из-за попытки просечь отрезание 8-го бита) - сейчас не знаю, не проверял.
что там кто-то по дороге обрезал 8-й битНу по крайней мере эту ситуацию можно определить по тому, что у всех символов сообщения 8-й бит равен 0 - или не все так просто?
Ну по крайней мере эту ситуацию можно определить по тому, что у всех символов сообщения 8-й бит равен 0Отрезание восьмого бита и обнуление восьмого бита - разные вещи
![](/images/graemlins/wink.gif)
Или тогда текст считается как упакованный 7-битный?
Когда ты отрезаешь половину изрисованного листа, это не значит, что эта половина становится белой.
Ты на пальцах объяснить можешь, что ты имеешь в виду?
Берём текст в восьмибитной кодировке, отрезаем каждый восьмой бит.
Получаемтекст, по которому вообще ничего не понять.
А смешанные тексты не так уж често попадаются.
Берём текст в восьмибитной кодировке, отрезаем каждый восьмой бит.
Не понимаю, чем это противоречит
Ну по крайней мере эту ситуацию можно определить по тому, что у всех символов сообщения 8-й бит равен 0
![](/images/graemlins/confused.gif)
Вот картинка, так должно быть понятнее:
*00**0** - нормальный байт
*00**0* - отсутствует 8-ой бит (про это говорит Пенартур)
*00**0*0 - обнуленный 8-ой бит (про это говоришь ты)
![](/images/graemlins/frown.gif)
Так что мб он что-то еще имел в виду...
А теперь скажи, какой вариант происходит в 7-битных почтовых серверах?
![](/images/graemlins/wink.gif)
Тем, что восьмой бит, например, первого байта (если считать слева направо) - будет совпадать с первым битом исходного второго байта.
![](/images/graemlins/grin.gif)
Оставить комментарий
durka82
Нужно определить, что случилось с текстом после перекодировок.Известно, что когда-то это был текст dos (комментарии к коду программы но теперь он так просто не конвертится.
Попробовал несколько прог, в том числе и Штирлиц - не помогло
Вот пример:
Мб как-нибудь можно восстановить?