Автоматизированный поиск кирилических символов

grey1970

Есть английский текст внутри которого спородически встречаются кирилика или иные символы, которые не отображаются данным шрифтом. Нужно эту кирилику найти и заменить. Есть ли прога которая находит такие символы?

uncle17

тут всё от кодировки зависит... а найти-то не проблема. Самый простой вариант - берешь текст, побуквенно просматриваешь, берешь коды каждого символа и, если в какой-то нужный интервал не лезут, то заменяешь.

grey1970

Ну так я буду всю жизнь просматривать, а автоматически это можно сделать? В смысле, чтобы находились те символы, которые выходят за определенные рамки?

AlexV769

Если это обчный текстовый файл - пишется прога с бинарным доступом к файлу и делается то, что ты хочешь.

uncle17

ну... собсно я и предлагал прогу написать. Только надо сообразить, что фильтровать, а что - нет. Знаки препинания всякие там...

maggi14

Возьми ворд, устрой замену по регекспам (там не совсем регекспы, но что-то похожее) и не парься. МультиЭдит умеет с настоящими регекспами замену делать.

margadon

А не судьба просто отрезать всё, что по коду больше 127? (или я не понял вопрос)

grey1970

Прогу с бухты барахты я написать не смогу, поскольку ваще зоолог.
Но попробую написать макрос в ворде.
[] что такое регекспы
[] как отрпезать и что это даст?
Дело в том что при наборе огромного текста, некоторые люди набили руское С вместо латинского , русское Р вместо латинского P и т.д. или вообще использовали непонятные символы.

maggi14

Регулярные выражения. Например, можешь сказать: найти все символы с номерами, большими 127, и укоротить их на 127.
А что мешает просто в ворде взять и помменять Ctrl-H все вхождения эс на цэ и т.д.?

grey1970

Так кончно проще всего, но невозможно контролировать, например заменит большую А маленкой а. Надо заменить коды. Что то я не въехал как можно в ворде искать все символы болше ^127.

maggi14

Не заменит. Скажи кейс-сенситив.
Как искать в Ворде по кодам, не знаю. Вероятно, можно, но на память не скажу. Может, и нельзя.

grey1970

Дп действительно так можно, и проще написать макрос. Чем я сейчас и занимаюсь.
Но еще остаются иные символы не кирилические которые, также не отображаютя. Например греческие символы я беру из Symbol. и никаких проблем у меня никогда не возникало. Но в этом тексте использованы расширения шрифтов. И честно говоря я просто не имею понятия сколько таких ньюансов в тексте и как их все обнаружить.
Вариант найти все более 127 очень даже подходит но как это реализовать?

maggi14

Может, проще шрифты установить?

grey1970

Не проще, поскольку эта книга уйдет за границу и будет печататься там. К тому же сам факт неприятен

grey1970

Всем спасиб, VBA рулит

stm7884696

книга в ВОРДЕ?
бля, народ, убейте автора...
есть же техи всякие и тому подобный кал.... СПЕЦИАЛЬНО для того, что юбы такого и другого говна с символами, абзацами, разметкой и хз еще чем не происходило....

grey1970

Если ты меня хочешь убить, то попал не по адресу.
Лично мне она попала в ворде для того, что бы я зделал из нее что-нибудь удобоваримое.
А верстать в ворде - это действительно глаз на жопу натягивать. Но у меня много других дел, по этому я этим не занимаюсь.
Оставить комментарий
Имя или ник:
Комментарий: