Прога для борьбы с тавтологией

ctm7562631

Никто часом не встречался с программой, которая находит в тексте тавтологию, то есть употребление одних и тех же слов или однокоренных слов в пределах одного абзаца, раздела?

Helga87

Никто часом не встречался с программой, которая находит в тексте тавтологию, то есть употребление одних и тех же слов или однокоренных слов в пределах одного абзаца, раздела?

Serab

Как-то ты ненаглядно
Никто часом не встречался с программой, которая находит в тексте тавтологию, то есть употребление одних и тех же слов или однокоренных слов в пределах одного абзаца, раздела?

lubanj

кажется ворд всегда умел это делать. и относил к стилистике (зеленой волной подчеркивал)
может там где-то галочки-опции какие-то есть

kotenok1710

разве в пределах одного абзаца - это тавтология?
Конечно, если одно предложение повторяет другое, ну это уже клиника...

bestpilot8

Конечно, если одно предложение повторяет другое, ну это уже клиника...
Вовсе нет, это может быть всего лишь лекция. :)

Helga87

я тут чо-то накропал: http://anti-dup.appspot.com/

Замечания принимаются. Если вдруг не заломает, даже учту их.

reallyjust

 
Маслом масло не испортишь.

прокатило без ошибок

General213

Это среднее между "масло масляное" и "кашу маслом не испортишь"? Затейник :)

stm4836248

Правильнее писать "Искать тавтологию", я думаю )

kruzer25

"Найти результаты вхождения тавтологий в введённый тавтологичный результат".

Helga87

прокатило без ошибок
я там ща не очень агрессивный/умный стемминг включил. Наверное, стоит более жестко склеивать разные формы речи.

lubanj

http://anti-dup.appspot.com/
page not found

Helga87

у меня работает. Попробуй нажать F5, что ли

lubanj

и ф5 и ктрл+ф5. без эффекта. и в другом браузере тоже
//у других пашет. наверное пора мне делать ребут

yroslavasako

Конечно, если одно предложение повторяет другое, ну это уже клиника...
Как говорилось в лекции о женской логике, от повторения аргументов их значимость всё больше возрастает

Serab

Замечания принимаются. Если вдруг не заломает, даже учту их.
Опять же. Как-то у тебя странно «воспринималка» работает. Надо одним цветом выделять одинаковые слова. Человеческий мозг так и работает: он объединяет одноцветные слова в данном случае в одну группу: увидит все повторения ясно и отчетливо.
Он не будет выстраивать соответствие между синими и красными словами, тем более если их порядок перепутан. Вот сравни:
одних и тех же слов или однокоренных слов в пределах одного
одних и тех же слов или однокоренных слов в пределах одного
последнее слово и вообще непонятно каким цветом делать, поэтому я пометил его зеленым.

Helga87

Чо-то поправил:

зы. есть явные недочеты у стеммера, ща попробую прикрутить более грамотный.

altair

Одно время пользовался плагином Diser к Ворду. В нем была функция по поиску повторяющихся слов.

Helga87

Исправил мелкий баг, теперь чуть больше дубликатов находит.

Serab

Так все равно же «одним» и «работает» красным цветом делает.

Serab

там еще есть слова «цвет» и «одноцветную».

Helga87

Так все равно же «одним» и «работает» красным цветом делает.
я решил не делать гирлянду. Он использует только красный и синий цвета. Это лучше, чем просто красный и лучше чем, когда количество используемых цветов становится больше 4 (черный, белый, красный, синий).
И да, со двухосновными словами алгоритм не работает. Ужасно!

ctm7562631

я решил не делать гирлянду. Он использует только красный и синий цвета. Это лучше, чем просто красный и лучше чем, когда количество используемых цветов становится больше 4

тогда может эффективнее сделать кнопку "далее" и выводить за раз только одну группу повторяющихся слов.

Serab

я решил не делать гирлянду. Он использует только красный и синий цвета. Это лучше, чем просто красный и лучше чем, когда количество используемых цветов становится больше 4 (черный, белый, красный, синий).
Лучше когда текст не дает повода делать гирлянду. А если уж дал, то чего стыдиться?

Helga87

Лучше когда текст не дает повода делать гирлянду. А если уж дал, то чего стыдиться?
задача: для данного текста визуализировать проблемы наилучшим для мозга способом. При наличии большого количества цветов задача сопоставления пар выбивается из кеша, и становится напряжной для мозга.

Helga87

тогда может эффективнее сделать кнопку "далее" и выводить за раз только одну группу повторяющихся слов.
можно, но ломает. Если кто хочет, могу дать исходники и даже с возможностью залить на anti-dup.appspot.com.
Еще есть мысль, что можно при наведении мышкой на слово, подсвечивать пару к нему. Это даже сделать очень просто.

reallyjust

"Масляное масло" таки не выделяет.

Helga87

fixed

Он не знал про суффикс "ян" в прилагательных.

igorpopkoff

Что-то на предлоги и частицы слишком усердно ругается. "Ни то, ни другое" оказывается тавтологией.

Helga87

да, надо бы черный список подключить слов типа ни, то, или.
Оставить комментарий
Имя или ник:
Комментарий: