Алгоритм нестрогого сравнения строк

Corrector

Имеется огромная база данных по списку книжек, которая набиралась разными людьми
В этой бд есть одинаковые книжки, написание которых разными людьми отличаются лишним
пробелом, опечатками, знаками препинания и т.д.
Надо выловить дубли, при этот не обойтись без нестрого сравнения строк.
Есть ли такие алгоритмы?

kamputer

>Есть ли такие алгоритмы?
Есть

Corrector

А где про них почитать?

avinir60

Если хочешь найти именно дубли, проще сравнивать по размеру.

kamputer

>А где про них почитать?
Бля

xronik111

Можно посмотреть здесь и еще (ссылка есть в первом урле) здесь.
Оставить комментарий
Имя или ник:
Комментарий: