Имеется огромная база данных по списку книжек, которая набиралась разными людьми
В этой бд есть одинаковые книжки, написание которых разными людьми отличаются лишним
пробелом, опечатками, знаками препинания и т.д.
Надо выловить дубли, при этот не обойтись без нестрого сравнения строк.
Есть ли такие алгоритмы?
kamputer
>Есть ли такие алгоритмы?
Есть
Corrector
А где про них почитать?
avinir60
Если хочешь найти именно дубли, проще сравнивать по размеру.
Corrector
Имеется огромная база данных по списку книжек, которая набиралась разными людьмиВ этой бд есть одинаковые книжки, написание которых разными людьми отличаются лишним
пробелом, опечатками, знаками препинания и т.д.
Надо выловить дубли, при этот не обойтись без нестрого сравнения строк.
Есть ли такие алгоритмы?