Как можно искать одинаковый файлы.

vertyal17

Одинаковые содержанием скажем в какойто папке с поддиректориями. Есть ли такие программы? (имя может различаться. Скажем unsоrted.mp3 и я_сам_придумал.mp3 может содержать одно и тоже)

Rico

Файлы одного расширения, в смысле?
Тогда обычный поиск, указываешь папку и найти *.mp3
Или что ты понимаешь под одинаковым содержанием? Песня одинаковая, а названия разные?

LAWD

В фаре есть плагинчик модный.
Уж плагинчик хоть куда...
В разных папках те же файлы
Он находит иногда...

LAWD

"Сравнение папок" зовётся
Сей модный и клёвый плагин.
Название вспомнить заставил
Тупой модератор один.
Который моим тут ответом
Был очень сейчас возмущён.
И властью своею излишней
Похоже ещё окрылён.
К тому же ещё тут добавлю -
Плагин тот есть в фаре любом
Чтоб вдруг не возникло вопросов
Его нам искать где потом.

Natali099099

это не то, чего от тебя просят.
нужно найти одинаковые файлы по содержанию, но разные по имени....

Casha07

по контрольной сумме md5

vertyal17

да, в некотором смысле именно это.
Вообще формально - файлы содержащие одинаковые байты данных. Но возможно имеющие разные имена файлов.
Плугинчик фара такое не находит.

Lenokkk

Сравниваешь например длину файлов. Имеющих одинаковую длину крайне мало, их можно и вручную.

vertyal17

Проблема в том, что так и делаю %) Забодался

kindr-16

1)написать коротенькую програмку
2)поюзать готовую програмку -- need4space

elena-kotenok75

SpaceMan 99 version 3.1
Find duplicate files and folders, and folder sizes

Features
Shows total disk space used by all files under each folder
Shows all files and folders with exact duplicates elsewhere on the system
Provides tools for safe and easy deletion of duplicate files
Full control over how files are compared, including byte-for-byte to guarantee files are duplicates, and whether filenames also need to match
Generates reports that can be printed, or copied into other applications
Works with local disks, or disks accessed across a network
Full support for FAT, FAT-32 and NTFS format partitions
Fully multi-threaded, so the application remains active at all times
Shows sizes in bytes, KB, MB or GB, user selectable or automatic
Familiar and easy to use Windows Explorer style user interface
Могу залить. С кряком.

Ivan8209

ОС?
Недавно было подобное.
sh + ls + sed + awk + md5sum + sort (+ join)
Научись пользоваться GNU textutils и fileutils.
Полдела делается с помощью:
ls -чего-то | sort +сколько-то
---
...Я работаю...

SvinkaVJeansah

Думаю МД5 не катит, т.к. эта штука контроллирует целостность файла => чтоб ее посчитать, по идее, нужно прочитать этот файл. Получается все равно, что сравнивать бит-к-биту. Единственная маза, если МД5 файлов храниться в файловой системе, в чем я сильно сомневаюсь.
Вариант просто сравнивать сколько-то рандомных байтов файла, дату последнего изменения и размер.

Ivan8209

Последовательность такая:
ls | sort | awk | <md5sum> | awk
По шагам.
ls: список файлов с длинами.
sort: упорядочение по длине.
awk: удаление единственно представленных длин и заведомо ненужных (напр., меньше скольки-то)
<md5sum>: подсчёт
awk: выдача итога.
Скорее всего, будут заморочки с подсчётом md5.
Подозреваю, надо будет делать примерно так:
sort | tee | awk | md5sum | join
---
"Vyroba umelych lidi, slecno, je tovarni tajemstvi."
Karel Capek

Ivan8209

Кстати, мысль сравнивать несколько первых разрядов очень хорошая.
Её тоже можно прикрутить.
Она вписывается в awk после ``ls | sort.''
---
"Vyroba umelych lidi, slecno, je tovarni tajemstvi."
Karel Capek

maxin1

Как ты думаешь, под какой ОС сидит товарищ ?

Ivan8209

Про это уже говорили.
Скорее всего, у него ОС общего назначения.
А раз так, то какая именно у него ОС --- нисколько не важно.
---
...Я работаю антинаучным аферистом...

smnikiforov

попробуй понять одну очень простую вещь. человек, спрашивающий такую вещь в форуме, пользоваться таким способом не станет, даже если допустить, что способ самый лучший из возможных.

Ivan8209

1. Это ещё неизвестно.
2. <<Тебе "шашечки" или ехать?>>
---
...Я работаю антинаучным аферистом...

smnikiforov

Это известно. Любимый тобой общественный опыт. Иначе говоря, эмпирическая индукция. Из всех, кому ты советовал в форуме что-то типа
sh + ls + sed + awk + md5sum + sort (+ join)
ни один этим пока не воспользовался.

Ivan8209

Я пользуюсь примерно этим.
У меня не столько одинаковых файлов, чтобы использовать md5sum, но в основе так.
---
...Я работаю антинаучным аферистом...

smnikiforov

я нигде не говорю, что этим невозможно пользоваться. более того, я охотно допускаю, что для определённых людей этот способ будет максимально удобным. Но! людям, спрашивающим что-то типа "Как можно искать одинаковый файлы" в этом форуме данный способ ИМХО удобным совсем не будет. Пока контрпримеров замечено не было.

vijrel7878

я вот заюзал need4space
вот результат
Оставить комментарий
Имя или ник:
Комментарий: