проиндексировать содержимое pdf'ов в локалке виндусов

Vladu

Чем можно проиндексировать содержимое pdf'ов в локалке виндусов?
Хорошо бы что-бы был веб-интерфейс для поиска.
Смотрел тут http://www.searchtools.com/info/pdf.html
Swish-e очень похоже, но я не знаю как поставить его под винду.
http://www.swish-e.org/
может быть есть что-нибудь по-проще?
Посоветуйте.

gsharov

google desktop search. Искать - ясно где Индексирует почти все. Есть веб интерфейс (гугл) и плагин на дотнете для поиска аля макос тигр

Vladu

google desktop search. Искать - ясно где Индексирует почти все. Есть веб интерфейс (гугл) и плагин на дотнете для поиска аля макос тигр
А что за плагин?
update: http://dnka.com/

Vladu

google desktop search. Искать - ясно где Индексирует почти все. Есть веб интерфейс (гугл) и плагин на дотнете для поиска аля макос тигр
Подстава!
Google Desktop Search индексирует только первые 5000 слов
http://desktop.google.com/support/bin/answer.py?answer=17208&topic=201

For most documents, Desktop Search searches about the first 5000 words. Occasionally, Desktop Search may index slightly fewer words to save space in your search index and on your hard drive.

Так что прога в розыске.

gsharov

http://dnka.com/ - там же есть и кустомайзер. По идее должен настраивать - хвалят они его там сильно ) Проверить не могу - я сейчас на чужой машине...

maggi14

Яндекс

Vladu

Яндекс
непонятно

maggi14

Умеет. Но тут знающие люди говорят, что это стоит 15 тысяч. Так что снимаю свое предложение

ava3443

> Swish-e очень похоже, но я не знаю как поставить его под винду.
Судя по документации не особо сложно.
Цитата:
A Windows binary version is available as a separate download from the Swish-e site (http://swish-e.org). Many of the installation instructions below will not apply to Windows users; the Windows version is pre-compiled and includes libxml2, zlib, xpdf, and catdoc.
A number of Perl modules may also be needed. These can be installed with ActiveState's PPM utility.
libwww-perl - the LWP modules (for spidering)
HTML-Tagset - used by web spider
HTML-Parser - used by web spider
MIME-Types - used for filtering documents when not spidering
HTML-Template - formatting output from swish.cgi (optional)
HTML-FillInForm (if HTML-Template is used)
Оставить комментарий
Имя или ник:
Комментарий: