Поисковые системы
гугл не катит?
без инета работает?
у него есть десктопыве решения?
у него есть десктопыве решения?
десктоп - не знаю, у нас поиск на сайте гуглом ведется
объём проиндексированных документов?
у, чорт Кто б знал бекап базы Postgres, зажатый в gz, весит 340 мегов
Полный архив газеты за несколько лет
Полный архив газеты за несколько лет
я не понял. гугль информацию об индексировании у вас хранит что ли?!
короче, расскажи, как у вас устроено и чё за газета?
короче, расскажи, как у вас устроено и чё за газета?
честно? Не знаю. Вряд ли, конечно
www.rg.ru
Поисковик до меня еще ставили, так что как устроен - хз:(
Тьфу... нет... это просто поиск по сайту. Не подойдет тебе, наверное
Поисковик до меня еще ставили, так что как устроен - хз:(
Тьфу... нет... это просто поиск по сайту. Не подойдет тебе, наверное
Мы вот здесь использовали openfts, для поиска по статьям журнала, она на постгресе основана. Их там не сотни тысяч, конечно, но вроде нормальный поиск получился. + она бесплатная.
для второго пункта попробуй www.risearch.org хотя думаю за два года он там ченнить и для гигабайтных текстов наваял...
Оставить комментарий
yolki
Какие есть в продаже и в опенсорс?Нужно: индексирование + поиск + атрибутивный поиск по коллекциям документов.
+ API для встраивания в свои продукты / Web-интерфейс
Есть две задачи, по объёму:
1. сотни тысяч документов на десяток-другой гигабайт
2. десяток-два документов на пару десятков мегабайт