Индексы для поиска по ключевым словам.
Для самых частых ключевых слов составляем на них ответы. Редкие слова обсчитываем каждый раз. Ответ на составной запрос получаем пересечением
Слов, текстов, сайтов, ... ?
Заданы ключевые слова.
Есть набор документов, каждый представляет собой множество ключевых слов.
Запрос есть множество слов.
Результат поиска есть множество докуменов из набора, содержащие слова запроса.
http://www.cs.duke.edu/~junyang/courses/cps216-2001-fall/lectures/13-index.pdf. Там коротенько про inverted list и signatures. Или про все это в курсе и тебе надо что-то более хитрое? Тогда извини.
Может тебе надо что-то вроде The page you have requested:
http://www.cs.duke.edu/~junyang/courses/cps216-2001-fall/lectures/13-index.pdf.
was not found on this server. The following error was returned:
404: File does not exist
Please report problems to the webmaster.
Да вроде в курсе на самом деле.
хеширование заюзай
Детский сад. Уберите точку из конца URL - будет счастье.
// если речь про хеширование таблицы ключевых слов (как по ссылке на 4,5 слайдах
// то, очевидно, что его надо использовать (или B-деревья)
// Но это уже вопрос по поводу хранения самого индекса в памяти, а не способа индексации данных.
Оставить комментарий
SCIF32
В том смысле, что какие технологии (из открытых и общеизвестных) используются, что бы ускорить поиск по ключевым словам?