Индексы для поиска по ключевым словам.

SCIF32

В том смысле, что какие технологии (из открытых и общеизвестных) используются, что бы ускорить поиск по ключевым словам?

SCIF32

То что знаю я:
Для самых частых ключевых слов составляем на них ответы. Редкие слова обсчитываем каждый раз. Ответ на составной запрос получаем пересечением

Varvara2002

Поиск чего?
Слов, текстов, сайтов, ... ?

SCIF32

Имел ввиду следующее:
Заданы ключевые слова.
Есть набор документов, каждый представляет собой множество ключевых слов.
Запрос есть множество слов.
Результат поиска есть множество докуменов из набора, содержащие слова запроса.

psm-home

Может тебе надо что-то вроде http://www.cs.duke.edu/~junyang/courses/cps216-2001-fall/lectures/13-index.pdf. Там коротенько про inverted list и signatures. Или про все это в курсе и тебе надо что-то более хитрое? Тогда извини.

SCIF32

The page you have requested:
http://www.cs.duke.edu/~junyang/courses/cps216-2001-fall/lectures/13-index.pdf.
was not found on this server. The following error was returned:
404: File does not exist
Please report problems to the webmaster.

SCIF32

Да вроде в курсе на самом деле.

Barbie29

хеширование заюзай

ava3443

> 404: File does not exist
Детский сад. Уберите точку из конца URL - будет счастье.

SCIF32

Что именно хешировать то?
// если речь про хеширование таблицы ключевых слов (как по ссылке на 4,5 слайдах
// то, очевидно, что его надо использовать (или B-деревья)
// Но это уже вопрос по поводу хранения самого индекса в памяти, а не способа индексации данных.
Оставить комментарий
Имя или ник:
Комментарий: