Индексы для поиска по ключевым словам.
То что знаю я:
Для самых частых ключевых слов составляем на них ответы. Редкие слова обсчитываем каждый раз. Ответ на составной запрос получаем пересечением
Для самых частых ключевых слов составляем на них ответы. Редкие слова обсчитываем каждый раз. Ответ на составной запрос получаем пересечением
Поиск чего?
Слов, текстов, сайтов, ... ?
Слов, текстов, сайтов, ... ?
Имел ввиду следующее:
Заданы ключевые слова.
Есть набор документов, каждый представляет собой множество ключевых слов.
Запрос есть множество слов.
Результат поиска есть множество докуменов из набора, содержащие слова запроса.
Заданы ключевые слова.
Есть набор документов, каждый представляет собой множество ключевых слов.
Запрос есть множество слов.
Результат поиска есть множество докуменов из набора, содержащие слова запроса.
Может тебе надо что-то вроде http://www.cs.duke.edu/~junyang/courses/cps216-2001-fall/lectures/13-index.pdf. Там коротенько про inverted list и signatures. Или про все это в курсе и тебе надо что-то более хитрое? Тогда извини. 

The page you have requested:
http://www.cs.duke.edu/~junyang/courses/cps216-2001-fall/lectures/13-index.pdf.
was not found on this server. The following error was returned:
404: File does not exist
Please report problems to the webmaster.

Да вроде в курсе на самом деле.
хеширование заюзай
> 404: File does not exist
Детский сад. Уберите точку из конца URL - будет счастье.
Детский сад. Уберите точку из конца URL - будет счастье.
Что именно хешировать то?
// если речь про хеширование таблицы ключевых слов (как по ссылке на 4,5 слайдах
// то, очевидно, что его надо использовать (или B-деревья)
// Но это уже вопрос по поводу хранения самого индекса в памяти, а не способа индексации данных.
// если речь про хеширование таблицы ключевых слов (как по ссылке на 4,5 слайдах
// то, очевидно, что его надо использовать (или B-деревья)
// Но это уже вопрос по поводу хранения самого индекса в памяти, а не способа индексации данных.
Оставить комментарий
SCIF32
В том смысле, что какие технологии (из открытых и общеизвестных) используются, что бы ускорить поиск по ключевым словам?