Индекс поисковой системы

Индекс поисковой системы — это хранящаяся на поисковом сервере база данных, по которой осуществляется поиск запрошенной пользователем информации. Как правило, содержит ссылки на проиндексированные ресурсы и сжатые копии веб-страниц.

Копия страницы в индексе представляет собой инвертированный файл, где для каждого слова, имеющегося в исходном документе, перечислены позиции, в которых оно встречается. При этом отбрасываются стоп-слова, слова могут приводиться к исходной форме.

Индекс пополняется поисковым роботом во время периодических обходов Интернета.

Вернуться к списку терминов