Сведения о вопросе

Oleksandr

21:06, 1st October, 2020

Структуры данных Sphinx & Lucene

Просмотров: 357   Ответов: 2

Добрый день.
Не поделится ли кто сокровенным знанием? :)
Нужны структуры данных индексных файлов поисковиков Sphinx, Lucene. Если есть аналогичная информация по другим — тоже не откажусь, если движок достаточно шустрый. Поставленная перед собой задача — понять механизм наполнения поисковых баз и поиска по ним. Хотелось бы избежать нудного и неблагодарного кодокопательства.
Общая файловая структура Lucene описывается, но очень общая, хотелось бы поподробней.



  Сведения об ответе

dump

18:20, 25th September, 2020

Посмотрите на Riak Search, он отчасти совместим с Solr, а данные можно посмотреть в виде пары ключ-значение.


  Сведения об ответе

lool

07:03, 25th September, 2020

Sphinx — open-source, соответственно любые нюансы, которые вас интересуют, вы можете посмотреть напрямую в исходниках:
code.google.com/p/sphinxsearch/source/browse

Internal index format вроде как раз то, что вам надо:
code.google.com/p/sphinxsearch/source/browse/trunk/doc/internals-index-format.txt


Ответить на вопрос

Чтобы ответить на вопрос вам нужно войти в систему или зарегистрироваться