Найдено результатов: 3

Lucene оценка результатов

В Lucene, если у вас было несколько индексов, которые охватывали только один раздел каждый. Почему один и тот же поиск по разным индексам возвращает результаты с разными оценками? Результаты с разных серверов точно совпадают.

т. е. если бы я искал :

  • Имя-Джон Смит
  • DOB - 11/11/1934

Раздел 0 вернет оценку 0.345

Раздел 1 вернет оценку 0.337

Оба совпадают точно по имени и DOB.

search   lucene    

447   3   16:03, 1st July, 2020


Ошибка WildcardQuery в Solr

Я использую solr для поиска документов, и при попытке поиска документов с помощью этого запроса " id:* ", я получаю это исключение синтаксического анализатора запроса, сообщающее, что он не может проанализировать запрос с помощью * или ? как первый персонаж.

HTTP Status 400 - org.apache.lucene.queryParser.ParseException: Cannot parse 'id:*': '*' or '?' not allowed as first character in WildcardQuery

type Status report

message org.apache.lucene.queryParser.ParseException: Cannot parse 'id:*': '*' or '?' not allowed as first character in WildcardQuery

description The request sent by the client was syntactically incorrect (org.apache.lucene.queryParser.ParseException: Cannot parse 'id:*': '*' or '?' not allowed as first character in WildcardQuery).

Есть ли какой-нибудь патч, чтобы заставить это работать с just * ? Или это очень дорого сделать такой запрос?

search   lucene   solr    

512   7   03:48, 18th August, 2020


Использование Lucene для поиска email адресов

Я хочу использовать Lucene (в частности, Lucene.NET) для поиска email адресных доменов.

E.g. Я хочу найти "@gmail.com", чтобы найти все письма, отправленные на адрес gmail.

Выполнение запроса Lucene для "*@gmail.com " приводит к ошибке, звездочки не могут быть в начале запросов. Выполнение запроса для "@gmail.com " не возвращает никаких совпадений, потому что "foo@gmail.com" рассматривается как целое слово, и вы не можете искать только части слова.

Как я могу это сделать?

.net   search   lucene    

460   4   13:14, 26th August, 2020