Список вопросов
Как зайти в Даркнет?!
25th January, 01:11
8
0
Как в tkinter из поля ввода Entry получить значение в одну переменную и обновить строку кнопкой, затем получить ещё одно введённое значение и затем сложить их. Ниже пример кода
21st July, 19:00
900
0
Программа, которая создает фейковые сервера в поиске игровых серверов CS 1.6 Steam
21st March, 17:43
952
0
Очень долго работает Update запрос Oracle
27th January, 09:58
916
0
не могу запустить сервер на tomcat HTTP Status 404 – Not Found
21st January, 18:02
907
0
Где можно найти фрилансера для выполнения поступающих задач, на постоянной основе?
2nd December, 09:48
942
0
Разработка мобильной кроссплатформенной военной игры
16th July, 17:57
1727
0
период по дням
25th October, 10:44
3957
0
Пишу скрипты для BAS только на запросах
16th September, 02:42
3722
0
Некорректный скрипт для закрытия блока
14th April, 18:33
4614
0
прокидывать exception в блоках try-catch JAVA
11th March, 21:11
4382
0
Помогите пожалуйста решить задачи
24th November, 23:53
6088
0
Не понимаю почему не открывается детальное описание продукта
11th November, 11:51
4352
0
Нужно решить задачу по программированию на массивы
27th October, 18:01
4400
0
Метода Крамера С++
23rd October, 11:55
4309
0
помогите решить задачу на C++
22nd October, 17:31
4002
0
Помогите решить задачу на python с codeforces
22nd October, 11:11
4492
0
Python с нуля: полное руководство для начинающих
18th June, 13:58
2599
0
Sphinx или Яндекс.Сервер?
Просмотров: 410
 
Ответов: 4
Собственно сабж. Текста много(4000 тысячи статей, 8 тысяч названий).
Крутится всё с использованием СУБД mysql на linux 2.6.
Интересует, как у обоих продуктов дела с потреблением памяти и качеством выдачи.
4000 или 4.000.000 статей?
Ставить можно и то, и другое.
Яндекс сервер капризнее в настройках и тяжелее с документацией. Год назад были проблемы с кодировкой при индексации через mysql, как то удалось обойти.
Но есть и свои бонусы, в частности готовая выдача с подсветкой. Для небольшого числа документов яндекс пожалуй удобен. Главное отличие — яндекс при поиске избавляет вас от доп. доступа к базе документов.
Сфинкс существенно проще поднимается, с документацией нет проблем (в наличии живой форум) и гибче в настройках.
Для действительно больших баз сфинкс даст сто очков вперед яндексу за счет возможности хранить большую часть базы на винте ( у яндекса были проблемы ).
недостаток сфинкса в необходимости лазить в базу sql ручками при поиске (в последней бетке появилась возможность хранить выборку в базе сфинкса, но на то она и бетка, чтобы быть неудобной. на маленьких базах юзабельно, на больших — тормозит).
Из живых примеров: на базе порядков сотен миллионов записей был выбран сфинкс. Яндекс тупо не смог выжить на одной машине (не нашел у него режима, позволяющего минимизировать объем памяти).
я вот не помню, есть ли у яндекс.сервера возможность индексировать непосредственно БД, в отличие от Сфинкса. Емнип он только http кроулит и еще файло на винте может проиндексить. за сим решайте что вам проще натравить сфинкса на базу или яндекс.сервер на сайт.
в общем исходите из того что вы на самом деле хотите индексировать — страницы сайта или колонку в таблице БД, а дальше уже вкручивайте то что подойдет.
как то так. я пару раз яндекс.сервер ставил, никаких сложностей не припоминаю. сфинкс не ставил, сравнить не могу.
В Я.С можноондексировать базу MySQL и любую другую по ODBC.
Поднимал и Сфинкса и Я.С, конечно релевантность у Я.С выше, но он очень долго индексирует сайт из 450 000 страниц, примерное время — 2 суток, и во время индексации ему нужно 2 гига на винте чтоб были свободными(для моего количества страниц). А когда он начинает сливать индексы сервак вешается, хостер постоянно жаловался что мой сервер жрет больше оперативы чем можно(2Гига). Короче решать Вам, но с 4М статей я бы если и ставил Я.С, то на отдельный сервак.
Чтобы ответить на вопрос вам нужно войти в систему или зарегистрироваться