Список вопросов
Как зайти в Даркнет?!
25th January, 01:11
8
0
Как в tkinter из поля ввода Entry получить значение в одну переменную и обновить строку кнопкой, затем получить ещё одно введённое значение и затем сложить их. Ниже пример кода
21st July, 19:00
898
0
Программа, которая создает фейковые сервера в поиске игровых серверов CS 1.6 Steam
21st March, 17:43
951
0
Очень долго работает Update запрос Oracle
27th January, 09:58
916
0
не могу запустить сервер на tomcat HTTP Status 404 – Not Found
21st January, 18:02
907
0
Где можно найти фрилансера для выполнения поступающих задач, на постоянной основе?
2nd December, 09:48
941
0
Разработка мобильной кроссплатформенной военной игры
16th July, 17:57
1726
0
период по дням
25th October, 10:44
3957
0
Пишу скрипты для BAS только на запросах
16th September, 02:42
3722
0
Некорректный скрипт для закрытия блока
14th April, 18:33
4614
0
прокидывать exception в блоках try-catch JAVA
11th March, 21:11
4382
0
Помогите пожалуйста решить задачи
24th November, 23:53
6087
0
Не понимаю почему не открывается детальное описание продукта
11th November, 11:51
4352
0
Нужно решить задачу по программированию на массивы
27th October, 18:01
4399
0
Метода Крамера С++
23rd October, 11:55
4309
0
помогите решить задачу на C++
22nd October, 17:31
4002
0
Помогите решить задачу на python с codeforces
22nd October, 11:11
4492
0
Python с нуля: полное руководство для начинающих
18th June, 13:58
2599
0
Sphinx и натуральная сортировка
Просмотров: 291
 
Ответов: 1
Такая задача: реализовать сортировку (желательно натуральную) в sphinx по атрибуту.
Проблема в том, что в сфинксе при использовании дельта-индексов сортировка по атрибуту sql_attr_str2ordinal абсолютно не пригодна. Т.к. вот что нам говорит документация: Note that the ordinals are by construction local to each index, and it's therefore impossible to merge ordinals while retaining the proper order. The processed strings are replaced by their sequential number in the index they occurred in, but different indexes have different sets of strings. For instance, if 'main' index contains strings «aaa», «bbb», «ccc», and so on up to «zzz», they'll be assigned numbers 1, 2, 3, and so on up to 26, respectively. But then if 'delta' only contains «zzz» the assigned number will be 1. And after the merge, the order will be broken.
Есть следующая идея:
посчитать численный эквивалент строки, высчитываем название по первым 8 символам
Вот с таким алгоритмом:
По сути мы имеем дело с ограниченным диапазоном символов — цифры, латинский и русский алфавиты в нижнем регистре (68 символов). Такой набор символов можно представить как число в 68-ричной системе счисления. Всё, что мы делаем — переводим число из 68-ричной в 10-ричную систему. Символы мы переводим в десятиричные коды, после чего считаем по формуле a(n) * (68 ** 0) + a(n-1) * (68 ** 1) +… + a(1) * (68 ** n)
Вопрос: правильно ли это? Может есть у кого дельные предложения, вообще в идеале хотелось бы natural sorting.
видимо в раздел q&a профи не заглядывают =)
предварительно решил сделать пока вот так, но уже понятно, что натуральной сортировки не видать, т.к. для этого надо полюбому сравнивать все строки с друг другом
функция на postgresql для преобразования строки в число, может кому пригодится:
CREATE OR REPLACE FUNCTION string_ordinal(str character varying)
RETURNS double precision AS
$BODY$
DECLARE
_norm VARCHAR;
_ln SMALLINT;
_max_ln SMALLINT;
i SMALLINT;
o DOUBLE PRECISION;
sym CHAR;
code SMALLINT;
norm_code SMALLINT;
BEGIN
_max_ln := 100;
_norm := regexp_replace(lower(str), '[^A-Za-z0-9а-яА-ЯЁё]', '', 'g');
_ln = length(_norm);
IF _ln < _max_ln THEN
_norm = rpad(_norm, _max_ln, '.');
_ln = length(_norm);
END IF;
o := 0.0;
FOR i IN 1.._ln LOOP
sym := SUBSTRING(_norm FROM i FOR 1)::CHAR;
code := ascii(sym);
norm_code := 0;
IF code = 46 THEN
norm_code := 1;
END IF;
IF code >= 48 AND code <= 57 THEN -- 0-9
norm_code := code - 46;
END IF;
IF code >= 97 AND code <= 122 THEN -- a-z
norm_code := code - (96 - 10);
END IF;
IF code >= 1072 AND code <= 1105 THEN -- а-я + ё
IF code = 1105 THEN -- ё имеет код больший, чем я, это плохо
code := 1078;
ELSIF code > 1077 THEN
code := code + 1;
END IF;
norm_code := code - (1071 - 36);
END IF;
o := o + norm_code * power(68, (_ln - i));
END LOOP;
RETURN o;
END;
$BODY$
LANGUAGE plpgsql VOLATILE
COST 100;
CREATE OR REPLACE FUNCTION string_ordinal(str character varying)
RETURNS double precision AS
$BODY$
DECLARE
_norm VARCHAR;
_ln SMALLINT;
_max_ln SMALLINT;
i SMALLINT;
o DOUBLE PRECISION;
sym CHAR;
code SMALLINT;
norm_code SMALLINT;
BEGIN
_max_ln := 100;
_norm := regexp_replace(lower(str), '[^A-Za-z0-9а-яА-ЯЁё]', '', 'g');
_ln = length(_norm);
IF _ln < _max_ln THEN
_norm = rpad(_norm, _max_ln, '.');
_ln = length(_norm);
END IF;
o := 0.0;
FOR i IN 1.._ln LOOP
sym := SUBSTRING(_norm FROM i FOR 1)::CHAR;
code := ascii(sym);
norm_code := 0;
IF code = 46 THEN
norm_code := 1;
END IF;
IF code >= 48 AND code <= 57 THEN -- 0-9
norm_code := code - 46;
END IF;
IF code >= 97 AND code <= 122 THEN -- a-z
norm_code := code - (96 - 10);
END IF;
IF code >= 1072 AND code <= 1105 THEN -- а-я + ё
IF code = 1105 THEN -- ё имеет код больший, чем я, это плохо
code := 1078;
ELSIF code > 1077 THEN
code := code + 1;
END IF;
norm_code := code - (1071 - 36);
END IF;
o := o + norm_code * power(68, (_ln - i));
END LOOP;
RETURN o;
END;
$BODY$
LANGUAGE plpgsql VOLATILE
COST 100;
Чтобы ответить на вопрос вам нужно войти в систему или зарегистрироваться