Сведения о вопросе

PIRLO

06:55, 15th August, 2020

Оптимизация алгоритма поиска в C

Просмотров: 503 Ответов: 10

Может ли производительность этого последовательного алгоритма поиска (взято из Практика программирования) может быть улучшена с помощью любой из собственных утилит C, например, если я установил переменную i в качестве переменной регистра ?

int lookup(char *word, char*array[])
{
    int i

    for (i = 0; array[i] != NULL; i++)
        if (strcmp(word, array[i]) == 0)
            return i;

    return -1;
}

Сведения об ответе

PROGA

18:19, 26th August, 2020

Да, но только очень немного. Гораздо большего повышения производительности можно добиться, используя лучшие алгоритмы (например, сохраняя список отсортированным и выполняя двоичный поиск).

В общем, оптимизация данного алгоритма только поможет вам до сих пор. Выбор лучшего алгоритма (даже если он не полностью оптимизирован) может дать вам значительное (на порядок) улучшение производительности.

Сведения об ответе

SEEYOU

11:52, 3rd August, 2020

Я думаю, что это не будет иметь большого значения. Компилятор уже оптимизирует его в этом направлении.

Кроме того, переменная i не оказывает большого влияния, word остается постоянным на протяжении всей функции, а rest слишком велик, чтобы поместиться в любом регистре. Это только вопрос того, насколько велик кэш и может ли весь массив поместиться там.

Сравнение строк является довольно дорогостоящим вычислительным процессом.

Может быть, вы можете использовать какой-то вид хэширования для массива перед поиском?

Сведения об ответе

fo_I_K

00:59, 29th August, 2020

Есть известный метод, как способ магистраль. Чтобы использовать sentinal метод, вы должны знать о длине "array[]". Вы можете удалить "array[i] != NULL " сравнение с помощью sentinal.

int lookup(char *word, char*array[], int array_len)
{
    int i = 0;
    array[array_len] = word;
    for (;; ++i)
        if (strcmp(word, array[i]) == 0) 
            break;
    array[array_len] = NULL;
    return (i != array_len) ? i : -1;
}

Сведения об ответе

P_S_S

21:06, 1st October, 2020

Если Вы читаете TPOP, вы увидите, как они делают этот поиск во много раз быстрее с помощью различных структур данных и алгоритмов.

Но вы можете сделать все немного быстрее, заменив такие вещи, как

for (i = 0; i < n; ++i)
    foo(a[i]);

char **p = a;
for (i = 0; i < n; ++i)
    foo(*p);
    ++p;

Если в конце массива есть известное значение (например, NULL), то можно исключить счетчик циклов:

for (p = a; *p != NULL; ++p)
    foo(*p)

Удачи, это отличная книга!

Сведения об ответе

lool

08:24, 25th August, 2020

Для оптимизации этого кода лучше всего было бы переписать процедуру strcmp, так как вы только проверяете равенство и не должны оценивать все слово целиком.

Кроме этого, вы не можете сделать ничего другого. Вы не можете сортировать, так как кажется, что вы ищете текст внутри большего текста. Двоичный поиск также не будет работать, так как текст вряд ли будет отсортирован.

Мой 2p (C-psuedocode):

wrd_end = wrd_ptr + wrd_len;
arr_end = arr_ptr - wrd_len;
while (arr_ptr < arr_end)
{
    wrd_beg = wrd_ptr; arr_beg = arr_ptr;
    while (wrd_ptr == arr_ptr)
    {
        wrd_ptr++; arr_ptr++;
        if (wrd_ptr == wrd_en)
            return wrd_beg;
    }
    wrd_ptr++;
}

Сведения об ответе

lesha

05:15, 8th August, 2020

Реально, установка I в качестве переменной регистра не сделает ничего такого, чего бы уже не сделал компилятор.

Если вы хотите потратить некоторое время на предварительную предварительную обработку ссылочного массива, вам следует google "The World's Fastest Scrabble Program" и реализовать это. Спойлер: это DAG, оптимизированный для поиска персонажей.

Сведения об ответе

PIRLO

03:16, 13th August, 2020

Марк Харрисон: ваш цикл for никогда не закончится! (++p имеет отступ, но на самом деле не находится в пределах for :-)

Кроме того, переключение между указателями и индексацией обычно не влияет на производительность, равно как и добавление ключевых слов регистра (как уже упоминал Мэт) - компилятор достаточно умен, чтобы применить эти преобразования там, где это необходимо, и если вы достаточно расскажете ему о своей cpu-арке, он сделает это лучше, чем ручной psuedo-micro-optimizations.

Сведения об ответе

dump

09:49, 12th August, 2020

Более быстрым способом сопоставления строк было бы их хранение в стиле Pascal. Если вам не нужно больше 255 символов на строку, храните их примерно так, с количеством в первом байте:

char s[] = "\x05Hello";

Тогда вы можете сделать:

for(i=0; i<len; ++i) {
    s_len = strings[i][0];
    if(
        s_len == match_len
        && strings[i][s_len] == match[s_len-1]
        && 0 == memcmp(strings[i]+1, match, s_len-1)
    ) {
        return 1;
    }
}

И чтобы получить действительно быстро, добавьте подсказки предварительной выборки памяти для строки start + 64, + 128 и начала следующей строки. Но это просто безумие. :-)

Сведения об ответе

PIRLO

18:27, 5th August, 2020

Еще один быстрый способ сделать это-заставить ваш компилятор использовать оптимизированный для SSE2 memcmp. Используйте массивы символов фиксированной длины и выровняйте так, чтобы строка начиналась с 64-байтового выравнивания. Тогда я считаю, что вы можете получить хорошие функции memcmp, если вы передадите const char match[64] вместо const char *match в функцию или strncpy match в 64,128,256, какой угодно байтовый массив.

Подумав немного больше об этом, эти функции соответствия SSE2 могут быть частью пакетов, таких как библиотеки ускорителей Intel и AMD. Проверить их.

Сведения об ответе

darknet

21:06, 1st October, 2020

/* there is no more quick  */
int lookup(char *word, char*array[])
{
    int i;
    for(i=0; *(array++) != NULL;i++)
        if (strcmp(word, *array) == 0)
            return i;
    return -1;
}

Сведения о вопросе

PIRLO

06:55, 15th August, 2020

Теги

Оптимизация алгоритма поиска в C

Сведения об ответе

PROGA

18:19, 26th August, 2020

Сведения об ответе

SEEYOU

11:52, 3rd August, 2020

Сведения об ответе

fo_I_K

00:59, 29th August, 2020

Сведения об ответе

P_S_S

21:06, 1st October, 2020

Сведения об ответе

lool

08:24, 25th August, 2020

Сведения об ответе

lesha

05:15, 8th August, 2020

Сведения об ответе

PIRLO

03:16, 13th August, 2020

Сведения об ответе

dump

09:49, 12th August, 2020

Сведения об ответе

PIRLO

18:27, 5th August, 2020

Сведения об ответе

darknet

21:06, 1st October, 2020

`/* there is no more quick / int lookup(char word, chararray[]) { int i; for(i=0; (array++) != NULL;i++) if (strcmp(word, *array) == 0) return i; return -1; }`

Ответить на вопрос

Как зайти в Даркнет?! 25th January, 01:11 174 0

Программа, которая создает фейковые сервера в поиске игровых серверов CS 1.6 Steam 21st March, 17:43 1149 0

Очень долго работает Update запрос Oracle 27th January, 09:58 1057 0

не могу запустить сервер на tomcat HTTP Status 404 – Not Found 21st January, 18:02 1031 0

Где можно найти фрилансера для выполнения поступающих задач, на постоянной основе? 2nd December, 09:48 1072 0

Разработка мобильной кроссплатформенной военной игры 16th July, 17:57 1869 0

период по дням 25th October, 10:44 4087 0

Пишу скрипты для BAS только на запросах 16th September, 02:42 3849 0

Некорректный скрипт для закрытия блока 14th April, 18:33 4770 0

прокидывать exception в блоках try-catch JAVA 11th March, 21:11 4515 0

Помогите пожалуйста решить задачи 24th November, 23:53 6263 0

Не понимаю почему не открывается детальное описание продукта 11th November, 11:51 4479 0

Нужно решить задачу по программированию на массивы 27th October, 18:01 4560 0

Метода Крамера С++ 23rd October, 11:55 4462 0

помогите решить задачу на C++ 22nd October, 17:31 4127 0

Помогите решить задачу на python с codeforces 22nd October, 11:11 4608 0

Python с нуля: полное руководство для начинающих 18th June, 13:58 2731 0

Все вопросы

Сведения о вопросе

06:55, 15th August, 2020

Теги

Оптимизация алгоритма поиска в C

Сведения об ответе

18:19, 26th August, 2020

Сведения об ответе

11:52, 3rd August, 2020

Сведения об ответе

00:59, 29th August, 2020

Сведения об ответе

21:06, 1st October, 2020

Сведения об ответе

08:24, 25th August, 2020

Сведения об ответе

05:15, 8th August, 2020

Сведения об ответе

03:16, 13th August, 2020

Сведения об ответе

09:49, 12th August, 2020

Сведения об ответе

18:27, 5th August, 2020

Сведения об ответе

21:06, 1st October, 2020

/* there is no more quick */ int lookup(char *word, char*array[]) { int i; for(i=0; *(array++) != NULL;i++) if (strcmp(word, *array) == 0) return i; return -1; }

Ответить на вопрос

Как зайти в Даркнет?!

25th January, 01:11

174

0

Программа, которая создает фейковые сервера в поиске игровых серверов CS 1.6 Steam

21st March, 17:43

1149

0

Очень долго работает Update запрос Oracle

27th January, 09:58

1057

0

не могу запустить сервер на tomcat HTTP Status 404 – Not Found

21st January, 18:02

1031

0

Где можно найти фрилансера для выполнения поступающих задач, на постоянной основе?

2nd December, 09:48

1072

0

Разработка мобильной кроссплатформенной военной игры

16th July, 17:57

1869

0

период по дням

25th October, 10:44

4087

0

Пишу скрипты для BAS только на запросах

16th September, 02:42

3849

0

Некорректный скрипт для закрытия блока

14th April, 18:33

4770

0

прокидывать exception в блоках try-catch JAVA

11th March, 21:11

4515

0

Помогите пожалуйста решить задачи

24th November, 23:53

6263

0

Не понимаю почему не открывается детальное описание продукта

11th November, 11:51

4479

0

Нужно решить задачу по программированию на массивы

27th October, 18:01

4560

0

Метода Крамера С++

23rd October, 11:55

4462

0

помогите решить задачу на C++

22nd October, 17:31

4127

0

Помогите решить задачу на python с codeforces

22nd October, 11:11

4608

0

Python с нуля: полное руководство для начинающих

18th June, 13:58

2731

0

`/* there is no more quick / int lookup(char word, chararray[]) { int i; for(i=0; (array++) != NULL;i++) if (strcmp(word, *array) == 0) return i; return -1; }`