Сведения о вопросе

Gaukhar

16:08, 9th August, 2020

Организация хранения структуры категорий в реляционной БД?

Просмотров: 399 Ответов: 4

Задача — организовать хранение некоего каталога, с достаточно разветвлённой структурой (дерево) — пускай это будет каталог продукции интернет-магазина. Для поиска элемента доступен только URI вида "/category/subcategory/another-category/and-one-more-category". Максимальная вложенность порядка 10.

Категории запрашиваются часто, меняются редко, общее количество категорий может быть порядка 100 тыс.

Так же требуется шустрая генерация «хлебных крошек». Причём ссылка на категорию («and-one-more-category») может отличаться от её заголовка («И ещё одна категория»), который используется для вывода на странице.

У меня пока одно предполагаемое решение — «в лоб» — по следам Materialized path:

таблица для категорий имеет следующую структуру

CREATE TABLE categories (

`id` INT NOT NULL AUTO_INCREMENT PRIMARY KEY,

`title` VARCHAR(50) NOT NULL,

`link` VARCHAR(50) NOT NULL,

`path` VARCHAR(1000) NOT NULL,

`title_path` VARCHAR(1000) NOT NULL

)

CREATE INDEX path_indx ON categories (`path`);

`title` — заголовок категории («И ещё одна категория»),

`link` — ссылка категории («and-one-more-category»),

`path` — путь к категории («category/subcategory/another-category/and-one-more-category»),

`title_path` — то же, что и `path`, только содержит заголовки соответствующих категорий — для быстрой генерации «хлебных крошек»

— Привлекает то, что для поиска категории не нужно никаких усилий — просто SELECT… WHERE path LIKE…

— Не пугает даже необходимость перестроения путей в случае перемещения/переименования узлов.

— Пугает избыточность подхода и вероятные размеры таблицы при большом количестве категорий. Насколько это скажется на скорости?

— Так же смущает то, что в качестве ключа для поиска используется такая длинная строка в `path` (хотя я очень сомневаюсь что она когда-либо выйдет за пределы 100 символов)

Может вынести `path` и `title_path` в отдельную таблицу? Так всё равно путь и хлебные крошки для категории требуется практически всегда, так что придётся джойнить…

Смотрю в сторону Full hierarchy, но опять же смущает возможная избыточность в таблице иерархии, тем более учитывая потенциальные количества категорий и уровни вложенности.

Как более оптимально решить задачу?

Сведения об ответе

ЯЯ__4

08:04, 4th August, 2020

Может быть стоит все просто кешировать в MemcacheDB и при перестроении менять записи в кеше?

Ключ path
Внутри массив со строкой категории из БД + массив для хлебных крошек

Сведения об ответе

LIZA

22:43, 27th August, 2020

нужно ли предусматривать возможность изменения родительской категории, например при редактировании подкатегории (category/subcategory/… на category/subcategory-1/)? если нет, то возможно Ваш вариант подходит. Если надо предусмотреть эту возможность, да и вообще иметь более гибкую структуру — советую погуглить nested sets

Сведения об ответе

lesha

23:30, 11th August, 2020

100 000 категорий — это 5 символов на узел в пути. 10*5 — максимальный путь на категорию.
Итого максимум 5 мегабайт данных. Реально — в разы меньше.
Не тот размер, о котором стоит переживать.

Касательно CRC32 и md5
Во-первых, md5 — это в hex-представлении 32 символа на хеш, а в Base64 представлении итого меньше.
Но по сравнению с максимумом в 50 символов, какой-то сомнительный выигрыш, экономите на копейках.
Во-вторых, каким образом тогда собираетесь использовать LIKE для поиска?
md5(«abc») — это не like concat(md5(«ab»), '%')

Вывод: делайте и не парьтесь о размерах.

Сведения об ответе

SILA

03:07, 7th August, 2020

Могу посоветовать использовать смешанный подход, в как DaBase. См. реализацию.

Т.е. там задействуется как Nested Sets принцип (что ускоряет выборку дочерних элементов), также у каждого узла имеют место быть параметры parent_id и level.

Сведения о вопросе

Gaukhar

16:08, 9th August, 2020

Теги

Организация хранения структуры категорий в реляционной БД?

Сведения об ответе

ЯЯ__4

08:04, 4th August, 2020

Может быть стоит все просто кешировать в MemcacheDB и при перестроении менять записи в кеше?

Ключ path
Внутри массив со строкой категории из БД + массив для хлебных крошек

Сведения об ответе

LIZA

22:43, 27th August, 2020

Сведения об ответе

lesha

23:30, 11th August, 2020

Сведения об ответе

SILA

03:07, 7th August, 2020

Ответить на вопрос

Как зайти в Даркнет?! 25th January, 01:11 189 0

Программа, которая создает фейковые сервера в поиске игровых серверов CS 1.6 Steam 21st March, 17:43 1161 0

Очень долго работает Update запрос Oracle 27th January, 09:58 1068 0

не могу запустить сервер на tomcat HTTP Status 404 – Not Found 21st January, 18:02 1043 0

Где можно найти фрилансера для выполнения поступающих задач, на постоянной основе? 2nd December, 09:48 1085 0

Разработка мобильной кроссплатформенной военной игры 16th July, 17:57 1881 0

период по дням 25th October, 10:44 4099 0

Пишу скрипты для BAS только на запросах 16th September, 02:42 3863 0

Некорректный скрипт для закрытия блока 14th April, 18:33 4792 0

прокидывать exception в блоках try-catch JAVA 11th March, 21:11 4528 0

Помогите пожалуйста решить задачи 24th November, 23:53 6284 0

Не понимаю почему не открывается детальное описание продукта 11th November, 11:51 4491 0

Нужно решить задачу по программированию на массивы 27th October, 18:01 4578 0

Метода Крамера С++ 23rd October, 11:55 4475 0

помогите решить задачу на C++ 22nd October, 17:31 4146 0

Помогите решить задачу на python с codeforces 22nd October, 11:11 4619 0

Python с нуля: полное руководство для начинающих 18th June, 13:58 2743 0

Все вопросы

Сведения о вопросе

Gaukhar

16:08, 9th August, 2020

Теги

Организация хранения структуры категорий в реляционной БД?

Сведения об ответе

ЯЯ__4

08:04, 4th August, 2020

Может быть стоит все просто кешировать в MemcacheDB и при перестроении менять записи в кеше? Ключ path Внутри массив со строкой категории из БД + массив для хлебных крошек

Сведения об ответе

LIZA

22:43, 27th August, 2020

Сведения об ответе

lesha

23:30, 11th August, 2020

Сведения об ответе

SILA

03:07, 7th August, 2020

Ответить на вопрос

Как зайти в Даркнет?!

25th January, 01:11

189

0

Программа, которая создает фейковые сервера в поиске игровых серверов CS 1.6 Steam

21st March, 17:43

1161

0

Очень долго работает Update запрос Oracle

27th January, 09:58

1068

0

не могу запустить сервер на tomcat HTTP Status 404 – Not Found

21st January, 18:02

1043

0

Где можно найти фрилансера для выполнения поступающих задач, на постоянной основе?

2nd December, 09:48

1085

0

Разработка мобильной кроссплатформенной военной игры

16th July, 17:57

1881

0

период по дням

25th October, 10:44

4099

0

Пишу скрипты для BAS только на запросах

16th September, 02:42

3863

0

Некорректный скрипт для закрытия блока

14th April, 18:33

4792

0

прокидывать exception в блоках try-catch JAVA

11th March, 21:11

4528

0

Помогите пожалуйста решить задачи

24th November, 23:53

6284

0

Не понимаю почему не открывается детальное описание продукта

11th November, 11:51

4491

0

Нужно решить задачу по программированию на массивы

27th October, 18:01

4578

0

Метода Крамера С++

23rd October, 11:55

4475

0

помогите решить задачу на C++

22nd October, 17:31

4146

0

Помогите решить задачу на python с codeforces

22nd October, 11:11

4619

0

Python с нуля: полное руководство для начинающих

18th June, 13:58

2743

0

Может быть стоит все просто кешировать в MemcacheDB и при перестроении менять записи в кеше?

Ключ path
Внутри массив со строкой категории из БД + массив для хлебных крошек