Список вопросов
Как зайти в Даркнет?!
25th January, 01:11
6
0
Как в tkinter из поля ввода Entry получить значение в одну переменную и обновить строку кнопкой, затем получить ещё одно введённое значение и затем сложить их. Ниже пример кода
21st July, 19:00
895
0
Программа, которая создает фейковые сервера в поиске игровых серверов CS 1.6 Steam
21st March, 17:43
948
0
Очень долго работает Update запрос Oracle
27th January, 09:58
914
0
не могу запустить сервер на tomcat HTTP Status 404 – Not Found
21st January, 18:02
906
0
Где можно найти фрилансера для выполнения поступающих задач, на постоянной основе?
2nd December, 09:48
938
0
Разработка мобильной кроссплатформенной военной игры
16th July, 17:57
1724
0
период по дням
25th October, 10:44
3955
0
Пишу скрипты для BAS только на запросах
16th September, 02:42
3720
0
Некорректный скрипт для закрытия блока
14th April, 18:33
4613
0
прокидывать exception в блоках try-catch JAVA
11th March, 21:11
4381
0
Помогите пожалуйста решить задачи
24th November, 23:53
6086
0
Не понимаю почему не открывается детальное описание продукта
11th November, 11:51
4351
0
Нужно решить задачу по программированию на массивы
27th October, 18:01
4396
0
Метода Крамера С++
23rd October, 11:55
4309
0
помогите решить задачу на C++
22nd October, 17:31
4002
0
Помогите решить задачу на python с codeforces
22nd October, 11:11
4492
0
Python с нуля: полное руководство для начинающих
18th June, 13:58
2599
0
Организация хранения структуры категорий в реляционной БД?
Просмотров: 379
 
Ответов: 4
Задача — организовать хранение некоего каталога, с достаточно разветвлённой структурой (дерево) — пускай это будет каталог продукции интернет-магазина. Для поиска элемента доступен только URI вида "/category/subcategory/another-category/and-one-more-category". Максимальная вложенность порядка 10.
Категории запрашиваются часто, меняются редко, общее количество категорий может быть порядка 100 тыс.
Так же требуется шустрая генерация «хлебных крошек». Причём ссылка на категорию («and-one-more-category») может отличаться от её заголовка («И ещё одна категория»), который используется для вывода на странице.
У меня пока одно предполагаемое решение — «в лоб» — по следам Materialized path:
таблица для категорий имеет следующую структуру
CREATE TABLE categories (
`id` INT NOT NULL AUTO_INCREMENT PRIMARY KEY,
`title` VARCHAR(50) NOT NULL,
`link` VARCHAR(50) NOT NULL,
`path` VARCHAR(1000) NOT NULL,
`title_path` VARCHAR(1000) NOT NULL
)
CREATE INDEX path_indx ON categories (`path`);
`title` — заголовок категории («И ещё одна категория»),
`link` — ссылка категории («and-one-more-category»),
`path` — путь к категории («category/subcategory/another-category/and-one-more-category»),
`title_path` — то же, что и `path`, только содержит заголовки соответствующих категорий — для быстрой генерации «хлебных крошек»
— Привлекает то, что для поиска категории не нужно никаких усилий — просто SELECT… WHERE path LIKE…
— Не пугает даже необходимость перестроения путей в случае перемещения/переименования узлов.
— Пугает избыточность подхода и вероятные размеры таблицы при большом количестве категорий. Насколько это скажется на скорости?
— Так же смущает то, что в качестве ключа для поиска используется такая длинная строка в `path` (хотя я очень сомневаюсь что она когда-либо выйдет за пределы 100 символов)
Может вынести `path` и `title_path` в отдельную таблицу? Так всё равно путь и хлебные крошки для категории требуется практически всегда, так что придётся джойнить…
Смотрю в сторону Full hierarchy, но опять же смущает возможная избыточность в таблице иерархии, тем более учитывая потенциальные количества категорий и уровни вложенности.
Как более оптимально решить задачу?
нужно ли предусматривать возможность изменения родительской категории, например при редактировании подкатегории (category/subcategory/… на category/subcategory-1/)? если нет, то возможно Ваш вариант подходит. Если надо предусмотреть эту возможность, да и вообще иметь более гибкую структуру — советую погуглить nested sets
100 000 категорий — это 5 символов на узел в пути. 10*5 — максимальный путь на категорию.
Итого максимум 5 мегабайт данных. Реально — в разы меньше.
Не тот размер, о котором стоит переживать.
Касательно CRC32 и md5
Во-первых, md5 — это в hex-представлении 32 символа на хеш, а в Base64 представлении итого меньше.
Но по сравнению с максимумом в 50 символов, какой-то сомнительный выигрыш, экономите на копейках.
Во-вторых, каким образом тогда собираетесь использовать LIKE для поиска?
md5(«abc») — это не like concat(md5(«ab»), '%')
Вывод: делайте и не парьтесь о размерах.
Могу посоветовать использовать смешанный подход, в как DaBase. См. реализацию.
Т.е. там задействуется как Nested Sets принцип (что ускоряет выборку дочерних элементов), также у каждого узла имеют место быть параметры parent_id и level.
Чтобы ответить на вопрос вам нужно войти в систему или зарегистрироваться