Сведения о вопросе

Solllo

01:57, 1st August, 2020

Теги

Как работают программы распознавания музыки?

Просмотров: 327   Ответов: 2

В частности, для андройда есть shazam. Получалось распознавать даже играющее фоном радио в столовой :)
Очень интересно, как это работает. Ясно, что есть некая база. Но что в этой базе храниться? Как убираются шумы?



  Сведения об ответе

DO__IT

08:31, 25th August, 2020

Вот, здесь доступно описан алгоритм (англ.) http://laplacian.wordpress.com/2009/01/10/how-shazam-works/


  Сведения об ответе

SEEYOU

22:19, 9th August, 2020

Привет, точно я конечно сказать не могу, но скорее всего и используется трансформация Фурье (FFT), и соответствующий набор фильтров. Фильтры срезают шумы выше и ниже каких-то уровней (ухо слышит где-то от 6 до 20000 герц, но я думаю срез они делают намного уже). Потом этот срез раскладывается через FFT. Можно себе это представить как разложение песни на частотные компоненты. Много баса — коэффициенты нижних частот будут выше. Много высоких звуков (hi-hat) — верхние компоненты будут выше. Получается отпечаток песни. Когда ты загружаешь туда свою запись с айфона сервер пытается подыскать самый похожий отпечаток.
Там наверняка тренируются алгоритмы AI и дата-майнинга чтобы искать наиболее эффективнее. Простейший пример это искусственная нейронная сеть (всё есть в вики).


Ответить на вопрос

Чтобы ответить на вопрос вам нужно войти в систему или зарегистрироваться