Сведения о вопросе

Ayrat

19:30, 26th August, 2020

Как я могу искать контент в пределах audio files/streams?

Просмотров: 481 Ответов: 1

Я всегда задавался вопросом, сколько существует различных методов поиска, для поиска текста, для поиска изображений и даже для видео.

Однако я никогда не сталкивался с решением, которое искало бы содержимое в аудиофайлах.

Например: предположим, что у меня есть около 200 подкастов, загруженных в мой PC в виде файлов mp3, wav и ogg. Все они имеют общее название, скажем, podcast1.mp3, podcast2.mp3 и т. д. Таким образом, невозможно узнать, что такое содержание, не услышав их на самом деле. Скажем так, мне интересно узнать, о чем говорят подкасты 'game programming'. Я хочу, чтобы результаты были показаны как:

Podcast1.mp3 - 3 результат(ы) по временному индексу(ы) - 0:16:21, 0:43:45, 1:12:31

Podcast21.ogg-1 результат(ы) по временному индексу(ам) - 0:12:01

Так что мои вопросы:

Как можно было бы подойти к этой проблеме?

Существуют ли подходящие алгоритмы, разработанные для выполнения чего-то подобного?

Одна идея, возникшая у меня в голове, заключалась в том, что можно было бы использовать программное обеспечение " speech-to-text " для получения транскриптов вместе с индексами времени для каждого из аудиофайлов, а затем проанализировать транскрипт, чтобы получить результат.

Я рассматривал это как один из моих хобби-проектов. Спасибо!

Сведения об ответе

DAAA

11:25, 16th August, 2020

Если вы хотите искать текст (т. е. то, что говорится) внутри аудиопотока, вам придется обработать его с помощью какого-то алгоритма распознавания речи и сохранить текст в виде метаданных, связанных с файлами. Для видео вы также можете сделать распознавание текста для текста внутри видео. Evernote уже делает это для текста внутри графических файлов, но, насколько мне известно, не поддерживает аудио.

Нечто подобное возможно при использовании аудио для поиска звука. Я не знаю подробностей этих алгоритмов, но предполагаю, что они включают в себя какой-то частотный анализ. Shazam использует такую технологию для идентификации песен на основе аудиоклипов.

Вот некоторые статьи Википедии, которые могут быть полезны:

Распознавание речи

быстрое преобразование Фурье

Частотный анализ (частотный спектр)

Оптическое распознавание символов (OCR)

Сведения о вопросе

Ayrat

19:30, 26th August, 2020

Теги

Как я могу искать контент в пределах audio files/streams?

Сведения об ответе

DAAA

11:25, 16th August, 2020

Ответить на вопрос

Как зайти в Даркнет?! 25th January, 01:11 174 0

Программа, которая создает фейковые сервера в поиске игровых серверов CS 1.6 Steam 21st March, 17:43 1149 0

Очень долго работает Update запрос Oracle 27th January, 09:58 1057 0

не могу запустить сервер на tomcat HTTP Status 404 – Not Found 21st January, 18:02 1031 0

Где можно найти фрилансера для выполнения поступающих задач, на постоянной основе? 2nd December, 09:48 1072 0

Разработка мобильной кроссплатформенной военной игры 16th July, 17:57 1869 0

период по дням 25th October, 10:44 4087 0

Пишу скрипты для BAS только на запросах 16th September, 02:42 3849 0

Некорректный скрипт для закрытия блока 14th April, 18:33 4770 0

прокидывать exception в блоках try-catch JAVA 11th March, 21:11 4515 0

Помогите пожалуйста решить задачи 24th November, 23:53 6263 0

Не понимаю почему не открывается детальное описание продукта 11th November, 11:51 4479 0

Нужно решить задачу по программированию на массивы 27th October, 18:01 4560 0

Метода Крамера С++ 23rd October, 11:55 4462 0

помогите решить задачу на C++ 22nd October, 17:31 4128 0

Помогите решить задачу на python с codeforces 22nd October, 11:11 4608 0

Python с нуля: полное руководство для начинающих 18th June, 13:58 2731 0

Все вопросы

Сведения о вопросе

Ayrat

19:30, 26th August, 2020

Теги

Как я могу искать контент в пределах audio files/streams?

Сведения об ответе

DAAA

11:25, 16th August, 2020

Ответить на вопрос

Как зайти в Даркнет?!

25th January, 01:11

174

0

Программа, которая создает фейковые сервера в поиске игровых серверов CS 1.6 Steam

21st March, 17:43

1149

0

Очень долго работает Update запрос Oracle

27th January, 09:58

1057

0

не могу запустить сервер на tomcat HTTP Status 404 – Not Found

21st January, 18:02

1031

0

Где можно найти фрилансера для выполнения поступающих задач, на постоянной основе?

2nd December, 09:48

1072

0

Разработка мобильной кроссплатформенной военной игры

16th July, 17:57

1869

0

период по дням

25th October, 10:44

4087

0

Пишу скрипты для BAS только на запросах

16th September, 02:42

3849

0

Некорректный скрипт для закрытия блока

14th April, 18:33

4770

0

прокидывать exception в блоках try-catch JAVA

11th March, 21:11

4515

0

Помогите пожалуйста решить задачи

24th November, 23:53

6263

0

Не понимаю почему не открывается детальное описание продукта

11th November, 11:51

4479

0

Нужно решить задачу по программированию на массивы

27th October, 18:01

4560

0

Метода Крамера С++

23rd October, 11:55

4462

0

помогите решить задачу на C++

22nd October, 17:31

4128

0

Помогите решить задачу на python с codeforces

22nd October, 11:11

4608

0

Python с нуля: полное руководство для начинающих

18th June, 13:58

2731

0