Присоединяйтесь к нашим группам

Дайджест сервисов для распознавания музыки

Дайджест сервисов для распознавания музыки
Сколько раз вы хотели узнать, что за песня играет по радио/из соседней машины/со двора/из окна дома напротив? И в скольких случаях окружающие могли дать правильный ответ? Сегодня наш разговор пойдёт о сервисах, которые могут это сделать с эффективностью в 80%.
29 07 2015
15:56

Наша самая большая проблема состоит в том, что наш мозг – не компьютер. Он не может хранить в себе терабайты информации, которая требуется один или два раза в жизни, без изменений. Именно поэтому мы радостно забываем интегралы, которые учили в школе и в ВУЗе, дни рождения троюродных тётушек и время записи к зубному.

Но даже если бы могли помнить всё это, то для того, чтобы узнать, как называется песня, которую мы слышали первый раз, нам пришлось бы прослушать все композиции этого жанра, которые были созданы за период существования музыкальной индустрии. Сколько времени это бы у нас заняло? Ну, с ограничением в пять лет (примерно с такой точностью можно логически определить период, в который был записан трек), это бы заняло около года.

А всё потому, что наш мозг не в состоянии обрабатывать потоки данных на высокой скорости. Зато это могут сделать специальные программы, определяющие, что за музыка сейчас играет, всего за несколько секунд.

Shazam

Самый популярный сервис, появившийся в своё время на обычных телефонах в виде платного сервиса, где клиент должен был позвонить на телефонный номер, поднести телефон к источнику звука для записи, после чего ему приходило СМС-сообщение с названием песни, если таковая была в базе. Вместе с информацией приходило предложение купить эту мелодию в виде рингтона – вот такой оригинальный способ монетизации. В век смартфонов первым из тех, кто приметил этот сервис, стала компания Apple. Именно в виде приложения для iPhone Shazam стал популярен и приобрёл современный вид.

Как он работает?

Любая запись уникальна сама по себе. Она характеризуется многими показателями – ритмом, используемыми при создании композиции инструментами, обладающими разным звучанием, но всё это отражается на звуковой дорожке в виде пиков, которые выглядят примерно так:

Как бы похоже ни звучали для человеческого уха две разные мелодии, техника, которая занимается воспроизведением, никогда их не перепутает.

В тот момент, когда вы подносите телефон к источнику звука, программа через динамик получает данные, которые превращает в отрезок звуковой дорожки. После того, как он достигнет длины, достаточной для идентификации, Shazam запускает процедуру сличения отрезка с мелодиями в его базе. А так как он объединён с самыми крупными хранилищами музыки (компании Apple и Google, соответственно), то вероятность нахождения совпадения, а значит, и нужной песни, крайне высока.

Сама технология объясняет, почему при наличии большого количества шумов найти соответствие записи с композицией не удаётся: посторонние звуки меняют карту песни.

Кстати, этот сервис всё так же позволяет купить понравившуюся мелодию, но кроме того, может показать полный текст песни и даже выполнять функцию караоке, выделяя исполняемую в данный момент строку.

Этот сервис для распознавания музыки, разумеется, не является единственным в своём роде. На мобильных платформах также популярно приложение SoundHound (правда, только для iPhone и Android). Оно отличается тем, что вам достаточно близко к мелодии напеть композицию (или «намычать» её), чтобы получить результат. 

Это приложение даёт осечку куда чаще. Вернее, оно часто делает неверное предположение на основе карты, составленной по вашему исполнению. Почему?

Тут работает тот же принцип, похожий отчасти на сличение ДНК. Чем больше ваш отрывок совпадает по общей картине с каким-либо другим, тем больше вероятность, что это – одна и та же композиция. Разумеется, в исполнении а капелла пиков на схеме будет меньше, что приводит к разночтениям и ошибкам программы.

Однако другой такой возможности получить название песни, основываясь исключительно на воспоминаниях, не существует.

Модифицированная версия сервиса SoundHound, который существует только для двух мобильных платформ, есть и для ПК. Называется он Midomi и работает абсолютно по тому же принципу. Кстати, то, что в него можно напеть песню, не означает, что он не сможет опознать записанный трек, как Shazam. Возможности этих сервисов в плане опознания проигрываемых композиций совершенно одинаковы.

Подобным сервисом также является менее распространённый Tunatic. Его более низкая популярность объясняется просто – он не распознаёт классическую музыку. Кроме того, он не работает, если вы работаете через удалённое соединение через прокси-сервер.

А что можно сказать про видео? Часто в кино или сериале на заднем плане играет песня, которая запоминается, вертится в голове, но что это за сингл – неизвестно. Можно, конечно, попробовать напеть её, но это не всегда удобно, так что нужно искать другие способы. Решением этой проблемы является сервис Moomash для распознавания музыки из видео. Он вычленяет одну из нескольких звуковых дорожек записи и определяет песню за те же пару десятков секунд.

Готовы ли вы пойти ещё дальше? Скорее прикольный, чем на самом деле функциональный, сервис SongTapper (Bored.com) позволяет определить песню по тому, как вы нажимаете клавишу «пробел». Да, эта программа отслеживает только ритм, который вы отбиваете, строя по нему краткую карту песни. Это очень полезно, если ваши вокальные данные оставляют желать лучшего. Но число ошибок и неидеально чувство ритма у конкретного человека явно снижают эффективность приложения.

Это – далеко не весь перечень сервисов для распознавания музыки на сегодняшний день. Они существуют для всех оперативных систем и для большинства устройств, которые в принципе могут поддерживать подобные приложения. Мы же рассказали о принципах работы самых популярных и интересных вариантов.

Дмитрий Потапкин, специально для Обзор.press.