식당에 갔는데 배경음악으로 노래가 흘러나오는 걸 본 적 있으신가요? 나중에 원곡을 듣고 싶으실지도 몰라요!
이것은 Shazam의 활용 사례입니다. Shazam은 사용자의 자연스러운 환경에서 녹음된 클립을 수집하여 해당 클립의 원곡을 찾아주는 오디오 검색 앱입니다.
저는 개인적으로 Shazam을 자주 사용해 봤는데, 아래 알고리즘이 정말 매력적이네요 :D
알고리즘:
노래의 각 시점의 주파수와 진폭을 그래프로 표시합니다.
이 그래프에서 진폭과 주파수 변화가 큰 지점을 찾습니다.
k개의 연속된 지점을 모두 사용하여 청크 집합을 만듭니다.
각 청크의 조합 해시를 구합니다.
이 해시를 DB에 저장합니다.
참고 자료:
/ how-shazam-works
http://coding-geek.com/how-shazam-works/https://www.ee.columbia.edu/~dpwe/pap...
00:00 사용 사례
00:20 노래 저장
01:32 저장 시 고려 사항
02:02 노래 표현
02:44 관심 지점
04:02 예시
05:59 시간 델타 변화
06:53 알고리즘 최적화
07:32 청크 간 검색
09:11 해시 - 노래 시그니처
10:19 감사합니다!
저를 팔로우하실 수 있는 곳은 다음과 같습니다.
웹사이트: https://interviewready.io/
Github: https://github.com/InterviewReady/sys...
트위터: / gkcs_
#알고리즘 #오디오 #해싱