본문 바로가기

IT

[IT]사운드하운드

반응형

오늘은 삼성과 네이버가 관심을 가지고 있는 사운드하운드라는 스마트폰 애플리케이션에 대해 이야기해보고자 합니다.

음악을 좀 하는 뮤지션이라면 대부분 알고 있을 앱입니다.혹시 오래전에 다음 광고 기억하시는지 모르겠습니다. 길가에 음악이 나오고 모델은 이야기합니다. 이 음악이 무엇이지? 그리고 휴대폰을 키고 뭔가 하더니 휴대폰에서 음악정보는 알려줍니다.

 바로 그런 역할과 기능을 가진 앱이라고 할 수 있습니다. 레스토랑에서 식사를 하고있거나 길거리를 지나다닐 때 나오는 음악소리가 왜인지 모르게 낯익은데 잘 알지 못하는 경우가 있습니다. 자주 들어본 멜로디가 내 귀를 즐겁게 합니다. 나도 모르게 같이 리듬을 탑니다. 우연히 만나는 음악을 이제 정면으로 마주쳐서 알 수 있습니다. 이 애플리케이션을 실행시켜서 앨범 정보를 얻을 수 있기 때문입니다.

 아무래도 음악의 세계가 방대하기 때문에 미쳐 데이터베이스에 등록되지 못한 인디음악들이 있을텐데요. 특히 우리나라에서 자주 들을 수 있는 인디음악이 검색이 안 되는 경우가 있기도 합니다.

 그럴 경우에는 차선책으로 네이버에서 찾으면 엥간한 음악은 찾을 수 있다고 하니 너무 걱정하지 않아도 됩니다.

 최근 삼성과 네이버에서 사운드하운드에 관심을 가지고 있다는 기사를 접했습니다. 다들 알고 계시겠지만, 스마트 홈의 IoT와 인간의 접점은 현재 음성비서입니다. 아마존과 구글이 신경을 쓰고 아마존의 에코, 구글의 구글홈 판매를 하는 것으로 알고 있습니다.

 모하저가 이끄는 사운드하운드도 이러한 관점에서 네이버 , 라인, 삼성전자, 엔비디아 등으로 구성된 컨소시엄으로부터 7천500만달러 투자 유치에 성공했다고 합니다.

 2005년 미국 캘리포니아주 산타클라라에서 시작한 사운드하운드는 스피치투미닝이라는 기술을 사용합니다. 케이반 모하저 CEO는 2015년에 개발자들이 만드는 어떤 앱에서도 음성 기반 인터페이스를 적용할 수 있게 하겠다는 야심찬 포부를 밝힌 바 있습니다. 현재 시점까지 가장 적합한 기기와의 접점은 '터치 앤 탭'이었습니다. 이것을 이제는 음성으로 바꾸겠다는 것입니다. 스티브 잡스의 프리젠테이션이 생각나게 되는 대목입니다.

 기능만으로 봤을 때 오래전부터 존재했고, 애플의 시리, 구글의 어시스턴트와 어떠한 차별점이 존재하는지 이해하기 어려울 수 있습니다. 껍데기는 같지만 속알멩이는 전혀 다르다고 보시면 됩니다.

 자동 대화 인식과 자연어 이해를 한 엔진 안에서 처리하면서 대화의 반응 속도와 정확도를 높였다고 보입니다. 이것은 머신러닝과 딥러닝 기법을 통해 학습하는 과정을 통해 더욱 정교하게 다듬어진 결과를 내놓을 수 있게 됩니다.이것을 콜렉티브AI라고 하는 것 같습니다.

 어떻게 보면 이것도 플랫폼 경쟁이라고 볼 수 있습니다. 애플의 스티브잡스로 인해 플랫폼의 중요성이 부각되어 있는 시대이기 때문에 플랫폼을 선점하기 위한 시도라고 생각됩니다.

 정말 어벤져스에 나오는 아이언맨 스타크의 자비스가 곧 세상에 등장할지도 모르겠습니다. AR,VR과 점진적으로 발전하게 되면 그 꿈은 곧 이루질 것으로 보입니다.

반응형