해당 글은 <신문과방송> 2023년 12월호에 수록되어 있습니다.
명성과 달리 오랫동안 적자를 면하지 못한 음악 스트리밍 서비스 스포티파이가 새로운 도전에 나섰다. AI를 이용한 오디오 DJ, 팟캐스트 서비스를 선보인 것. 이용자가 원하는 언어와 음성으로 음악을 추천해 언어의 장벽을 허물고 있는 이 서비스들의 특징과 시사점을 확인해본다.
편집자 주
1990년대 후반 대한민국 가요계에 신비주의 바람이 불었던 적이 있다. 그래서 몇몇 연예기획사들은 대중에게 소속 가수들의 신비주의 이미지를 심어주고자 얼굴 없이 노래만 공개하기도 했는데, 신비주의 콘셉트로 유명했던 가수로는 조성모와 김범수, 그리고 브라운아이즈가 있다. 그룹 브라운아이즈는 ‘김나박이(김범수, 나얼, 박효신, 이수)’로 대표되는 국내 톱 가수 중 한 명인 나얼이 속해있는 그룹이다. 이들의 신비주의가 얼마나 심했냐면 브라운아이즈가 2집 앨범을 발매하고 앨범 판매량이 70만 장을 넘길 때까지 이들이 공식적으로 무대에 선 횟수가 단 1회일 정도였다.
이들의 신비주의가 통했던 이유는 무엇일까? 바로 이들의 노래와 목소리가 대중들이 듣기에 대단히 좋았기 때문이다. 이처럼 가요의 대중적인 성공에 목소리란 매우 중요한 요소인데, 이제 이 목소리의 대중성을 만들 수 있는 시대가 왔다. 그리고 이 시대를 가장 앞서 만들어 나가고 있는 기업은 스트리밍의 대중화를 이끈 ‘스포티파이’다.
스포티파이(Spotify)는 스웨덴 출신의 다니엘 에크(Daniel Ek)와 마틴 로렌손(Martin Lorentzon)이 2006년에 설립한 세계 최고의 음원 스트리밍 서비스다. 지금의 스트리밍 시스템을 스포티파이가 만들었다고 해도 과언이 아닌데, 스포티파이의 창업 역사에 대해 더 알고 싶다면 넷플릭스의 <플레이리스트(Playlist)>를 보면 된다.
스포티파이는 노래, 팟캐스트 DJ와 같은 오디오 콘텐츠 및 스트리밍 데이터 등 음악과 관련해 세계에서 가장 많은 데이터를 확보하고 있다. 그런데 여기에는 뼈아픈 이면이 있다. 바로 영업이익은 스포티파이가 론칭한 2008년 이후 14년째 적자라는 것이다. 2022년 적자 규모는 전년 대비 114% 증가한 €0.65B(약 9,230억 원)이었다. 계속되는 적자에는 여러 이유가 있지만 가장 큰 이유는 스포티파이가 워너브라더스, 소니뮤직과 같은 음원 배급사에 지급하는 음원 저작권료가 전체 매출의 약 70%를 차지하고 있기 때문이다. 이처럼 매출의 30%만 가지고 서비스를 운영하다 보니 스포티파이는 만성 적자에서 벗어나지 못하고 있다. 때문에 최근 스포티파이는 저작권 기반의 스트리밍 서비스 외에 광고 기반의 팟캐스트, 오디오 DJ, 오디오북 같은 서비스를 본격적으로 출시하고 확장하기 시작했다(스포티파이 이용자는 광고 기반의 무료 사용자와 유료 프리미엄 고객으로 구분되어 있다).
스트리밍 서비스 이외 분야로의 사업 확장은 처음에는 지지부진했지만, 코로나19라는 시대적 상황을 만나 급변하게 된다. 집에 머무르는 시간이 많아진 사람들은 다양한 오디오 콘텐츠를 찾아 나섰고 그 결과 이 시기에 팟캐스트, 오디오 DJ 서비스는 큰 성장을 이룬다. 실제로 스포티파이의 2022년 4분기 광고 매출은 전년 대비 14% 증가했고, 이 중 팟캐스트 광고 매출은 전체 광고 매출의 30%에 달한다. 이렇게 팟캐스트 서비스의 가능성을 본 스포티파이는 팟캐스트에 음성 AI 도입을 본격적으로 시작한다.
국경을 초월한 오디오 생태계의 시작
그렇다면 스포티파이는 어떤 음성 AI를 준비하고 있을까? 스포티파이는 그간 사용자들에게 ‘모두를 위한 음악(Music for Everyone)’, ‘당신 인생의 사운드트랙(Soundtrack Your Life)’ 태그라인(tagline, 슬로건)으로 마케팅해 왔다. 여기에는 국경을 초월한 오디오 생태계를 만들겠다는 생각이 담겨 있다고도 볼 수 있다. 그래서 스포티파이는 오디오 DJ와 팟캐스트 두 개의 영역에서 AI 적용 서비스를 선보였다.
먼저 오디오 DJ에 적용된 AI인 ‘AI DJ’ 서비스를 소개한다. 이는 쉽게 말해서 <배철수의 음악캠프>를 AI로 구현한 것이다. 배철수 DJ가 지금 듣기 좋은 음악을 청취자들에게 ‘배철수의 음성’으로 추천해 주는 것처럼 AI DJ 역시 내 음악 취향에 맞는 플레이리스트를 내가 좋아하는 DJ의 음성으로 추천해 주는 것이다. 실제로 이 서비스에서는 음악 추천과 함께 애플의 인공지능 시리(Siri)처럼 “제가 당신을 위해 플레이리스트를 만들어 왔어요. 첫 번째 곡은 BTS의 ‘봄날’이에요”와 같은 음성이 제공된다.
두 번째는 팟캐스트 서비스다. 스포티파이는 실시간 자동 재생 AI 번역 팟캐스트를 출시했다. 이 서비스를 간략히 요약하자면 내가 좋아하는 팟캐스트를 내가 좋아하는 팟캐스터의 느낌을 그대로 살려 듣는 사람의 모국어(native language)로 바꿔주는 것이다. 이해를 돕기 위해 예를 들면, 만약 유튜브 채널인 <슈카월드>를 좋아해 매일 유튜브 자막을 켜고 <슈카월드>를 보는 미국인이 스포티파이 AI를 사용한다면 유튜버 슈카의 억양과 목소리가 적용된 영어로 <슈카월드>를 볼 수 있는 것이다.
그렇다면 스포티파이는 왜 가요를 놔두고 오디오 DJ, 팟캐스트에 AI를 적용하는 걸까? 이에 대한 공식적인 내용은 발표되지 않았다. 필자의 견해로는 팟캐스트, 오디오 DJ가 가요와는 다르게 상대적으로 저작권 이슈로부터 자유롭고, 적자를 줄이기 위해 가요 외적인 서비스를 키워야 하기 때문인 듯하다.
이를 위해 스포티파이는 오픈AI가 발표한 다국어 음성 인식 ‘위스퍼(Whisper)’를 이용할 계획이다. 위스퍼는 영어 음성을 받아적어 다른 언어로 번역하는 것에 특화된 AI다. 그래서 댁스 셰파드(팟캐스트: Armchair Expert), 모니카 패드먼(팟캐스트: Armchair Expert), 빌 시몬스(팟캐스트: The Bill Simmons Podcast) 등 소수의 팟캐스터와 제휴를 맺고 이들의 영어 팟캐스트를 스페인어로, 그리고 수 주 안에는 프랑스어, 독일어 실시간 자동 번역으로 확대할 계획이다.
한국 콘텐츠도 세계 시장 공략할 수 있어야
스포티파이의 AI 도입이 한국 콘텐츠 시장에 어떤 영향을 미칠까? 지금 당장 떠오르는 건 전 세계 유명 오디오 콘텐츠가 그 음성과 억양 그대로 한국어로 한국 시장을 공략할 수 있게 되었다는 것이다. 하지만 이는 반대로 국내 유명 콘텐츠들도 그렇게 할 수 있다는 것을 의미한다. 이 말은 이제 콘텐츠들은 글로벌 경쟁을 피할 수 없다는 것이다.
이런 상황에서 가장 앞서나가고 있는 미디어 채널은 방송사, 연예기획사, 신문사도 아닌 <피식대학>이라고 생각된다. 피식대학은 한국어와 외국어를 섞은 ‘피식쇼’를 통해 국내 팟캐스트, 유튜브 시장에 혁신을 더해 백상예술대상까지 받았다. 이제 더 이상 국내 문화만을 고집할 수 없는 상황이다. 앞으로 피식쇼와 같이 해외 문화와 한국 문화를 섞은 다양한 콘텐츠가 더 많이 나왔으면 하는 바람이다.
위 기사는 <신문과방송> 2023년 12월호에 수록되어 있습니다.