마스터 파일 하나로 끝내는 원스톱 현지화
가우디오랩은 AI 콘텐츠 현지화 플랫폼 ‘가우디오 스튜디오 프로(GSP)’를 통해 영화와 드라마의 해외 수출 과정을 혁신적으로 단축했다. 기존에 성우 섭외, 녹음, 검수, 음악 저작권 처리, 영상 편집까지 두 달 이상 소요되던 작업을 일주일로 줄이는 것이 핵심 목표다. 특히 구작처럼 대사·음악·효과음(D/M/E)이 분리되지 않고 하나로 믹싱된 마스터 파일만 남은 경우에도, GSEP 엔진을 통해 이를 깨끗하게 추출해 더빙과 자막 제작을 가능하게 한다.

서비스는 주문형으로 운영되며, 방송국이나 스튜디오가 원본 파일을 업로드하면 며칠 뒤 완성된 현지화 결과물을 받을 수 있다. 분리된 대사 트랙은 음성-텍스트 변환(STT)을 거쳐 타임코드가 찍힌 대본으로 가공되고, 이를 바탕으로 AI가 1차 더빙본을 생성한다. 이때 말의 속도, 캐릭터별 보이스 일관성, 음질 등은 사람이 검수하는 HITL(Human-in-the-Loop) 방식을 적용해 품질을 통제하며, 배경음악은 저작권이 없는 클린 음악 라이브러리에서 무드에 맞게 자동 교체된다.
영상 후반 작업도 함께 수행되어 더빙된 음성에 맞춰 배우의 입술 모양을 조정하는 립싱크 기술과, 수출 시 문제가 될 수 있는 로고나 장면을 가리는 블러·컷 기능이 포함된다. 사용자는 GSP 자체 플레이어에서 타임라인을 따라가며 마음에 들지 않는 구간에 코멘트를 남길 수 있고, 이는 즉시 작업자에게 전달되어 수정되므로 피드백 루프가 제품에 내장된 구조다. 이러한 프로세스를 통해 처리 시간이 약 90% 단축되고 인력 및 비용 부담도 크게 줄어든다.
세계 1위 음원 분리 기술과 글로벌 시장 공략
GSP의 기반이 되는 AI 음원 분리 엔진 GSEP은 MusicRadar 등 해외 유수 미디어로부터 ‘세계 1위’로 평가받을 만큼 높은 성능을 자랑한다. 일반적인 보컬·반주 분리와 달리, 영상 콘텐츠 더빙에 필요한 D/M/E 분리는 바람 소리나 군중 소리 같은 환경음 속에서 대사만 깨끗하게 걸러내야 하므로 난이도가 훨씬 높다. GSEP은 음악 속 보컬과 영상 속 대사를 변별하도록 특별히 학습되어 있으며, 개발 중인 ‘DQE(Dubbing Quality Evaluator)’ AI는 화자 톤 유사도, 감정 연기, 음질 등을 자동으로 평가하여 사람의 귀로 듣던 검수 과정을 대체한다.

가우디오랩은 2026 대한민국 임팩테크 대상 대통령상과 CES 혁신상을 수상하며 기술력과 사업성을 동시에 인정받았고, NAB Show 2026에서는 미주와 남미 지역 고객들의 두드러진 관심을 얻었다. 자막 선호도가 높은 한국과 달리 더빙을 선호하는 남미 시장의 특성이 호재로 작용했으며, PoC(Proof of Concept) 단계를 거쳐 정식 서비스로 이어지는 사례가 늘고 있다. 현재 29개국 언어를 지원하며, SBS ‘런닝맨’ 등 주요 콘텐츠의 송출 경험을 바탕으로 미국·일본·중국·유럽 등으로 배급망을 확대하고 있다.
앞으로 가우디오랩은 더빙 검수를 함께할 언어 전문가 풀을 두텁게 확보하고, 더빙 품질에 대한 데이터와 레퍼런스를 쌓아 글로벌 고객을 놓치지 않을 계획이다. K콘텐츠가 이미 글로벌 유통망 위에 올라 있는 상황에서, 얼마나 빠르고 합리적인 비용으로 높은 품질의 현지화를 제공할 수 있느냐가 시장 확장의 핵심 변수다. 가우디오랩은 음량평준화(LM1) 기술까지 적용해 플랫폼 간 음량 편차를 해소하고, 안정적인 청취 경험을 보장하며 K콘텐츠 수출의 판을 바꾸는 데 주력할 예정이다.