AI 성우 음성은 2차 저작물로 인정될 수 있을까?
AI 성우 기술은 단순한 읽기 기능을 넘어, 인간의 억양, 감정, 속도, 발음을 모방하거나 창조할 수 있는 수준으로 발전했다. 특히 실제 성우의 음성을 수천 시간 이상 학습하여 특정한 말투와 감정을 구현하는 방식은 기존 TTS(Text-to-Speech) 기술과 차원이 다르다. 이러한 기술로 생성된 음성이 원작자인 성우의 말투, 억양, 음색과 상당히 유사하거나, 아예 해당 성우를 모델로 제작된 경우, 해당 음성은 단순한 기술적 결과물일까, 아니면 ‘2차 저작물’로 인정될 수 있을까?
저작권법상 2차 저작물은 기존 저작물을 바탕으로 새롭게 창작된 저작물을 의미한다. 음악의 편곡, 소설의 번안, 영상물의 리메이크 등이 대표적인 예이다. 그렇다면 AI가 생성한 성우 음성은 해당 성우의 ‘목소리’ 또는 ‘말하기 방식’을 원작으로 한 2차 저작물일 수 있을까? 이에 대한 논의는 법률, 기술, 창작권, 퍼블리시티권 등 여러 영역을 가로지르는 복합적인 쟁점이다. 본문에서는 AI 성우의 생성 음성을 둘러싼 2차 저작물 인정 가능성에 대해 구체적으로 분석한다.

AI 성우 음성과 저작권법상 2차 저작물의 정의와 요건
저작권법 제5조에 따르면, 2차 저작물이란 ‘원저작물을 번역·편곡·변형·각색·영상 제작 또는 그 밖의 방법으로 작성한 창작물’을 말한다. 여기서 중요한 요건은 원저작물에 대한 창작적 개입이 존재하고, 새로운 창작성이 나타나야 한다는 점이다. 예컨대 소설을 영화로 각색하는 경우, 기존 이야기를 바탕으로 다른 매체와 표현 방식으로 재구성했다는 점에서 2차 저작물로 인정된다.
이 개념을 AI 성우 음성에 적용해 보자. AI 성우 음성은 보통 하나 이상의 실제 성우 음성을 학습하여, 특정 스타일의 음성 합성 모델을 만든 후, 사용자 입력 텍스트에 따라 새로운 음성을 생성한다. 이때 생성된 음성은 원래의 성우가 직접 녹음한 것이 아니라, 해당 성우의 말투, 리듬, 억양 등을 데이터 기반으로 ‘재현’한 결과물이다.
문제는 이 음성이 창작성이 있는 표현으로 인정될 수 있는지, 그리고 원저작물에 해당하는 성우의 ‘목소리’가 저작권법상 보호 대상인지 여부다. 성우의 음성 자체는 저작물로 인정받기 어려울 수 있지만, 그 음성에 담긴 연기 방식이나 표현 방식은 창작성이 있는 것으로 볼 수 있다. 따라서 이를 학습한 AI 모델이 생성한 음성도 원저작물 기반의 2차 저작물로 해석될 여지가 존재한다.
AI 성우 음성의 창작 표현물 인정 가능성과 한계
AI가 생성한 음성이 과연 창작성을 인정받을 수 있을까? 이에 대해 현재 학계와 법조계에서는 신중한 입장을 보인다. 일반적으로 창작성이 인정되려면 ‘인간의 사상과 감정이 표현되어야 한다’는 요건이 있는데, AI는 자율적 창작이 아닌 알고리즘에 의한 결과 생성이라는 점에서 해당 요건을 충족하지 못할 수 있다.
하지만 최근에는 AI 생성물이 일정 조건으로 창작성의 일부를 인정받는 방향으로 논의가 확장되고 있다. 예를 들어, 사용자가 AI 성우에게 “밝고 경쾌한 톤으로, 20대 여성의 말투로, 약간의 감정이 실리도록”이라는 식으로 세부 매개변수를 조절한 뒤 생성된 음성은 단순한 기술 결과물이 아니라, 사용자의 기획과 의도가 반영된 창작 표현물로 해석될 여지도 있다.
게다가 이 음성이 특정 성우의 음색이나 말투와 상당히 유사한 경우, 해당 음성을 모방하거나 재창조한 것으로 간주할 수 있으며, 이는 원저작물(성우 연기 방식)을 기반으로 한 변형된 표현물, 즉 2차 저작물로 간주할 수 있는 근거가 된다. 다만 이 경우에도 원 성우가 자신의 목소리나 말투를 창작물로 등록했는지, 해당 음성에 대한 저작권을 주장할 수 있는지 등의 법정 조건이 충족되어야 한다.
퍼블리시티권과 AI 성우 음성 2차 저작물 논의의 교차점
AI 성우 음성의 2차 저작물 인정 가능성을 논할 때, 반드시 함께 고려해야 할 것이 퍼블리시티권이다. 퍼블리시티권은 개인의 초상, 이름, 목소리 등 고유한 인격적 속성을 경제적 가치로서 보호하는 권리다. 이 권리는 우리나라에서 명문화된 법률은 없지만, 판례를 통해 널리 인정되고 있으며, 성우의 음성도 퍼블리시티권의 보호 대상에 해당한다.
AI 성우 음성이 특정 성우와 유사할 경우, 해당 성우의 퍼블리시티권을 침해했는지가 핵심 쟁점이 된다. 만약 AI가 생성한 음성이 누가 들어도 특정 성우의 목소리를 모방한 것으로 인식될 수 있다면, 이는 2차 저작물이든 아니든 상관없이 인격권 침해로 이어질 수 있다. 그리고 이 경우, 생성 음성이 2차 저작물로 법적으로 인정될 가능성보다, 불법 모방물로 간주하여 민사적 손해배상 대상이 될 가능성이 더 크다.
하지만 반대로, 해당 성우와 계약을 통해 AI 학습을 진행했고, 생성된 음성에 대해 라이선스를 부여했다면, 이 음성은 명확한 법적 지위와 함께 2차 저작물로 보호받을 수 있는 여지가 있다. 다만 이 경우에도 제작자와 성우 간의 권리 귀속, 사용 범위, 수익 분배 구조에 대한 계약이 명확히 존재해야 한다. 2차 저작물은 원저작자의 동의 없이는 이용할 수 없기 때문이다.
AI 성우 음성의 제도적 공백과 법률 개선 방향
현행 저작권법은 AI 기술의 급속한 발전을 반영하지 못하고 있다. 특히 음성 데이터와 AI 생성 음성 간의 권리관계, 2차 저작물로서의 보호 여부, 퍼블리시티권과의 관계 등은 명확한 기준 없이 해석에 의존하는 상황이다. 이러한 공백은 산업 발전을 저해하고, 동시에 성우 등 콘텐츠 창작자의 권리를 침해할 위험을 높인다.
따라서 제도적 개선이 시급하다. 먼저, AI가 생성한 음성의 법적 지위를 명확히 정의하고, 성우의 말투, 억양, 감정 표현 등을 보호할 수 있는 새로운 저작권 보호 범위를 논의해야 한다. ‘표현된 목소리’뿐 아니라 ‘음성 표현 방식’도 창작물로 인정할 수 있는 법적 근거를 마련해야 하며, AI 성우 생성물이 원 성우의 스타일을 기반으로 했을 경우 2차 저작물로 간주하거나 라이선스 계약을 강제하는 제도가 필요하다.
또한 AI 성우 음성을 활용한 콘텐츠 제작 시, 원저작물과의 관련성을 판단할 수 있는 표준화된 기준이 필요하다. 이를 통해 기술 기업, 성우, 콘텐츠 제작자 간의 권리 구조를 명확히 할 수 있으며, 시장 내 갈등을 최소화할 수 있다. 유럽연합이나 미국에서는 이미 AI 생성 콘텐츠에 대한 저작권 및 윤리 규제를 논의하고 있으며, 한국도 이에 발맞춘 법적 시스템 정비가 요구된다.
AI 성우 기술은 창작물인가, 기술 결과물인가?
AI 성우 기술이 만들어내는 음성은 단순한 읽기를 넘어, 감정과 억양, 사람의 표현을 모방하거나 재해석한 결과다. 이러한 특성을 고려할 때, 특정 성우의 말투와 스타일을 학습한 AI 음성은 기존 성우의 ‘창작적 표현’을 바탕으로 형성된 결과물이며, 2차 저작물로 인정될 여지가 충분히 존재한다.
그러나 현행법 체계는 이처럼 미묘한 경계를 포착하지 못한 채, AI 생성물은 창작물이 아니라는 입장에 머무르고 있다. 이로 따라 AI 음성을 기반으로 한 콘텐츠는 법적 공백에 놓여 있고, 이는 기술 기업과 성우 모두에게 위험한 리스크가 된다. 기술이 창작의 영역에 들어온 이상, 창작의 권리 역시 새로운 해석과 확장을 요구받는다.
AI 성우 음성이 2차 저작물로 인정되기 위해서는 법적 근거와 업계 표준, 그리고 윤리적 기준이 함께 마련되어야 한다. 이를 통해 기술은 보호받고, 인간의 창작성은 존중되며, 새로운 콘텐츠 생태계가 건강하게 작동할 수 있을 것이다.