오픈 AI 보이스 엔진 음성 모방 인조 음성을 공개하였습니다. 목소리 15초 분량만 있으면 거의 비슷한 음성을 만들어 낼 수 있습니다. 원래는 어린이 교육용이나 장애인 소통으로 사용하려 하였으나, 선거를 앞두고 모방 범죄로 출시를 일단 보류하였습니다.
오픈 AI 보이스 엔진
기존에도 목소리를 듣고 모방하는 기술이 있었습니다. 실제로 보이스 피싱에 이용하기도 하고, 범죄에 이용되는 사례가 있었습니다. 하지만 이는 기술적으로 누가 들어도 인조 음성이라는 것을 알 수 있었습니다.
하지만 지금 오픈 AI가 만든 보이스 엔진은 음성 15초 분량만 있으면 거의 완벽하게 목소리를 구현할 수 있습니다. 놀랍기도 하지만 매우 걱정되는 기술이기도 합니다. 그럼 왜 이런 인조 음성을 만들었을까요?
보이스 엔진 기능
오픈 AI 보이스 엔진 기본적인 기능은 음성 인식을 시작으로 텍스트 문자 읽어주기, 텍스트 음성 변화 기능이 주된 기능입니다. 또 장애인의 경우 소통 도구로 활용이 되고, 언어 기능에 영향을 주는 질환을 앓고 있는 환자에 도움이 되는 기능입니다.
거기다 아이들 교육용으로도 매우 획기적이라 할 수 있습니다. 어린이 교육은 물론이고 음성 해설 콘텐츠 기능으로 아이들에게 친근감을 줄 수 있을 거라 예상을 합니다.
즉 익숙한 목소리가 필요한 곳에 사용할 수 있는 장점이 있습니다. 실제로 모방 음성이 거의 비슷하다는 것이 장점이지만 매우 위험하다는 단점도 있습니다.
보이스 엔진 단점 위험
대표적인 것이 보이스 피싱입니다. 스마트폰 휴대폰을 해킹하여 자녀나 부모의 목소리를 음성 모방 변조를 하면 누구나 쉽게 당할 수 있습니다. 분명 자녀나 부모 그리고 지인의 목소리도 착각할 수 있기 때문입니다. 실제로 비슷한 목소리의 딥보이스 사기가 이루어지고 있습니다.
거기다 올해는 선거가 많습니다. 특히 미국은 대통령 선거가 있습니다. 예를 들어 트럼프나 바이든의 모방 음성 목소리로 유세를 하거나 가짜 뉴스 또는 잘못된 내용이 인터넷에 퍼지면 매우 위험한 선거가 될 수 있습니다.
선거뿐만 아니라, 범죄에도 이용이 가능해서 매우 위험합니다. 특히 음성 인식으로 접근하는 모든 기관이나 프로그램의 경우 보안이 허술하게 됩니다. 만약 은행 계좌가 음성 인식으로 접근할 수 있다면 매우 위험한 범죄가 될 수 있고, 중요한 기관이나 집안에 들어가는데 음성 인식을 사용한다면 역시 재산적 신체적 피해를 입을 수 있습니다.
그래서 오픈 AI 보이스 엔진 음성 모방 인조 음성 사용을 일단 중지하도록 하였습니다. 약자나 환자 그리고 교육용으로 필요한 기술이긴 하지만 범죄에 악용되는 사례가 될 수 있어, 보완 없이는 보이스 엔진 사용을 중지하게 되었습니다. 하지만 이 기술은 분명 사용하게 될 것입니다. 핵심은 범죄를 막을 수 있는 대책을 마련해야 합니다.
댓글