국민의힘 MBC 편파·조작방송 진상규명 태스크포스(TF) 박대출 위원장과 의원들이 지난달 29일 오후 서울 서초구 대검찰청에서 MBC에 대한 고발장을 접수하기 전 취재진 질문에 답하고 있다. 왼쪽부터 한무경 의원, 박 위원장, 윤두현·박대수 의원. /연합
국민의힘 MBC 편파·조작방송 진상규명 태스크포스(TF) 박대출 위원장과 의원들이 지난달 29일 오후 서울 서초구 대검찰청에서 MBC에 대한 고발장을 접수하기 전 취재진 질문에 답하고 있다. 왼쪽부터 한무경 의원, 박 위원장, 윤두현·박대수 의원. /연합

윤대통령의 뉴욕순방시 발언 자막을 조작한 MBC뉴스에 대한 공방이 계속되는 가운데 MBC 자체의 음성 자막 변환시스템인 STT에서도 윤대통령의 발언이 식별불가능하다는 판정이 나왔다. MBC가 구축한 자막 자동생성 프로그램조차 당시 윤석열 대통령 발언 녹음에 대해 인간의 언어로서 유의미한 음성이 아니라고 판단한 것이다. 이로써 MBC뉴스는 자체 시스템에서도 판독이 안되는 발언을 악의적으로 조작했다는 비난을 피할 수 없게 됐다.

MBC 노조(위원장 오정환)는 지난 2일 "문제의 대통령 발언이 녹화되었던 ‘00시 20분 27초’~‘00시 20분 32초’까지 약 5초간의 음성에 대해 STT 기능을 작동시켰더니 "어떠한 정보도 없다"는 결과가 나왔다."고 밝혔다. MBC는 지난 2018년 뉴스영상서버 시스템인 마이다스(MIDAS)를 구축하면서 서버에 등재된 뉴스용 촬영 영상의 음성을 자동으로 문자로 생성해주는 자막생성기능을 도입하여 기자들의 기사작성을 도와주고 있다.

이를 STT 즉 ‘Sound To Text’ 기능이라 하는데, 마이다스 시스템은 지난 9월 22일 뉴욕 글로벌 재정 펀드 행사를 촬영한 ‘58분 송출본’에 이 기능을 작동시켰던 것으로 확인됐다. 반면 글로벌 재정펀드 회의의 윤 대통령 공식연설이 담긴 동영상 부분에는 대통령의 연설 내용이 77%에서 98%의 정확도로 자막이 정확하게 생성되어 서비스되었다.

이러한 결과는 이상규 전 국립국어원장이 윤 대통령의 ‘비속어 논란’을 보도한 언론사들을 비판하면서 MBC의 자막처리가 잘못됐다고 주장한 사실과 일맥상통한다. 이상규 전 원장은 "음성인식은 기계적 인식, 사람의 청취 인식, ‘네이버 클로바노트’와 같은 기계가 자동 인식하는 세 가지 방식이 있다"면서 "노이즈가 많은 음성에 대한 인식은 사람마다 달라질 수 있다"고 지적한 바 있다.

이 전 원장은 "(소리가) 아주 분명하지 않았을 때 자막을 달아 (인식을 수월하게) 하는데 제가 MBC에서 초대 우리말위원회 위원장을 지내며 당시 자막처리 기술을 향상하기 위한 연구 노력을 많이 했다"고 밝혔다. 이어 이 전원장은 "‘XX끼’라는 단어는 경음 ‘ㄲ’이 들어가 청취음성의 변별성이 매우 높을 뿐만 아니라 음성 파형 분석에서도 식별력이 매우 높다"고 덧붙였다. 이 전 원장은 또 "서울대학교 성원용 명예교수는 음성파형 분석 권위자로 그 낱말이 들어 있지 않다고 분명히 밝혔고, 본인은 ‘방언 청취 전문가’로 트랜스크라이브로 음성 파형을 확대해서 구간 반복으로 청취해 봐도 성원용 교수의 의견과 동일하다"고 설명한 바 있다.

한편 음성인식 전문가인 성원용 서울대 전기정보공학부 명예교수는 한 언론과의 인터뷰에서 "대통령 발언을 음성인식기에 넣어보았으나, 시험한 어떤 음성인식기에서도 ‘바이든’이라는 단어는 찾을 수 없었다"고 했다. 그리고 "가장 정확한 네이버 클로버 음성인식기의 경우 나오는 답은 ‘신인 안 해주고 만들면 쪽 팔려서’이다"라고 하면서 "윤대통령 발언에서 ‘바이든’이라는 단어는 인식되지 않는다"고 했다. 또한 성교수는 "윤대통령의 뉴욕 발언은 잡음이 많고 불분명한데 대부분의 사람들은 이 자막대로 듣는다"며 이는 "자막이 매우 선명한 사전정보 역할을 하기 때문"이라고 했다.

MBC의 오디오 전문 엔지니어도 "소음을 제거하고 오디오만 잘 살린 동영상을 들으면 ‘바이든’이 들리지 않는다"고 주장하는 동영상 파일을 공개했다. 이 파일에 따르면 ‘닻내림 효과(anchoring effect)’ 즉, "사람들이 어떠한 판단을 해야 하는 상황에서 초기에 제시된 정보에 의해 꽂히게 하여 그릇된 주장을 받아들이게 하는 효과"가 있다는 것이다. 그래서 그는 "MBC가 ‘국회’를 ‘(미국) 국회’에 꽂히게 하여 ‘리믄’을 ‘바이든은’으로 들리게 하는 효과가 있다"고 했다.

MBC노조(오정환 위원장)는 "과학적으로 분별성이 없는 음성을 오염된 선입견을 따라 언론사들이 앞다퉈 자막을 넣어 보도한 것이 이번 사태의 원인"이라고 주장했다. 특히, MBC가 불분명한 내용에 대해 단정적으로 자막을 넣어 왜곡과 조작을 야기했다. 존재하지도 않는 "(미국)"이라는 자막을 넣은 것은 변명의 여지가 없는 ‘조작’이고, "XX"라고 자막을 처리함으로써 욕설을 한 것으로 낙인찍은 것은 ‘왜곡’이고, ‘바이든’이라고 자막으로 단정한 것도 ‘왜곡’이 될 수 있다.

저작권자 © 자유일보 무단전재 및 재배포 금지