이미지 확대보기이번 연구는 서강대 전자공학과 신의협 박사가 주도했으며, 고재현 박사과정과 정우철 석사과정이 참여했다. 논문 제목은 ‘Query-Based Asymmetric Modeling with Decoupled Input-Output Rates for Speech Restoration’이다.
연구팀은 열악한 환경에서 녹음된 다양한 샘플링 주파수의 음성을 복원할 수 있는 딥러닝 기반 음성 복원 네트워크 구조를 제안했다.
음성 복원 기술은 잡음과 반향, 대역 제한, 디지털 왜곡 등으로 품질이 저하된 음성을 복원하는 기술이다. 기존 모델은 고정된 입출력 샘플링 주파수를 전제로 설계된 경우가 많았다는 한계가 있었다.
연구팀은 다양한 입력 샘플링 주파수의 음성을 처리하면서도 사용자가 원하는 출력 샘플링 주파수로 복원할 수 있는 모델 구조를 설계했다. 이를 위해 입력 음성 대역 정보를 분석하는 인코더와 출력 음성을 복원하는 디코더 역할을 분리한 비대칭 네트워크 구조를 적용했다.
연구팀은 해당 구조를 기반으로 한 ‘TF-Restormer’ 네트워크를 제안했다고 설명했다.
ICML은 인공지능과 기계학습 분야 국제 학술대회로, 기계학습 이론과 딥러닝, 강화학습 등 관련 연구가 발표되는 학회다. ICML 2026은 내년 7월 6일부터 11일까지 서울 코엑스에서 개최될 예정이다.
전여송 로이슈(lawissue) 기자 arrive71@lawissue.co.kr
<저작권자 © 로이슈, 무단 전재 및 재배포 금지>
메일: law@lawissue.co.kr 전화번호: 02-6925-0217
