이미지 확대보기이번 연구는 의료 영상에서 비정보성 데이터를 줄이고 인공지능 학습 효율을 높이기 위한 알고리즘 개발과 데이터 구축을 골자로 한다.
대장내시경 검사에서는 화면 흐림이나 거품 등으로 인해 진단 가치가 낮은 ‘비정보성 프레임’이 발생할 수 있으며, 이는 인공지능 모델 학습과 실시간 진단 보조 시스템의 정확도를 저해하는 요인으로 지목돼 왔다.
서울대병원 영상의학과 이동헌 교수와 강남센터 소화기내과 진은효 교수 연구팀은 능동학습 기반 알고리즘 ‘AD-BALD’를 개발했다. 해당 알고리즘은 인공지능이 분류가 어려운 영상을 선별해 전문가에게 확인을 요청하는 방식으로 작동한다.
연구팀은 이 알고리즘을 활용해 서울대병원 강남센터와 충남대병원의 임상 데이터, 글로벌 공공 데이터를 통합해 16만 프레임 규모의 ‘InfoColon’ 데이터셋을 구축했다.
데이터 구축 과정에서 전체 영상의 약 9%인 1만2663프레임만 직접 라벨링했으며, 나머지는 알고리즘을 통해 분류했다. 알고리즘의 분류 성능은 AUROC 기준 최대 0.975로 나타났다.
연구팀은 영상 데이터를 ‘정보성 프레임’과 ‘비정보성 프레임’으로 구분하고, 비정보성 프레임을 장벽, 거품, 흐림, 조명 불량, 도구, 장애물 등 6개 유형으로 세분화했다.
또한 정보성 프레임을 활용해 대장 내부 구조를 3차원 점구름 형태로 재구성하는 데 성공했다. 이는 대장 구조를 입체적으로 구현하는 방식으로, 향후 시술 중 병변 탐지 보조 기술로 활용 가능성이 제시됐다.
연구팀은 해당 데이터셋과 알고리즘 구현 코드를 공공 플랫폼에 공개했으며, 연구 결과는 국제 학술지 ‘Scientific Data’에 게재됐다.
이동헌 서울대병원 영상의학과 교수는 “이번 데이터셋은 대장내시경 영상에서 비정보성 프레임 문제를 개선하기 위한 기준을 제시한다”며 “알고리즘을 활용하면 의료 영상 데이터를 효율적으로 가공할 수 있어 관련 연구에 활용될 수 있다”고 말했다.
전여송 로이슈(lawissue) 기자 arrive71@lawissue.co.kr
<저작권자 © 로이슈, 무단 전재 및 재배포 금지>
메일: law@lawissue.co.kr 전화번호: 02-6925-0217
