AI 생성 이미지
심혈관 질환은 현대 의학에서 가장 정밀한 진단과 빠른 처치를 요구하는 분야 중 하나다. 하지만 아이러니하게도 그 핵심 기록인 관상동맥조영술(CAG) 보고서는 여전히 아날로그의 벽에 갇혀 있었다. 수많은 심장내과 전문의들이 진료를 마친 뒤 줄글 형태로 작성하는 이 비정형 의료 데이터는, 그 가치가 높음에도 불구하고 '분석 가능한 데이터'로 전환하기 위해 다시 의사가 수작업으로 내용을 옮겨 적어야 하는 비효율의 병목 현상을 겪어왔다.
최근 질병관리청 국립보건연구원은 이러한 의료 현장의 고질적인 문제를 해결할 획기적인 연구 성과를 발표했다. 거대언어모델(LLM)을 활용해 비정형 심혈관 검사 기록을 의사 수준, 혹은 그 이상의 정확도로 표준화된 데이터로 자동 변환하는 기술을 확보한 것이다. 이는 단순한 행정 자동화를 넘어, 대한민국 의료 AI 기술이 임상 현장의 실질적인 난제를 해결하는 단계로 진입했음을 의미한다.
연세대학교 의과대학과 국민건강보험 일산병원 공동연구팀이 수행한 이번 연구의 핵심은 ‘자유서술형 의료기록의 구조화’다. 연구팀은 ChatGPT(GPT-4o), Gemini, Claude 등 최신 거대언어모델을 활용해 2단계 자동 구조화 프로세스를 개발했다.
1단계 (표준화): LLM이 줄글 형태의 보고서를 심장내과 전문의가 설계한 표준화된 구조로 변환한다.
2단계 (추출): 구조화된 데이터를 기반으로 규칙 기반 알고리즘을 적용해 병변 위치, 스텐트 정보, 시술 복잡도 등 12가지 핵심 임상 지표를 자동 추출한다.
결과는 놀라웠다. 내부 검증 결과, 관상동맥조영술(CAG) 관련 주요 정보 추출에서 AI는 99.5%의 정확도를 기록했다. 이는 동일한 작업을 수행한 심장내과 전문의 2명의 평균 정확도인 91.8%를 크게 상회하는 수치다. 경피적 관상동맥 중재술(PCI) 시술 정보에서도 AI는 98.3%의 정확도를 보이며 전문의(97.4%)와 대등하거나 오히려 높은 성능을 입증했다.
이러한 수치는 의료계에 시사하는 바가 크다. 인간 의사는 피로도나 주관적 판단에 따라 데이터 기입 시 실수를 저지를 가능성이 존재하지만, 고도화된 AI 모델은 일관된 로직으로 방대한 양의 기록을 빈틈없이 처리할 수 있음을 보여준 것이다.
질병관리청 제공
그동안 심혈관 연구를 위해 수천 건의 검사 기록을 수작업으로 정리하는 과정은 연구자들에게 '인내의 영역'이었다. 전문의가 수십 시간에 걸쳐 수행해야 했던 분석 업무를 이제 AI는 단 몇 초 만에 끝낼 수 있게 되었다.
이 기술의 범용성 또한 주목할 만하다. 연구팀은 세브란스병원의 데이터를 기반으로 모델을 개발한 후, 국립건강보험공단 일산병원의 데이터를 활용해 외부 검증을 거쳤다. 그 결과 외부 병원 데이터에서도 높은 정확도를 유지하며 모델의 실용성을 확인했다.
이는 개별 병원 단위의 연구를 넘어, 국가 차원의 대규모 역학 연구나 정책 분석에 있어 데이터 확보 속도를 획기적으로 높일 수 있는 발판이 된다. 임승관 질병관리청장이 "의료기록 정제 과정의 자동화가 연구와 정책 수립의 효율성을 크게 높일 것"이라고 기대감을 드러낸 이유도 여기에 있다.
이번 연구는 질병관리청이 추진 중인 '성차 기반 심혈관계질환 진단·치료기술 개선' 과제의 일환으로 진행되었다. 남성과 여성은 심혈관 질환의 발현 양상과 치료 반응에서 차이를 보이지만, 그동안은 데이터 정제 단계에서의 한계로 인해 대규모 성차 분석 연구에 어려움이 많았다.
국립보건연구원 남재환 원장은 이번 성과가 특히 성별 특성을 고려한 심혈관 질환 연구 기반 강화에 기여할 것이라고 밝혔다. AI를 통해 성별에 따른 시술 결과, 예후 예측 모델 개발 등이 가속화되면, 환자 개인의 특성에 맞춘 '성별 맞춤형 진료 가이드라인' 마련도 머지않은 미래가 될 전망이다.
이번 발표에서 가장 눈에 띄는 대목 중 하나는 연구팀이 설계한 '정보 정리 구조'를 논문 부록으로 투명하게 공개했다는 점이다. 이는 특정 기관이 기술을 독점하는 것이 아니라, 국내 모든 의료기관이 자체적으로 AI 기반 자동화 시스템을 구축할 수 있도록 설계도를 제공한 것과 같다.
물론 과제는 남아있다. 아무리 AI의 정확도가 높다 하더라도 의료 기록은 환자의 생명과 직결되는 만큼, 최종 단계에서의 '의간(人間) 검수' 시스템과 AI 모델의 보안성 확보가 병행되어야 한다. 또한, 다양한 병원의 서로 다른 서술 양상을 완벽하게 통합하기 위한 지속적인 표준화 작업도 필요하다.
결론적으로, 이번 연구 성과는 AI가 의사를 대체하는 것이 아니라, 의사를 '단순 반복 업무'에서 해방시켜 '환자 진료와 심도 있는 연구'에 집중하게 만드는 강력한 도구가 될 수 있음을 증명했다. 줄글로 잠들어 있던 방대한 의료 기록이 AI라는 엔진을 만나 디지털 데이터의 '보물창고'로 변모하고 있다. 대한민국 의료 AI의 미래는 이제 막 새로운 장을 열었다.