기사 메일전송
챗봇 5종의 무릎 인공관절수술 성능 비교·분석 연구 결과 발표 - 동탄성심병원 송시영 교수팀
  • 기사등록 2026-03-17 09:30:04
기사수정

무릎 인공관절수술 관련 정보를 제공하는 AI 챗봇 5종의 성능을 비교·분석한 연구 결과가 발표됐다.

한림대학교동탄성심병원 정형외과 송시영 교수팀은 구글 검색 경향과 정형외과 전문의 자문을 바탕으로, 환자들이 무릎 인공관절수술 전·후 자주 묻는 질문 43개를 선정했다. 


질문은 ▲수술 개요 및 과정 ▲수술 적응증과 결과 ▲부작용·합병증 ▲통증·회복 과정 ▲수술 후 허용되는 활동 ▲수술 대안 및 변형 술기 등 6개 영역으로 구분했다. 

‘무릎 인공관절수술은 얼마나 걸리나요?’, ‘무릎 인공관절수술의 성공률은 얼마나 되나요?’, ‘무릎 인공관절수술 후 주의해야 할 사항은 무엇인가요?’ 등 다양한 질문이 포함됐다.


각 질문을 GPT-3.5, GPT-4, GPT-4 Omni, Gemini Advanced, Gemini 1.5 등 5가지 LLM 기반 AI 챗봇에 동일하게 제시해 답변을 받은 뒤, 무릎 인공관절수술을 전문으로 하는 정형외과 전문의 두 명이 정확도와 질문 적합성을 5점 리커트 척도(1.전혀 그렇지 않다, 2.그렇지 않다, 3.보통이다, 4.그렇다, 5.매우 그렇다)로 평가했다. 평가자는 어떤 AI 챗봇이 작성했는지 모르는 상태에서(블라인드) 채점해 편향을 최소화했다.


분석 결과 GPT-3.5, GPT-4, GPT-4 Omni, Gemini 1.5는 전체 질문에 대해 평균 4.8점 이상의 높은 정확도를 보였고, 질문과의 관련성도 100%로 평가됐다. 

반면 Gemini Advanced는 전체 평균 정확도 4.07점, 관련성 83.7%로 다른 챗봇보다 낮은 성적을 보였으며, 일부 질문에서는 답변 대신 ‘전문의와 상담하라’는 안내를 제공하는 경향이 관찰됐다. 


교수팀은 이러한 경향이 잘못된 정보를 피하려는 안전장치의 영향일 수 있다고 해석하면서도, 환자 교육 도구로 활용할 때는 정보의 양·구체성이 제한될 수 있다고 설명했다.

특히 수술 적응증과 수술 결과, 인공관절수술의 대안 및 변형 술기를 묻는 질문에서 챗봇 간 차이가 두드러졌다. 


GPT-3.5, GPT-4, GPT-4 Omni, Gemini 1.5는 이 영역에서 모두 5점 만점에 가까운 높은 점수를 받은 반면, Gemini Advanced는 통계적으로 유의하게 낮은 점수를 기록했다.


송시영 교수는 “이번 연구에서 최신 AI 챗봇들이 무릎 인공관절수술과 관련된 의학 정보를 상당히 정확하게 제공할 수 있음을 확인했다”며 “AI 챗봇의 응답은 2024년 8월 시점으로 평가됐으며, AI 모델의 빠른 발전 속도를 고려할 때 이후 버전에서는 성능 차이가 생길 수 있다”고 설명했다.

이어 “이번 연구를 통해 의사의 설명을 보완하는 환자 교육 도구로써 AI 챗봇의 잠재적 유용성을 확인했다”며 “임상 적용 가능성을 높이기 위해 AI 모델을 지속적으로 개선해야 한다”고 덧붙였다.

이 연구는 과학기술정보통신부의 재원으로 한국연구재단(우수신진연구)의 지원을 받아 수행됐다.  


이번 연구결과는 정형외과·스포츠의학 분야 SCIE 저널인 ‘Orthopaedic Journal of Sports Medicine[피인용지수(IF): 2.5]’ 1월호에 ‘GPT-3.5, GPT-4, GPT-4 Omni, Gemini Advanced, Gemini 1.5의 무릎 인공관절수술 관련 질문에 대한 답변 능력 비교·분석(A Comparative Analysis of GPT-3.5, GPT-4, GPT-4 Omni, Gemini Advanced, and Gemini 1.5 in Answering Total Knee Replacement–Related Questions)’이라는 제목으로 게재됐다. 

[메디컬월드뉴스 김영신 기자]



관련기사
0
기사수정

다른 곳에 퍼가실 때는 아래 고유 링크 주소를 출처로 사용해주세요.

http://medicalworldnews.co.kr/news/view.php?idx=1510973541
기자프로필
나도 한마디
※ 로그인 후 의견을 등록하시면, 자신의 의견을 관리하실 수 있습니다. 0/1000
확대이미지 영역
  •  기사 이미지 [5월 15일 병원계 이모저모①]중앙대광명병원, 가톨릭대, 더클래식500 등 소식
  •  기사 이미지 [5월 21일 병원계 이모저모④]경희대, 일산, 한림대성심병원 등 소식
  •  기사 이미지 [5월 22일 병원계 이모저모②]고려대안암, 경북대, 이화의료원, 한국원자력의학원 등 소식
국립암센터
분당서울대병원 2026신년
국립중앙의료원
경희의료원배너
인제대백병원
한림대학교의료원
분당제생병원
서남병원
아스트라제네카
모바일 버전 바로가기