흉부 엑스레이로 코로나19 검진 가능한 인공지능(AI) 엔진 개발부산 스타트업 테렌츠(Terenz) 연구결과 – 정확도 98.14%

2020. 3. 20. 21:30Terenz

최근 세계적으로 20만명 이상의 사람들이 코로나19에 감염된 것으로 알려졌으며, 8천여명의 사망자를 발생시킴으로써 대혼란을 일으키고 있다. 보건과학자뿐만 아니라 세계보건기구 전문가들은, 향후 코로나19 감염이 더 증가할 것으로 예측한다. 코로나19는 전염성이 강하고 무증상성이기 때문에 초기에는 검출이 어려워, 빠른 속도로 퍼지고 있다. 그러므로 감염환자를 신속정확하게 찾아내는 것은 짧은 기간 내에 감염전파를 억제하고 사람들의 생명을 구하는데 매우 중요하다.

Source: Worldometer-www.worldometers.info

최근 들어 인공지능(AI)은 건강관리 진단 분야에서 중요한 역할을 하고있다. 첨단 기계학습기법과 결합된 고급 컴퓨팅자원은 의료전문가가 문제를 깊이 이해하고 전염병 탐지에 유용한 패턴을 찾도록 도와주며, 동시에 진단을 내리는데 결정적인 도움을 준다. 코로나19가 대혼란을 빚고있는 현재의 시나리오를 보면, 전 세계의 많은 사람들은, 이 질병의 진행에 대한 세부사항을 제공함으로써 환자의 검진을 돕고 확산을 방지할 수 있는 AI기반 기술을 기다리고 있다.


지금까지 코로나19를 검진할 수 있는 테스트 키트를 개발한 나라는 소수에 불과하고, 테스트 방법이 충분히 효율적이지 않고 시간이 오래 걸리기 때문에, 대부분의 나라에서 더 많은 사람을 테스트하지 못하고 있다. 그래서 테렌츠는 이 난관을 극복하기 위해 몇 초 안에 흉부X선을 이용해 코로나19를 감지할 수 있는(정확도 98%) AI기반 선별 시스템을 제안했다. 이 독창적인 시스템은 코로나19를 신속하게 감지할 뿐만 아니라 병의 진행 상황에 대한 세부사항을 제공하여, 긴급성에 따라 보다 정량적으로 환자의 상태를 모니터링할 수 있도록 한다.

 

Sample of the dataset used for the development of the AI-based Screening System

AI 시스템 개발에 사용된 X선 데이터는 주로 SIRM : Societa di Radiologia Medica e Interventistica Kaggle이라는 두 개의 공공데이터베이스에서 수집되었다. 주로 데이터는 세 가지 다른 범주에서 획득되었는데, 즉 정상인(건강한) 사람들, 폐렴 환자, 코로나19 감염자이다. 연구에서 고려된 X선 데이터는 X선 빔이 흉부의 후방 측면을 통해 들어가고 빔이 감지되는 전방 측면을 벗어나는 사후 전측 보기에서 나왔다. 코로나19를 감지하고 데이터를 정상(Normal), 폐렴(Pneumonia), 코로나19로 분류하기 위해 Convolutional Neural Network(CNN)를 활용한 AI 엔진이 개발되었다. CNN 알고리즘은 98.141%의 전체 정확도를 나타냄으로써 상당히 훌륭한 성능을 보였다. 또한 코로나19 X-Ray에 대한 리콜이 AUC 0.99 ROC를 통해 100%라는 결과에서 도출되었다.

Where, Class 0 = Pneumonia, Class 1 = Healthy and Class 2 = COVID-19

테렌츠는 이 독창적인 시스템이 검진 과정을 쉽게 하여 많은 생명을 구할 수 있을 것이기에 자랑스럽게 여긴다. 이 시스템은 빠른 시간 내에 많은 사람들을 검진할 수 있도록 하여 코로나19가 지역사회가 퍼지는 것을 막고 병을 빨리 억제할 수 있게 할 것이다.

테렌츠사는 인도인과 한국인이 공동 설립한 대한민국 부산의 스타트업으로, 테렌츠 플랫폼을 통해 알츠하이머, 당뇨와 같은 고위험성 질환을 초기단계에서 발견하고 모니터링할 수 있도록 하여, 사람들의 삶의 질을 향상시킬 AI기반의 건강관리 질병 의사결정 지원 시스템을 개발해 왔다. 테렌츠는 한국 부산에서 열린 글로벌 스타트업 컨퍼런스 바운스 2019’에서 최고의 혁신 스타트업으로 선정되었다. AI에 기반을 둔 의사결정 지원 시스템의 목적은 의사들을 도와 높은 정밀도와 정확도로 신속하게 진단을 내릴 수 있도록 하는 것이다. 테렌츠의 비전은 고위험성 질병으로부터 환자들의 삶의 질을 향상시키기 위해 우리 사회에 적정한 해결책을 제공하는 것이다.

개발된 AI 엔진은 현재 매우 예비적이며 조사 목적으로만 사용할 수 있다. 따라서 데이터 세트가 매우 작기 때문에 모델의 오버핏(과잉평가)을 방지하기 위해 얕은 네트워크가 개발되었다. 그러나 이 모델은 인터넷에 도착하고 있는 새로운 데이터 세트로 매일 재교육되고 있으며, 테렌츠 사의 데이터과학자 팀이 이 모델의 성능에 만족할 때까지 학습은 계속될 것이다. 더욱이, 모델의 초기 파이프라인이 회사의 GitHub 저장소에 업로드되었고, 재교육된 모델은 매일 이 저장소의 업로드에 전념할 것이다.