임상 정보와 바이오정보의 국제표준기반
종합 모델링 및 바이오 EMR 연동기술 개발

 목차
  비전 

<Top>

 차세대 바이오 의료 정보 시스템의 핵심 구성 요소는 다음과 같은 4가지 시스템임
  1. 병원 정보 시스템 (HIS: Hospital Information system)
  2. 바이오 정보 시스템 (Bio-Data Information System for Genomics/Proteomics)
  3. 임상연구 정보 시스템 (CIS: Clinical Information System, Clinical Research)
  4. 임상시험 정보 시스템 (CTIS: Clinical Trials Information System)
 연구의 필요성

<Top>

(1) 의료정보화의 진행으로 인한 EMR 및 임상연구 정보 시스템의 구축 확산

처방전달 시스템 (OCS) 구축 -> 영상정보 시스템(PACS), 진단검사의학시스템(LIS)의 구축 -> 전자의무기록시스템 (EMR) 구축

(2) 기존 EMR 시스템의 한계

  1. 현재의 EMR은 주로 임상진료과정 및 청구등 행사절차 중신으로 설계되어 있음
  2. 통일된 용어나 온톨로지, 형식화된 자료구조와 전송 표준등의 부재
  3. 각 임상진료단위별 수행되는 각종의 임상연구 정보의 체계적인 처리 방법을 제공하지 않음
  4. 유전자나 단백질 발현등과 같은 생명과학 정보를 연계하는 체계를 고려하고 있지 않음
  5. 복잡한 임상시험 연구 등을 직접 지원하는 것이 불가능함

(3) 환자의 진료, 치료 시 개인의 유전적인 특성을 고려한 개인별 맞춤의학 시대 도래

(4) 인간 유전체사업의 완성과 첨단 생명과학의 발전으로 High Throughput 바이오 데이터의 획득 및 바이오 데이터 처리의 국제 표준화의 급속히 진행.

  1. 구조유전체 정보 표준화: BSML (BioSequence Markup Language), BioPerl, BioJava, BioPython등
  2. 기능유전체 정보 표준화: MGED (Microarray Gene Expression Group)의 MIAME (Minimum Information About a Microarray Experiment), MAGE-OM/ML (Microarray Gene Expression Object Model / Markup Language) 등
  3. 단백체 발현 및 상호작용 정보 표준화: MIAPE (Minimum Information About a Proteomics Experiment), PSI (Proteomics Standards Initiative at EBI) 등
  4. 대사체학 및 시스템 생물학 정보 표준화: SBML (Systems Biology Markup Language), KEGGML (KEGG Markup Language), BioPAX (Biological Pathway Exchage), BioSVG (Bio-Scalable Vector Graphics) 등
  5. 바이오데이터의 축척 및 공공 바이오 DB의 발달 : GenBank, Entrez, Ensembl, SwissProt, ArrayExpress, Gene Expression Omnibus, PharmGKB 등

(5) XML 및 XML 전용 데이터베이스 관리시스템(NXD: Native XML Database) 기술의 발달

  1. XML 문서에 대한 효율적인 저장, 관리 및 검색을 지원하는 XML 저장관리 시스템은 기존의 자료 중심 통합에서 문서중심 통합으로의 새로운 패러다임을 제시함
  2. 문서중심 XML 기술은 대규모 의료정보의 문서중심 통합을 가능하게 하는 기술로 평가됨.
  3. 의료정보의 많은 부분은 진료차트와 같은 의학적, 법률적 효력을 갖는 문서형식으로 생성되며 이러한 특성은 기존의 RDB 기반의 자료관리 시스템으로 처리하기엔 근본적인 한계가 있음
  4. XML 전용 데이터베이스는 XML 문서 전체가 한 곳에 저장되어 여러 테이블에 저장되는 RDB에 비해서 검색속도가 빨라지게 됨.

(6) 고속 대용량 정보처리 기술 및 데이터웨어하우스, 데이터마이닝 기술

  1. 정보처리 기술과 High throughput 기술의 발달로 고속 대용량 데이터 의 축적과 생성이 가능하게 되었으며, 이러한 고속 대용량 바이오 의료정보 처리는 데이터 별 목적이나 가설 별 분석 수행에 기반한 기존의 패러다임으로는 감당하는 것이 어려움.
  2. 대규모 데이터의 데이터웨어 하우징 기술과 데이터마이닝 기술은 이러한 문제의 해결책을 제시함.
목표 시스템의 구성도

<Top>

(1) 세부과제 :임상- 바이오정보의 통합을 위한 XML 미들웨어 및 BioEMR 연동엔진 개발

  1. XML 및 국제표준 기반 BioEMR 미들웨어 개발

  2. XML 및 국제표준 기반 BioEMR 통합문서처리 엔진 및 통합문서저장소 구축

  3. NXD manager, BioEMR 연동엔진 및 BioEMR 통합문서 처리기 개발

(2) 세부과제: 주요 암환자의 실시간 임상시험을 위한 BioEMR 파일럿 시스템 구축, 운영

  1. 주요 암종의 임상연구 정보시스템 및 임상시험 정보시스템 설계, 구축 운영

  2. 다기관 실시간 임상시험 수행을 위한 NCICB CaCORE 기반 표준 자료 및 문서 전문가 정의 및 CRF 등록기, 메타데이터 등록기 구축

  3. 유방암에서의 파일럿 시스템 구축 경험을 바탕으로 혈액암, 골수이식 및 폐암센터로 다기관 실시간 파일럿 시스템 확대 운영 및 차세대 임상연구 및 시험 정보 시스템 도출

(3) 세부과제: 국제표준에 기반한 바이오정보 통합모델 개발 및 다기관 바이오 임상정보 시스템 개발

  1. 임상정보 및 바이오정보 국제표준화 동향 연구, 바이오 임상정보 통합 모델 개발

  2. 임상시험 지식베이스 구축 및 바이오 임상데이터 통합 분석 엔진 개발

  3. CaCORE의 caBIO, caDSR, EVS 기반 다기관 암질환 임상시험 정보 infrastructure 구축

  4. RDB to XML 매핑 기술 개발 및 HL7 CDA, LOINC 기반 병원임상정보 전송 모듈 개발

(4) 세부과제 : BioEMR의 XML 기반 고가용성 질의처리기 및 지식기반 자료처리 엔진 개발

  1. 임상정보와 바이오정보에 대한 논리적 정의를 위한 데이터 추상화 모델 설계

  2. 데이터 추상화 모델 지원에 요구되는 메타데이터 정의 및 관리기 개발

  3. 데이터 추상화 모델 기반의 질의 처리 시스템 설계 및 개발

  4. 임상연구 과정에 적용하기 위한 질의 처리 시스템 확장

  5. 통합 지식베이스에 기반한 데이터 처리 엔진 개발 및 응용 기술 확립

 
단계별 세부과제

<Top>

(1) 1단계

단계 목표: 국제표준기반 임상문서와 바이오데이터의 통합모델 개발 및 XML 기반 BioEMR 미들웨어와 연동엔진 개발

연 차 연차 별 연구 목표 연구 개발 내용
1차

년도

  • 임상문서-바이오데이터 국제 표준화 동향연구 및 기술 개발
  • 임상문서-바이오데이터의 통합 모델 개발
  • XML 기반 BioEMR 미들 웨어 개발
  • 임상 문서 정보 및 바이오 정보의 국제표준화 동향 연구
  • 용어 표준 , 자료구조, 컨텐츠 전문가 정의, 유즈케이스 모델링
  • HL7, CDA, LOINC기반 병원임상정보 전송 모듈 개발
  • BSML, MAGE-ML, MIAPE 표준 통합 및 전송 모듈 개발
  • BioEMR extractor , DB Connector, XML Binder, XML Signature, transformer와 같은 기반 BioEMR의 기술 개발
  • 유방암센터 임상연구정보 시스템 인터페이스 도출
2차

년도

  • BioEMR 연동엔진 개발
  • BioEMR 통합 문서 저장소 개발
  • RDB to XML 및 NXD 매핑 기술 개발
  • 유방암센터 임상연구 정보 시스템 구축
  • CDE 기반 CDA와 MAGE-ML의 통합
  • Tissue microarray, BAC chip/FISH등의 새로운 생물정보의 표현을 위한 전송 모듈 개발
  • RDB to XML 매핑 및 NXD 매핑 기술 개발
  • 국립 보건원 유전체 연구부 자료구조와 연동기술 개발
  • XML 문서의 data 추출 시 DOM 기반 구조 독립적 데이터 추출기 개발
  • IDR (Integrated Document Registry)과 IDE (Integrated Document Engine)의 개발

(2) 2 단계

단계 목표: XML 기반 문서저장기, 정보추출기, 자동색인기, 자동주석기 개발 빛 임상연구와 임상시험을 지원하는 통합 BioEMR 기반 실시간 임상시험 파일럿 구축

연 차 연차 별 연구 목표 연구 개발 내용
3차

년도

  • XML 기반 문서저장기, 정보 추출기, 자동색인기, 자동 주석기 개발
  • 임상정보 시스템 구축
  • 실시간 임상시험 파일럿 정보시스템 설계 및 개발
  • XML data entry/ indexer / annotator/ archier/ validater/ enhancer/ renderer
  • Authentication / Authorization interfaces
  • CRF, 임상시험 메타 등록기 개발
  • 유방암 임상진료 및 임상연구에서 사용되는 data element를 추출하여 NCI CDE와 같은 data dictionary로 정의함
  • EAV 모델에 기반한 임상시험 정보처리 DB 구축
  • 바이오데이터 통합 분석 시스템 개발
  • EVS, caDSR 기반 Vocabulary, Taxonomy, Ontology 개발
4차

년도

  • 임상연구- 시험정보시스템 통합 BioEMR 시스템 개발
  • 통합 BioEMR 기반 실시간 임상시험 파일롯 구축
  • 다기관 임상시험 수행을 위한 임상정보 시스템 확장
  • 주요 암질환 임상정보시스템 확장
  • 골수이식 Discharge Summary Document 및 Essential Data를 수집함
  • 폐암 및 혈액암에서 사용되는 data element를 추출하여 NCI CDE와 같은 data dictionary로 정의함
  • 통합 BioEMR 시스템 미들웨어 기반 파일롯 구축
  • UMLS lexical processor / MeSH enhancer /HTML renderer
     

(3) 3단계

단계 목표: 실시간 임상시험 파일럿 확대운영 및 대량 고속 데이터 처리 안정성 확보를 위한 고가용성 기술 개발과 적용

연 차 연차 별 연구 목표 연구 개발 내용
5-6차

년도

  • 임상 시험 파일럿 확대운영
  • 대량고속 데이터처리 안정성 확보를 위한 고 가용성 기술 개발 및 적용
  • BioEMR 통합 데이터마이닝 및 임상시험 지식기반 통합분석기
  • 다기관 실시간 바이오 임상정보 시스템 구축 확장
  • 시스템 기술을 사용한 XML 미들웨어 고가용성 기술 확보
  • BioMedical GRID / Web Services 연계 확장 방안 도출