서울대학교병원 유전체 임상 정보분석 훈련센터 자료분석 웍샵

   R for Bioinformatics and Biomedicine

임상 의료정보와 유전체 데이터의 통합분석에서 올바른 통계학적 도구 사용의 중요성은 아무리 강조해도 지나치지 않습니다. 공개 소프트웨어인 R statistical package는 풍부한 통계분석 라이브러리와 자료처리를 위한 컴퓨터 프로그래밍 환경 및 수준 높은 그래프 그리기를 지원합니다. 서울의대 정보의학실에서는 바이오정보학과 의과학 분야에서 R의 활발한 보급을 위한 실습 웍샵을 마련했습니다. 본 교육과정이 실질적인 생명의과학 데이터와 유전체 데이터의 분석을 위한 R 활용의 기초가 되기를 기원합니다.

-  2014년 4월 서울대학교병원 유전체 임상 정보분석 훈련센터장 김주한


일시 및 장소


일 시 : 2014515() ~ 16일(금), 오전 9시 ~ 오후 5시                   

장 소 : 서울대 의과대학 의학도서관 3층 전산실습실
주 최 : 서울대학교병원 유전체 임상 정보분석 훈련센터
주 관 : 서울대 시스템바이오정보의학 연구센터, 서울의대 정보의학실

프로그램 (Day 1, 15일)

시 간

주 제 강 사
9:00 ~ 9:10

등  록

9:10 ~ 9:30 Introduction to R 김주한
9:30 ~ 10:40 Starting with R
- R Installation, R packages, workspace

- Data type and structure
- Basic R functions: built in functions
- File read and write
임재현, 서희원
10:50 ~ 12:20 Data manipulation with R
- Vector, matrix

- Index, splice, conditional statement
- Data management: sorting, merging, reshaping
- Apply functions
- User defined function
임재현, 박지혜
12:20 ~ 13:30 중  식 
13:30 ~ 14:40

Statistical Analysis with Biomedical Data I
- Distributions

- Parametric tests

- Non-Parametric stats

박찬희, 임영균
14:50 ~ 16:00

Statistical Analysis with Biomedical Data II
- Correlation
- Regression
- ANOVA

박찬희, 안선주
16:10 ~ 17:20

Advanced R graphics and ggplot2
- Plot, histogram, qqplot, boxplot
- Layout, axis, legend and text
- ggplot2: scatterplot, histogram, boxplot, barplot, density plot
- Error bar, line graph

서희원, 김주연

프로그램 (Day 2, 16일)

시 간

주 제 강 사
9:10 ~ 9:30 Machine Learning Algorithms for Biomedical Informatics 김주한
9:30 ~ 10:40 Microarray Data Analysis I
-
Introduction to Microarray Data
- Normalization methods
이수연, 백수연
10:50 ~ 12:00 Microarray Data Analysis II
- Identifying DEG: t-test, SAM

- Volcano plot
- FDR
이수연, 백수연
12:00 ~ 13:10 중  식 
13:10 ~ 14:20

Classification using R
-
K-Nearest Neighbor
- Support Vector Machine

- Logistic regression
- Feature selection

박찬희, 서희원
14:30~ 15:40

Evaluation and Validation
- Cross validation
- Train/validation/test set split
- Empirical p-value, permutation test
- Multiple testing
- Mean squared error rate

박찬희, 임재현
15:50 ~ 17:00

Case study: association of BRCA1 and BRCA2 mutations with survival in ovarian cancer (JAMA 2011)
- DEG extraction from RNA-seq data using TRAPR
- Clustering (K-means, hierarchical)
- Correlation analysis between methylation and expression data
- Survival analysis

이계화, 서희원

실습 컴퓨터

실습실에 컴퓨터가 준비 되어있으므로, 개인 노트북은 준비 하지 않으셔도 됩니다.

 

장 소 : 서울대 의과대학 의학도서관 3층 전산실습실
교 통 : 지하철 4호선 혜화역 2번 출구로 나오셔서서 길을 건너셔야 합니다. (3번 출구 공사중)
주 차 : 주차권을 판매하지 않는 관계로 가급적 대중교통을 이용하시기 바랍니다.