Tuesday, July 5, 2011

Integrated genomic analyses of ovarian carcinoma

한 일주일 전쯤에 TCGA1 (The Cancer Genome Atlas)에서 nature지에 낸 논문. 음.. genomics의 통합 분석이란다. 알아두어야 할 만하다. 사실 지금이야 돈이 많이 들어가니까 큰 프로젝트 단위로 해야 통합 분석 논문이 나오는데 조만간 실험실 단위에서 이런식의 논문이 많이 나올 것으로 생각된다.

abstract를 보면 ovarian cancer의 대부분의 tumor에서 TP53의 mutation이 발견되었고 이와 동반해서 9개 유전자의 mutation, 113 개의 CNV, 168개 유전자의 promoter methylation event가 발견되었다고. 그리고 survival duration에 따라 각 genetic signature 별 subtype을 나눴다. 그리고 pathway analysis 결과 homologous recombination에서 결함이 있는걸로 발견되었고 NOTCH와 FOXM1 signalling이 ovarian cancer와 연관이 높은 것으로 나타났다.

Samples and clinical data
489 HGS-OvCa(high-grade serous ovarian cancer) sample



mutation analysis
316 clinical sample과 이에 상응한 normal sample을 exome capture & sequencing. ~180,000 exon, ~18,500 gene, ~33 Mb 까지 cover를 했고 sample당 ~14Gb 를 sequencing. 총 19,356개의 somatic mutation(tumor당 61개정도)를 찾았다. 이 중에서 non-synonymous mutation, splice site mutation, COSMIC(Catalogue of Somatic Mutations in Cancer)와  OMIM(online mendelian inheritance in men)과 비교하고 또 protein function에 영향을 고려해서(CHASM 사용) 유의하다고 생각하는 mutation을 골랐다. non-synonymous mutation과 splice site의 mutation의 분석에서 최종적으로 9가지 gene을 뽑은게 아래 표와 같다.
COSMIC과 OMIM과의 비교로 477, 211개의 mutation이 match됨을 확인했다.
CHASM이라는 프로그램을 이용해서(기존에 알려져 있는 oncogene과 tumor suppressor의 mutation으로 CHASM을 training 한뒤 사용) diver mutation



mRNA and miRNA expression and DNA methylation analysis
mRNA의 경우 3개의 platform의 chip을 사용. 2개의 affymetrix과 하나의 agilent chip. affymetrix의 경우 RMA와 affymetrix.aroma로 processing 했고, agilet의 경우 lowess normalizaion을 함. 이 3개의 platform에서 true underlying gene expression을 구하기 위해 factor analysis5를 적용한다(자세한 내용은 다음 논문의 supplementary note 참조). 3개의 platform에서 factor analysis로 unified expression estimate를 구하고 각 platform의 MAD6의 평균으로 variation의 estimate를 구해서 rescaling 한다(두 estimate를 구하고 나서 이걸로 어떻게 rescaling 하는지는 이해가 어렵다). 이렇게 3개의 platform으로부터 하나의 gene expression estimate를 구한뒤 filtering 과정(expression estimate와 3개의 platform간의 correlation이 있고, high variability across patient 인 유전자만 선택)을 거쳐 clustering을 위한 유전자 set을 골라낸다.





--------------------------reference------------------------------
1.TCGA (the cancer genome atlas) : 2005년부터 시작된 프로젝트로 cancer에 영향이 있는 genetic mutation 목록을 만드는데 목표가 있다. 2006년에는 glioblastoma multiforme(brain cancer), lung, ovarian cancer에 대해서 genomic level의 모든 정보(gene expression, copy number variation, SNP genotyping, methylation, microRNA등)를 통합 분석을 위한 작업을 착수 하였으며 2009년부터는 20-25가지의 cancer로 프로젝트를 넓히게 되었다.

2.PFS (progression free survival) : 암환자 집단이 있을 때 특정 치료(?)이후에 몇 퍼센트나 암이 progression을 멈췄나를 나타내는 것으로 특정 치료의 효율을 나타내는 지표로 사용.

3.OS (overall survival)

4.driver mutation : a mutation that gives a selective advantage to a clone in its microenvironment, through either increasing its survival or reproduction. Driver mutations tend to cause clonal expansions. 다르게 말하면 A subset of these mutations contribute to tumor progression


5.factor analysis : 여기 참조, 아마도 factor를 1로 고정해서 계산한게 아닐까 싶다.


6.MAD : 위키 참조

No comments:

Post a Comment