Sunday, June 26, 2011

Computational analysis of genome-wide DNA methylation during the differentiation of human embryonic stem cells along the endodermal lineage

MEDIPS 라는 MeDIP-Seq 분석 프로그램을 개발한 논문이다.
이 논문에서는 MEDIPS 프로그램을 개발했고 이를 다른 기존의 프로그램과 비교한다. 또 실질적인 실험 데이터에 잘 맞는지 확인하기 위해 hESC(human Embryonic Stem Cell) 에서 definitive endoderm으로의 분화과정에서의 methylation 변화에 대한 실험에 MEDIPS 프로그램을 적용한다. 뿐만 아니라 histone modification, TF binding site 데이터와 같이 분석하여 demethylation이 low CpG density 지역과 연관이 있음을 밝혀 냈다.

intro에서는 MeDIP과 BS-Seq, 그리고 RRBS에 대해서 이야기 하면서 MeDIP이 싸니까 쓰기 좋다라는 식으로 이야기 한다. 그리고 이러한 MeDIP-seq 분석을 위한 제대로 된 툴이 없다(물론 BATMAN과 MEDME를 예로 들긴하지만)면서 computational time, MeDIP-seq 실험 디자인을 위한 important feature가 아직 address 되지 않았다는 문제(quality control metrics, identification of differential methylation), sufficient read count, analysis of the enrichment of CpG-rich reads 등의 문제를 제기한다.

뭐 결국 BATMAN의 coupling factor의 개념을 사용하는데, 자기네가 훨씬 빠르고 정확하단다. 아.. 이거 R package란다.

coupling factor를 계산하기 위한 distance function을 바탕으로 해서 low range coupling factor에서의 CpG density와 signal의 dependency를 측정한다. 그 BATMAN과의 차이는 BATMAN은 이 값을 Bayesian deconvolution process에 이용하는데 반해 MEDIPS 는 그냥 signal 값을 이 dependency로 weight 를 가한다(요부분은 사실 BATMAN의 과정을 정확히 이해하지 못했기에 잘 모르겠다). 아래 그림이 normalizaion 전/후의 MeDIP-Seq 데이터와 bisulfite 데이터와 비교 그림
그림에서 보듯이 BATMAN과 MEDIPS 모두 normalization후 bisulfite 데이터와 correlation이 높아짐.

No comments:

Post a Comment