Thursday, June 23, 2011

Whole genome DNA methylation analysis based on high throughput sequencing technology

intro에서는 DNA methylation 실험 방법 종류 설명. MeDIP이랑 MBD1. MeDIP의 경우 antibody를 이용하고 MBD는 Methyl-Binding Domain protein인 MECP22를 사용. 논문에 따르면 MBD-seq은 MeDIP-seq 보다는 최근에 시작 됐다고 하네. 그담에 BS-Seq에 대한 이야기가 나온다. 아직(그러니까 그당시 2010 4월) 까진 whole genome BS-Seq이 Arabidopsis 랑 human의  밖에 없단다.
아.. 이 논문 YH(Yan Huang) methylome project 의 시작 논문인갑다(관련 기사). 이게 PBMCs(peripheral blood mononuclear cells) 의 methylome을 base resolution으로다가 밝히는 작업인데.. 이미 YH project에서 genome 을 sequencing 했기에 bisulfite 처리된 read를 mapping 할 때 자신의 genome sequence에다가 mapping 하기 때문에 accuracy가 높다. 또한 ASM(allele specific methylome)이 ASE(allele specific expression)이랑 연관이 깊더라 이런 점도 밝혔단다.


여튼 이 논문의 목적이 뭐냐. 이 논문이 publish 됐을 때 BS-Seq 데이터는 이미 plos biology에 논문이 나갈 준비가 되고 있었던거 같고(in press라고 표현 된걸로 보아), 이 논문에서는 그 BS-Seq 데이터를 reference로 해서 MeDIP-Seq과 MBD-Seq을 비교해 본다.


결론을 이야기 하자면 일단 여기는 프로그램을 MACS을 써서 methylated region을 찾았는데, MBD-Seq은 highly methylated, high-CpG density region에 sensitive 하고 MeDIP은 highly methylated, intermediated-CpG density regions에 sensitive 하다는 것. 아... 그런데 결정적인 말이 있다. BS-Seq 분석결과 대부분의 highly methylated regulatory region은 low-CpG density 이므로 이런거 분석 할려면 MeDIP이 났단다. 아 근데.. 뭐지.. 실험적인 측면에서 이야기 한게 있는데 NaCl 농도를 600mM 로 하면 MBD-Seq도 low-CpG에 sensitive 하단다(salt 농도에 따른 protein의 활성에 따른건가? 이건.. 자세히 봐야 알겠다). 
아래 그림이 두 방법을 비교한 그림




그리고 두 방법 다 read density가 methylation 정도를 정확히 표한하진 못했다고.. 이 사실은 이미 알려져 있었던거고 CpG density에 read density와 correlation이 있다는것. 그래서 CpG density에 연관된 biased를 교정하는 step이 절대적으로 필요하단다. MBD-Seq의 경우 high- MeDIP의 경우 intermediate- CpG density에 대한 교정이 필요. 이 교정 방법으로 소개한게 Bayesian strategy(이 논문 꼭 봐야 겠다). 


결론은 두 방법을 섞어서 사용하는게 좋을거 같다는거고 그래도 BS-Seq을 대체하지 못하고 특히나 bias 때문에 absolute 한 값을 사용하는건 좋은 생각이 아니라는 것. 다만 두 sample을 비교 할때는 어짜피 둘다 bias가 들어가 있으니 relative 한 값을 비교할때는 괜찮을 것이라는 것.



------------------------reference-----------------------------
1.MBD-Seq :
2.MECP2 :
2.BS-Seq :

No comments:

Post a Comment