Friday, July 8, 2011

MBD-isolated Genome Sequencing provides a high-throught and comprehensive survey of AND methylation in the human genome

보건원 발표 자료가 BS-Seq인줄 알고 BS-Seq 만 보다가 건네 받은 데이터까 MBD-Seq 이라는 걸 알고 급선회한다. 

이 사람들은 자기네 방식을 MiGS (MBD-isolated Genome Sequencing) 이라고 한다(뭔놈의 용어들을 이렇게 만들어 내는지.. 헷갈리게 시리). MBD2 protein의 recombinant MBD를 이용해서 random하게 짤린 DNA 중 methylated 된것만 precipitation 시켜서 이를 parallel 하게 시퀀싱한다는 것. 여기서 말하길 MBD 가 서로 가까이에 위치한 multiple methylated cytosine에 대해 bind affinity가 증가하므로 MeDIP(anti-5-methyl cytosine antibody를 사용하는 실험 방법으로 이는 하나 이상의 mCpG의 DNA 가닥에 bind 하므로 좀 sporadically mCpG를 위주로 immunoprecipitation 시킨단다)에 비해 생물학적으로 좀 더 연관되어 있는, 그러니까 좀 densely mCpG를 잡는다고. 그리고 DNA shearing은 sonication으로 해야 restriction enzyme 보다 bias 가 적단다. 
뭐 여튼 이건 실험적인 방법이고 그래서 이 논문에서는 이 방법으로 뭘 본거냐. 3개의 isogenic human cancer cell line(1.parental HCT116 colon cancer cell line: colon cancer cell의 평균의 methylation level을 보임, 2.DICERex5 cell: HCT116에서 유도된건데 DICER1 allele들이 짤린거로 약간의 유전자의 promoter 부위의 methylation 변화가 생긴 것, 3.DNMT1, DNMT3b double knockout cell (DKO cells): DNMT 를 knockout 시켰으니 대부분의 methylation을 잃은 cell)의 methylation profile을 봤단다. 


실험에 대한 이해가 많이 떨어지는데 그래도 대충 보니까 elution 할 때 Proteinase K의 농도를 고정한거 같은데.. 이 말은 salt 농도를 일정하게 했다는 거고 그렇다면 예전에 봤던 논문(MethylCap-Seq)만 salt 농도를 변화 시킨건가.. 음 여튼. 실험 방법 순서를 다시 정리하면 1.DNA extraction, 2.sonication(150-600bp가 되게끔), 그리고 이때 100bp보다 작은건 제거, 3. recombinant MBD2_MBD를 조각낸 DNA에 붙임, 4.library를 만드는데 이때 길이가 120bp 위주로, 5.GAII로 36bp를 읽는다.


bowtie로 align 했고 unique mapped read 만 분석에 사용. duplication read 제거. genome을 unoverlapped 100bp window로 만들고 36bp read를 120bp까지 extend 한다음에 이 120bp가 많이 커버하는 window로 이 read를 할당. 곧 genome 상의 methylation이 됐다 안됐다, 그리고 DMR 같은 것을 판단 할때 이 100bp window를 단위로 생각. RepeatMasker로 read들을 분석해서 repeat element확인. DMR은 각 윈도우별 unique mapped read를 가지고 Fisher's exact test로 p-value 구해서 찾음.


아래표는 실험 read의 throughput


아래 그림은 MiGS로 새롭게 찾아진 methylated region을 bisulfite sequencing으로 confirm 한 그림. 기다란 네모가 MiGS의 결과 window들인데 까맣다면 methylation 된거 하얗다면 unmethylation. 아래 점들은 개개인 별로다가 bisulfite 한것.


아래 표는 genome 상의 영역별 methylation의 정도를 나타낸 표. 
5'end는 TSS로 부터 500bp 안의 window들
3'end는 TES(transcription end site 혹은 stop site)로 부터 500bp 안의 window들
genic 은 5'end와 3'end 사이의 window
intergenic은 나머지 window




------------------------check list------------------------
1.method 지에 나왔던 MethylCap-Seq 논문에서 elution 할때 농도 변화를 줬는데.. 그 방법과 이유 확인.
2.library size selection 할때 sonication 하고 바로 size selection 하는건지 아니면 MDB 붙이고 elution시키고 나서 size selection을 하는 건지 확인. 내 생각으로는 sonication하고 바로 size selection 할거 같은데.. method를 볼때는 그때는 단지 100bp 아래로만 제거하는거 같은데.. 
3.FDR을 구할때 특정 read 갯수를 갖는 window의 수랑 expected window 수랑 비교해서 군한다고 하는데.. expected window 수를 어떻게 구하는지. 람다가 나오는데 이게 정확하게 무슨 의미인지.
4.왜 mapping 안된 read들을 Venter's genome의 sanger read에 mapping 했는지.
5.그림 1에서 bisulfite로 확인했을때 methylation 됐다 안됐다의 기준이 무엇인지(percentage?)

No comments:

Post a Comment