Monday, May 16, 2011

Parallel, tag-directed assembly of locally derived short sequence reads

예전에 생명과학연구소 소속이였을 때는 아침에 출근하면 genomeweb에 소개된 논문 한번 훑는게 습관이였는데.. 어느 순간 그 습관을 잃어버렸다. 확실히 그 때가 새로운 경향이라던지 어떠한 식의 분석으로 논문들이 나왔는지 대략적인 감각이 있었는데.. 요즘은 그러한 것에 대해 생각이나 대화가 적어진걸로 보아 확실히 뭔가를 잘 못하고 있는 듯 하다.  이번 새로운 블로그는 하루하루 genomeweb에서 소개된 논문 중 관심가는 논문이나 아니면 뭐 서핑하다 찾은 논문들을 간략하게 정리하려 한다(어짜피 abstract 와 그림정도만 볼거라서..).


이번 논문은 여기. 네이쳐 메소드에 2010 년초에 나온 논문. 제목을 보는 순간.. 아.. 회사에서 de novo assembly 한다는데.. 아무 생각 없이 그냥 depth만 높인다던지 아니면 platform을 섞는다는 것 같은 뻘짓을 안하게 할 수 있겠다는 생각이 들어서.. 함 봐보자.




위 그림이 이 논문의 핵심인거 같은데.. 
그림과 그림의 설명으로 추론(?) 하자면 일단은 500bp 정도로 라이브러리 만들고 양 끝에 tag-adjacent adaptor를 붙인다. 이런 것들을 죽 연결되도록 붙인다. 그담 random하게 shearing 한다. 그뒤 brekpoint-adjacent adaptor를 붙인다. 그런 담에 forward primer는 tag-adjacent adaptor에 매치되게 reverse primer는 breakpoint-adjacent adaptor에  매치 되도록 제작해서 pcr 한다. 그러면 a 그림의 마지막 그림처럼 될거고. 이게 이 프로토콜의 핵심인데.. 


위에 쓴 것이 너무 주저리 주저리 써서 이해가 안되는데.. 결국 읽어 보니.. 정리하자면. 목표는 시작점은 같고 끝점이 다른, 즉 시작점은 같지만 길이가 다른 insert library를 만드는것(paired-end니까 양끝의 read가 생길거라서 한쪽은 시작점 다른 한쪽은 끝점). 그렇게 되면 시작점의 read는 은 그 library의 tag로 쓸 수 있고 끝 점의 read는 그 library의 다양한 위치에서의 read니까, 그 끝점의 read만 assembly 하면 subassembly가 된다는것.


여기까지만 보자.

No comments:

Post a Comment