PacBio로 Gap Filling 하기

오늘 소개할 논문은 아래 논문

 

English et al., Mind the Gap: Upgrading Genomes with Pacific Biosciences RS Long-Read Sequencing Technology, Plos One 2012

 

NGS 시대가 왔다고 하지만, 결국 모델생물이 아닌 잡생물의 지놈 어셈블리 퀄리티는 피니싱까지 마친 모델생물의 지놈 퀄리티에 결코 미치지 못하는 것이 사실. 게다가 short read에 의한 de novo assembly 의 경우 나오는 퀄리티가 기존의 생거 시절의 드래프트 퀄리티보다도 훨씬 못함.

그래서 이것을 좀 개선해 보려고 여러가지 시도가 되고 있는데, 역시 가장 유망한 것은 PacBio나 Oxford Nanopore와 같은 3세대 시퀀싱 기술이 일반화되어 몇kb씩 되는 read를 쑥쑥 뽑아내는 것일것임. 그러나 PacBio는 기껏해야 85% 정도의 base accuracy 를 가지고 있다는 문제, Oxford Nanopore는 뭐 기계가 나와야지 원…ㅋㅋㅋ

그래서 그나마 현재 데이터가 나오는 PacBio 데이터를 좀 보완하는 방법들이 몇가지 발표되고 있는데 이전에 발표된 것은 PacBio 의 long read에 illumina의 short read 데이터를 align 해서 에러교정을 하고, 이 long read 로 assembly를 하는 방법.

Image

그러나 저 위 링크에 나온 방법은 기존의 드래프트 어셈블리를 그대로 두고 여기에 PacBio read 를 얼라인한후 gap 을 메꾸는 넘을 찾아서 Gap 부분만 로컬 어셈블리해서 (한마디로 PacBio 데이터를 gap에 잘라붙이는;;;) 어셈블리를 개선하는 방법. 새롭게 어셈블리를 하지 않고 기존의 어셈블리에 근거해서 어셈블리를 개선하는 것의 장점이라면 어노테이션을 새로 홀라당 다 할 필요가 없다라는 이야기. (어셈블리가 틀려지면 contig 번호, base 넘버가 다 틀려지므로 기존의 유전자 위치정보가 다 도루묵이 됨 ㅋ)

Image

그냥 간단하게 말해서 gap 사이 통과하는 롱다리 PacBio read 골라내고 잘라붙이기 한다고 이해하면 되겠음.

그래서 이런 파이프라인을 거치면 얼마나 어셈블리가 개선되나?

Image

샘플에 따라서 틀리지만 어쨌든 6X 정도의 PacBio  데이터를 이용해서 잘라붙이기 신공을 발휘하면 90%에서 60% 정도의 gap을 메꿀 수 있다고..

물론 몇가지 개선되어야 할 부분은 있는데,

1. 위 파이프라인의 경우 scaffold 내의 gap (sequence gap) 을 메울 수는 있지만 scaffold 간의  gap (physical gap) 을 메우는 것은 현재로써는 불가능한듯. 사실 sequence gap 보다 scaffold 간의 link 를 확립하는 것이 보더 더 유용한 정보를 제공하는데 이 부분에 대해서는 아직 ㅋ 뭐 다음 페이퍼라구염? ㅋㅋㅋ

2. 아무런 에러교정 없이 PacBio 데이터를 잘라붙여서 Gap을 메꾸는 셈이므로 다른 데이터가 없이 PacBio 데이터만 있는 부분이라면 PacBio 의 에러가 같이 스리슬쩍 들어오겠졈? 아놔 Gap 으로 NNNN 하는 것보다는 좀 틀려도 시퀀스가 있는게 더 낫지? 라고 생각할지 모르겠지만 어셈블리가 만들어진 다음 genbank 에 들어갈때 ‘이부분은 PacBio 데이터 밖에 읍음. 에러 있어도 몰라 ㅋ’ 하고 써있는것도 아니고..뭐 하긴 모든 genome sequence는 완벽한게 아니니깐 글타 치자..

3. 결국 Long Read Sequencing 기술의 발전이 더 있어야 이런 꾸질한 짓거리를 안할 수 있다는 말. Oxford Nanopore가 빨리 나오든지 해야지..

4. PacBio는 이제서야 이런 식으로 ‘쓸모가 전혀 없는 것은 아니다’ 라는 내용이 나오긴 하지만..주가를 보면 과연 이 회사 얼마나 버틸까에 대한 의구심이 드는 게 사실ㅋ

Image

 

쥬커버그 “저런 애들도 있는데 나보고 뭐라하는거임? ㅋㅋㅋ”

 

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s