보르헤스의 지도
Genome In A Bottle consotium (GIAB) 본문
미국 국립표준기술연구소 (NIST)는 최근 Genome in a bottle consotium(GIAB)를 구성하여 sequencing 과 bioinfomatics 방법들의 성능을 평가하기 위해 특정 사람의 DNA sample 들을 참조 물질로 개발하고 있으며, 이들에 대한 높은 정확도의 참조 유전체 data를 가지고 있다. GIAB는 2012 년 4월에 NIST 에서 FDA, NCBI, NHGRI, NCI, CDC, Wash U, Broad 등 여러 기관들이 모여 처음 work plan을 짜고 인간의 참조유전체 물질 개발 관련한 컨소시엄을 발전시켰다. GIAB에서는 한 사람의 genome data 를 완성할 때 variant call을 향상시키는데 가족들의 자료를 이용하려 하였고 우선 3개의 가계도를 확보하여 이들 중 NA12878의 sample을 선택하여 우선적으로 한사람에 대한 높은 정확성의 genome data 를 만들고자 하였다.
표준 variant call 을 만들기 위한 integration 방법
- 각각의 platform을 통해서 후보 variant 들을 골라 이들 variant 들에 대한 동일성과 비동일성을 파악
- systematic error들을 파악하여 조정
- 유전체에 나타난 변이의 영역 별로 신뢰정도를 결정
- 높은 신뢰성을 보이는 영역은 77% 정도이고 낮은 신뢰성을 보이는 영역은 23%로 지정
- 높은 신뢰성을 보이는 영역은 platform들의 결과들이 동일하고 systematic error 들의 증거들이 보이지 않고 Mendelian inheritance 에 모순되지 않는 영역임
- 낮은 신뢰성을 보이는 영역은 현재 기술로 알기 어려운 중복서열, GC 비율의 변화가 큰 구간이거나 많은 platform에 걸쳐서 systematic error의 증거가 있는 영역, 혹은 Mendelian inheritance에 모순되는 영역임
'이놈, 저놈, genome...' 카테고리의 다른 글
Illumina는 지난 월요일에 논의 된 Firefly 프로젝트의 일환으로 개발 한 반도체 기반 시퀀싱 시스템을 월요일에 공개했다. (0) | 2018.01.16 |
---|---|
JPM Healthcare Day 1 (0) | 2018.01.16 |
Multiplexed Illumina HiSeq 4000 Sequencing 에서 리드들의 잘못된 정렬에 대한 연구 보고서 (0) | 2017.05.02 |
GenomeAsia 100K 계획은 인구 절반에 대한 지식 격차를 줄이는 것을 목표로 하고 있다. (0) | 2016.02.25 |
Feature frequency profiles (0) | 2016.02.02 |
Comments