基因組重測序的應用
一、背景
基因組重測序是對已知基因組序列的物種進行不同個體的基因組測序,并在此基礎上對個體或群體進行差異性分析。
全基因組重測序的個體,通過序列比對,可以找到大量的單核苷酸多態性位點(SNP),插入缺失位點(InDel,Insertion/Deletion)、結構變異位點(SV,Structure Variation)位點和拷貝數變異位點(CNV,copy number variation)。SBC可以協助客戶,通過生物信息手段,分析不同個體基因組間的結構差異,同時完成注釋。
技術路線:提取基因組DNA,利用Covaris進行隨機打斷,電泳回收所需長度的DNA片段(0.2~5Kb),加上接頭,進行cluster制備(Solexa)或E-PCR(SOLiD),最后利用Paired-End(Solexa)或者Mate-Pair(SOLiD)的方法對插入片段進行重測序。
二、生物信息分析流程
1、數據量產出
總堿基數量、Totally mapped reads、Uniquely mapped reads統計,測序深度分析。
2、一致性序列組裝
與參考基因組序列(Reference genome sequence)的比對分析,利用貝葉斯統計模型檢測出每個堿基位點的最大可能性基因型,并組裝出該個體基因組的一致序列。
3、SNP檢測及在基因組中的分布
提取全基因組中所有多態性位點,結合質量值、測序深度、重復性等因素作進一步的過濾篩選,最終得到可信度高的SNP數據集。并根據參考基因組序列對檢測到的變異進行注釋。
4、InDel檢測及在基因組的分布
在進行mapping的過程中,進行容Gap的比對并檢測可信的Short InDel。在檢測過程中,Gap的長度為1~5個堿基。
5、Structure Variation檢測及在基因組中的分布
目前SBC能夠檢測到的結構變異類型主要有:插入、缺失、復制、倒位、易位等。根據測序個體序列與參考基因組序列比對分析結果,檢測全基因組水平的結構變異并對檢測到的變異進進行注釋。
三、應用
用于應用全基因組重測序技術篩查原發性肌張力障礙的致病基因研究:
應用全基因組重測序技術對原發性肌張力障礙病患者進行全基因組重測序,結合生物信息學技術,篩查出可能與原發性肌張力表型患者密切相關的基因突變位點,從而發現新的基因或突變,有助于我們對該疾病進行正確的分子診斷以及提供更好的遺傳咨詢信息。
目的:(1)通過全基因組重測序技術篩查出可能與原發性肌張力表型患者密切相關的基因突變位點,為了該病家系患者的遺傳咨詢和臨床診斷提供依據。
(2)探討全基因組重測序技術在罕見疾病致病基因篩查應用中的可行性,為該技術的臨床應用提供新的信息。
方法:收集原發性肌張力患者及健康對照者外周血標本及臨床資料,提取受試者基因組DNA,選取1例具有典型原發性肌張力表型患者的DNA和100例健康對照者DNA分別構建患者全基因組測序文庫和健康對照者全基因組測序文庫,并進行高通量測序。下機獲得原始數據,經過初步數據過濾后與標準基因組序列比對,獲得原發性肌張力表型患者及對照組基因變異信息;通過比較原發性肌張力表型患者及對照組基因變異信息,并結合生物信息學技術,篩查可能與原發性肌張力表型患者密切相關的基因突變位點。
結果:(1)通過全基因組重測序一共得到240G bp的數據,其中患者的數據產出為127.90G bp,原始數據測序深度為45X,有效測序深度為40.30X,基因組覆蓋比例為98.90%,SNP數量為3,602,141,Indel數量為58,127,CNV數量為831,SV數量為8,431;健康對照者的數據產出為112.91G bp,原始數據測序深度為40X,有效測序深度為35.70X,基因組覆蓋比例為99.50%,SNP數量為3,550,305,Indel數量為558,038,CNV數量為824,SV數量為8222。
(2)SNP公共數據庫過濾并將病人與健康對照對比后,得到96個突變位點,突變基因包括錯義突變,蛋白質提前終止,移碼突變,內含子剪切異常等多種類型。
結論:(1)在臨床應用全基因組重測序工作中,患者結合健康人群的對照分析,有利于濾過未明確臨床意義的基因組變異位點。
(2)發現ANO3(N294H)突變與疾病的表型密切相關,可能是中國原發性肌張力障礙病患者的致病突變之一。
北京天優??瞪锟萍加邢薰?/span>
服務熱線:400-860-6160
聯系電話/微信:13718308763
QQ:2136615612 3317607072
E-mail:Tianyoubzwz@163.com


