logo

logo

産品服務

Sequencing services

MHC 捕獲測序

      MHC區域序列捕獲技術是利用目标區域MHC區域序列設計探針,并通過捕獲的方法将其富集,利用高通量測序手段對該區域DNA序列的變異進行分析。本産品研究的區域是hg19:chr6:28477797-33448354,共計4.97 Mb;包含了傳統MHC區域(約3.37 Mb)及其側翼區域(約1.6 Mb),成功實現了對于常規擴增方法難以得到的高重複區域的高覆蓋和有效富集。

圖1

圖1 目标區域技術流程

産品優勢

1.      BGI和NimbleGen聯合研發探針,測試結果與基因分型SNP一緻率高達99.42%,覆蓋度達到97%;

表1 三個樣品(YH、NA18532、NA18555)測序數據

圖片2

表2 MHC捕獲測序與芯片分型比較

表2

2.      成功實現了對此區域的高覆蓋(覆蓋率:>97%,涵蓋傳統3.37 Mb MHC核心區域,并擴展了周圍1.6 Mb區域);

3.      可對該區域中26個基因(A,B,C,DRB1,DQB1,DPA1,DPB1,DQA1,G,DMA,DMB,DOA,DOB,DRA,E,F,H,J,K,MICA,MICB,P,TAP1,TAP2, V,L)進行HLA分型,分型至少可以達到四位數水平(依賴于現有數據庫裡的型别),分型準确率可以達到95%以上。

4.      已發表文章科研及方法學文章4篇,科研經驗豐富。


研究策略

PE126(500bp插入片段)或PE151(300bp插入片段), 推薦PE126,1G raw data


标準信息分析内容

1.      去除接頭污染和低質量數據

2.      數據通過BWA與數據庫進行比對

3.      數據産量統計分析、測序深度分析、覆蓋度均一性分析

4.      SNP變異信息檢測(SAMtools、SOAPsnp、GATK)

5.      SNP的RefGene注釋

6.      SNP數據庫分析(與dbSNP、千人基因組數據、ESP外顯子組數據庫以及炎黃基因組(僅亞太地區)數據進行數據庫注釋分析)

7.      單樣品SNP保守性預測、緻病性分析

8.      SNP在各基因功能元件上的分布統計

9.      InDel變異信息檢測(SAMtools、GATK)

10.   InDel的RefGene注釋

11.   InDel數據庫分析(與dbSNP 、千人基因組數據、ESP外顯子組數據庫、炎黃基因組(僅亞太地區)進行數據庫注釋分析)

12.   InDel在各基因功能元件上的分布統計

13.  26個基因的HLA分型


HLA分型方法說明

(1)   篩選reads:從BAM文件中挑選單端或雙端map上的reads,以及沒有map上的高質量reads,按照基因進行歸類保留。

(2)   重比對和變異檢測:将上述保留的reads用BWA軟件重新比對到IMGT/HLA數據庫中,該數據庫包含所有目前已知的HLA型别。比對時,最多允許兩處不一緻(SNP/InDel導緻的),這種reads最終保留,并且用最接近的參考序列替代。基于新比對的數據進行變異檢測以及質控。

(3)   Haplotype組裝和打分:利用reads之間的重疊序列将reads拼接成haplotype,重疊序列長度要求至少10bp。将組裝的haplotype參照IMGT/HLA數據庫進行過濾,保留隻存在于數據庫中的haplotype。根據haplotype的reads數目、覆蓋度、均一度對保留的haplotype進行打分。

(4)   确定最優的HLA型别:結合基因所有的外顯子,将haplotype進行連鎖,通過之前對haplotype的打分和reads覆蓋情況,從中挑出最優的型别1和型别2。

圖2

圖2 HLA分型思路


華大案例:大樣本量測序揭示漢族人群MHC區域特征及其與疾病的關系

Deep sequencing of the MHC region in the Chinese population contributes to studies of complex disease(Nature Genetics. 2016)

文獻摘要:

1) 對10,689個健康人和9,946個銀屑病人進行MHC捕獲測序,構建了漢族人特有的MHC數據庫,極大提高了HLA基因分型的準确性。

2) 發現多個新的獨立的銀屑病易感基因位點:HLA-C, HLA-B, HLA-DPB1, BTNL2,基因間區變異 rs1188179173,也發現銀屑病中常見的易感基因HLA-C*06:02。

3) 漢族人特有的MHC數據庫有助于疾病緻病機理的研究。

案例圖1

圖1 漢族人群和歐洲人群的HLA等位基因頻率存在顯著差異

案例圖2

圖2 漢族人群中29個MHC基因的多樣性

8個多樣性最高的位點分别為:HLA-B (D = 0.959) ,HLA-DRB1 (D = 0.928), HLA-C (D = 0.915) ,HLA-A (D = 0.897) ,MICA (D = 0.892) ,HLA-DQB1(D = 0.890) ,HLA-DQA1 (D = 0.867), HLA-DPB1 (D = 0.802) D代表多樣性。


附:華大已發表MHC文章列表

文獻标題

發表期刊

影響因子

發表日期

An Integrated Tool to Study MHC Region: Accurate SNV Detection and HLA Genes Typing in Human MHC Region Using Targeted High-Throughput Sequencing

PLoS One

3.06

2013/07

Deep sequencing of the MHC region in the Chinese population contributes to studies of complex disease

Nature Genetics

27.96

2016/05

HLA-DRB1*15:01 and HLA-DRB3*02:02 in PLA2R-Related Membranous Nephropathy

Journal of the American Society of Nephrology

8.97

2016/12

Typing and copy number determination for HLA-DRB3, -DRB4 and -DRB5 from next-generation sequencing data

HLA

1.60

2017/02



 表1 送樣建議和級别判斷

樣品類型

總量

濃度

完整性(膠圖)

純度

基因組 DNA

常規

≥1ug

≥12.5ng/uL

主峰>20Kb

無蛋白,RNA/鹽離子等污染,樣本無色透明不粘稠

微量

≥200ng

≥2.5ng/uL

無降解或輕微降解

如果建庫采用Agilent SureSelect QXT試劑盒,則要求DNA總量≥50ng,濃度≥25ng/μL

FFPE DNA

常規

≥1ug

≥12.5ng/uL

主峰>500bp

無蛋白,RNA/鹽離子等污染,樣本無色透明不粘稠

微量

≥200ng

≥2.5ng/uL

主峰>500bp

-


Q1:MHC捕獲試劑盒的捕獲區域有多大?

捕獲區域共4.97 Mb,包含了傳統的MHC區域(約3.37 Mb)及其側翼區域(約1.6 Mb),以及8個單體型信息。

Q2:MHC捕獲測序用的是哪個捕獲平台?

由于MHC捕獲試劑盒是由BGI和NimbleGen聯合開發,故捕獲平台采用的是NimbleGen液相捕獲平台。

Q3:MHC捕獲測序目前隻能做人的樣品嗎?

人MHC捕獲測序目前已成為标準化産品。至于其他物種,需要重新設計捕獲探針後再做定制化目标區域捕獲。

Q4:BGI的分型準确率可以達到什麼水平?

分型至少可以達到四位數水平,主要依賴于現有數據庫裡的型别。分型準确率可以達到95%以上。

Q5:FFPE等其他特殊樣本可以做MHC捕獲測序嗎?

可以。但是樣品量必須達到華大樣品檢測标準,并且雜交數推薦2雜。

Q6:MHC推薦數據量為多少?

1Gb raw data。


深圳華大科技(總部)

電話:400-706-6615
郵箱:info@genomics.cn