logo

logo

産品服務

Sequencing services

  • 首頁目标區域測序

目标區域測序

      目标區域測序,是将感興趣的基因組區域定制成特異性探針與基因組DNA進行雜交,将目标基因組區域的DNA片段進行富集後再利用第二代測序技術進行測序。這種新的方法與PCR方法相比,通量高,同時能節省大量的時間及成本。目前動植物序列捕獲系統有:Agilent SureSelect Target Enrichment System及NimbleGen SeqCap EZ Developer。

1、Agilent捕獲系統

       Agilent SureSelect Target Enrichment System液相捕獲,是基于120 mer的RNA寡核苷酸探針或者叫“baits”。Baits上連接的生物素,可以被鍊黴親和素标記的磁珠吸附。基因組片段打斷後,與baits進行雜交,捕獲目标片段。利用磁珠吸附出帶有baits的DNA片段後,進行磁珠洗脫、RNA探針降解,最終獲得目标區域DNA片段。

圖2

圖1 Agilent SureSelect捕獲流程

       Agilent提供小鼠(All Exon Mouse, 49.6 Mb)、斑馬魚(All Exon Zebrafish, 75Mb)、牛(All Exon Bovine, 54Mb)的外顯子捕獲芯片,其他物種目标區域都需要進行目标區域定制(定制區域1Kb-24Mb)。

2、NimbleGen捕獲系統

       與Agilent的捕獲原理類似,NimbleGen采用DNA探針,以高密度探針著稱,因此價格也相對較高。NimbleGen對指定區域采用advanced repeat masking方法設計探針,将重複序列區封閉起來,保證了很好均一性(uniformity)和覆蓋率(coverage)。如下圖所示, NimbleGen利用高密度的50-105 mer的DNA探針來覆蓋目标區域。

圖3

圖2 NimbleGen探針設計示意圖

NimbleGen SeqCap EZ Developer可以根據客戶要求定制目标區域捕獲探針,能捕獲高達200Mb的目标區域。另外,還有一些設計好的探針。

表1 NimbleGen SeqCap EZ Developer參數

型号

區域大小

套裝(反應/包裝)

SeqCap EZ Developer Library

Up to 200Mb

4, 12, 24, 48, 96, 384, 960

表2  NimbleGen pre-designed探針

芯片名稱

物種

區域大小

Vertebrate Infecting Viruses

脊椎動物感染病毒

207種病毒

Switchgrass Exome

柳枝稷

50Mb

Maise Exome Design

玉米(B73和Mo17)

110Mb

Barley Exome Design

大麥

88.6Mb

Wheat Exome Design

小麥

106.9Mb

Soy Exome Desgign

大豆

85.3Mb

Mouse Exome Design

小鼠

54.3Mb

Pig Exome Design

22.5Mb

Canine Exome Design

152Mb

 

信息分析内容

■  對原始數據進行去除接頭、污染序列及低質量 reads的處理;

■  測序評估(數據比對統計,測序飽和度分析,測序随機性的統計分析,reads 在參考基因上的分布分析);

■ SNP、InDel 檢測,注釋和統計;

■ SNP 保守性預測;

■ SNP、InDel 在各基因功能元件上的分布統計。

群體高級信息分析

■  群體SNP檢測,注釋與統計

■  群體SNP質控(包含base quality,map quality,allele balance,strand bias,mappability,homopolymer,Hardy-Weinberg Equilibrium測試,InDel附近的SNP過濾)

■  選擇分析,可選擇方法有:FST,Tajima’s D,θп等

■  GO功能注釋分析,KEGG通路富集分析(可選;GO功能注釋分析默認做,通路富集分析需要基因集基于通路篩選的可做)




   表1 送樣建議和級别判斷

樣品類型

總量

濃度

完整性(膠圖)

純度

基因組 DNA

常規

≥1ug

≥12.5ng/uL

主峰>20Kb

無蛋白,RNA/鹽離子等污染,樣本無色透明不粘稠

微量

≥200ng

≥2.5ng/uL

無降解或輕微降解

如果建庫采用Agilent SureSelect QXT試劑盒,則要求DNA總量≥50ng,濃度≥25ng/μL

FFPE DNA

常規

≥1ug

≥12.5ng/uL

主峰>500bp

無蛋白,RNA/鹽離子等污染,樣本無色透明不粘稠

微量

≥200ng

≥2.5ng/uL

主峰>500bp

-


Q1:捕獲效率的影響因素?

捕獲效率影響因素有樣本本身的質量、區域複雜度(重複序列區、高GC)、探針設計不佳等。由于捕獲效率未知,我們無法承諾有效深度;可以根據經驗捕獲效率做個預估的數據量,一般按照30%-40%的捕獲效率預估,植物的捕獲效率較低,越小區域的捕獲效率通常也越低。

預估公式:raw data=目标區域*測序深度/捕獲效率/0.9(clean和raw data的比率)

eg. 假設某動物目标區域大小500kb,期望測序深度500X,那推薦數據量raw data=500kb*500/0.4/0.9=0.7Gb

Q2:多雜一有何劣勢?

多雜可以節約試劑成本,但雜交數目越多,可能會導緻每個樣品的數據産出不均,片段重複率升高等問題,因此不是雜交越多越好,要綜合考慮項目情況、每個包裝的rxn數目。

Q3:目标區域捕獲 kit 的保質期是從申請訂購開始還是從到貨之後計算,多久?

保質期從到貨開始計算為1年。 

Q4:目标區域捕獲的多雜基數如何計算?

多雜基數與芯片設計的覆蓋度、樣品數、樣品質量、目标區域大小等相關;多雜對捕獲均一性、重複序列比例、覆蓋度等指标評估可能有影響,需要綜合考慮各種因素後作出評定。Agilent捕獲平台的多雜基數通常在8雜以下,NimbleGen通常在12雜以下。

多雜基數:或叫雜交數,即一套探針同時做幾個樣品,例如二雜一,指的是2個樣品用一套探針和捕獲試劑。

Q5:目标區域評估需要提供哪些信息?

客戶需提供要捕獲的物種名稱,參考的基因組版本和目标區域所在的染色體号、起點位置、終點位置。該區域位置選擇需要根據研究目的選擇合适的區域如基因的exons,upstream,downstream或者連續的一段區域等。也可以隻提供基因名稱,默認按照exon+UTR的區域預估。

Q6:華大提供哪些動植物目标區域捕獲?

有參考基因組的物種,提供了目标區域進行評估後,滿足定制要求的都可以進行目标區域捕獲。對于Agilent在線評估中存在的物種評估免費,其他的物種進行線下評估,Agilent公司會收取一定的線下評估費用。

目前Agilent(16種,可線上設計)和Nimblegen(隻提供人的線上設計,其他物種需走線下)。

表1 Agilent可線上設計探針的物種

序号

物種/species

物種

版本/build

1

H. sapiens

H. sapiens, hg19, GRCh37, February 2009

2

M. musculus

小家鼠

M. musculus, UCSC mm9, NCBI Build 37, July 2007

3

R. norvegicus

褐鼠

R. norvegicus, UCSC rn4, HGSC Version 3.4, November 2004

4

A. thaliana

拟南芥

A. thaliana, TAIR 10, November 2010

5

B. taurus

家牛

UCSC bosTau6, UMD_3.1, November 2009

6

C. elegans

秀麗線蟲

C. elegans, UCSC ce6, WormBase WS190, May 2008

7

C. familiaris

C. familiaris, UCSC canFam3, CanFam3.1, Sep 2011

8

C. jacchus

C. jacchus, UCSC calJac3, WUGSC 3.2, March 2009

9

D. melanogaster

果蠅

D. melanogaster, UCSC dm3, BDGP Release 5, April 2006

10

D. rerio

斑馬魚

D. rerio, UCSC danRer7, Sanger Zv9, July 2010

11

G. gallus

G. gallus, UCSC galGal3, WUSTL v2.1, May 2006

12

M. mulatta

猕猴

M. mulatta, UCSC rheMac2, Dpse_2.0, January 2006

13

O. latipes

青鳉

O. latipes, UCSC oryLat2, NIG/UT MEDAKA1, October 2005

14

O. sativa

亞洲栽培稻

O. sativa, IRGSP5, June 2008

15

S. cerevisiae

面包酵母

S. cerevisiae, UCSC sacCer2, SGD, June 2008

16

S. pombe

裂殖酵母

S. pombe, NCBI Build 1.1, February 2002

Q7:目标區域有什麼要求?

可以是連續的DNA片段,也可以是分布在同一染色體不同區域或不同染色體上的片段。長度不定,原則上沒有限制。但太小(幾十K以下)且樣本量很少時,建議散樣測序;太大且目标區域都位于外顯子情況下,成本很高,建議做外顯子測序。難點區域:複雜區域,如重複序列較多,GC含量過高或過低,n區等存在探針設計困難。

Q8:目标區域樣本數量有要求嗎?

理論上對樣本數量沒有要求,但是芯片都存在起訂量,比如Agilent最低起訂量是16個反應,往往采取多雜一的方式節省成本,因此如果樣品量太少,平均到每個樣品的芯片成本會很高,有可能比直接做重測序還高,所以建議樣本量大一些。

Q9:捕獲效率一般預估多少?

目标區域定制化的捕獲效率一般按照40%預估,但在植物捕獲方面,捕獲效率較差;區域小(幾kb-幾十kb)的區域捕獲效率也會較低。

Q10:目标區域為何不承諾測序深度?

目标區域隻承諾raw data,不承諾測序深度。因為目标區域屬于定制化,由于不同區域的捕獲效率不定(受GC含量、重複序列的影響),因此無法準确預估測序深度與數據量的對應關系。

深圳華大科技(總部)

電話:400-706-6615
郵箱:info@genomics.cn