美吉生物

基因组测序 de novo基因组测序 动植物基因组测序

动植物基因组测序 生信分析 技术参数 案例解读 常见问题 留言咨询

全基因组de novo测序是指不需要任何参考序列即可对某个物种进行测序,用生物信息学分析方法进行组装,从而获得该物种的全基因组序列图谱。自1998年模式动物线虫基因组测序完成以来,目前动物基因组测序完成的已超过200个,小至几十兆(食蟹猴疟原虫,26.2 Mb),大至几千兆(短尾负鼠,3.4 Gb);植物2000年拟南芥基因组测序完成以来,已陆续有100多种植物测序完成。在已经完成测序的植物中,基因组大小范围也较大,小至几十兆(三角褐指藻,27.4 Mb),大至几万兆(火炬松,23.2 Gb)。一个物种基因组图谱的绘制完成,标志着可以从基因组水平对该物种的生长、发育、进化、起源等问题进行研究,从而推动对基础生物学、分子育种、遗传基因改良等方面的研究,对珍稀动植物的保护和优异种质资源品种也具有重要意义。


美吉优势

拥有标准化实验室和高通量测序技术平台,实验周期短,质量可靠;

拥有Illumina HiSeq 2500/4000MiSeqPacbio等多种高通量测序平台

技术人员经验丰富,可根据客户需求提供实验方案、解决实验问题、分析实验结果;

拥有专业的生物信息分析团队和大型计算机,可提供个性化的生信分析服务;

提供合作论文撰写及发表。


产品类型

       (1) 动植物基因组survey

构建Illumina PE250500bp)文库,通过Illumina平台测序并进行k-mer分析、GC-depth分布分析和初步组装,评估待测物种基因组复杂情况(基因组大小、杂合率、GC含量及重复序列情况等);此外,也可通过基因组survey进行SSR标记开发等分析。

       (2) 动植物基因组精细

根据基因组复杂程度,可以分为简单基因组和复杂基因组;

简单基因组:主要指重复序列比例低于50%的单倍体或高纯合二倍体(杂合率低于0.5%),如大部分哺乳动物、鸟类等。

复杂基因组:主要指重复序列比例高于50%,杂合率大于0.5%的二倍体或多倍体,如大部分水产动物以及昆虫、林木等。

构建Illumina10X GenomicsPacbio文库,通过IlluminaPacbio RS II平台测序并进行denovo基因组组装,且可结合转录组、光学图谱、HIC等获得高质量的基因组精细图并进行深度生物信息挖掘。



实验流程

                                                                        动植物Survey实验流程图 

                                 

                                                                           动植物精细图实验流程图



生信分析流程


生信分析内容

标准分析

高级分析

原始数据统计与处理

基因家族鉴定

基因组拼接

系统发育树分析

基因预测

基因家族扩张和收缩分析

重复序列分析

物种分歧时间估算

非编码RNA预测

基因组共线性分析

Swiss-prot/TrEMBL/Interpro/Pfam

正选择基因分析

GO/KEGG注释

全基因组复制分析



动植物Survey技术参数


样本要求


策略


服务周期


样品类型:基因组DNA

样品量:浓度≥30ng/μlDNA总量≥4μgOD260/280介于1.8-2.0之间并确保DNA无降解、无污染,切忌反复冻融;



测序平台:Hiseq2500/4000

文库:250bp/500bp

数据量:≥40×


   


  40


动植物精细图技术参数

样本要求

产品分类

测序策略

组装承诺指标

项目周期










样品类型:

基因组DNA;

样品总量:≥50μg;

浓度≥50ng/μl;

OD260/280=1.8-2.0

样品无污染无降解








简单基因组



纯二代

文库类型:PE(250bp/500bp/800bp);

MP(2k/3k/5k/8k/10k/20k)/10X Genomics;

测序策略:Hiseq PE150

测序深度:≥100×


Contig N50≥20kb,

Scaffold N50≥1Mb







4-9个月



2+3

文库类型:PE(250bp/500bp/800bp);

MP(2k/3k/5k/8k/10k/20k)/10XGenomics;

Pacbio~20kb

测序策略:2+3

测序深度:二代100×;三代10×



Contig N50≥100kb,

Scaffold N50≥1Mb

纯三代

文库类型:Pacbio~20kb

测序深度:≥80×

Contig N50≥1Mb





复杂基因组



纯二代

文库类型:PE(250bp/500bp/800bp);

MP(2k/3k/5k/8k/10k/20k)/10X Genomics;

测序策略:Hiseq PE150

测序深度:≥200×


Contig N50≥20kb,

Scaffold N50≥500kb





9-15个月

2+3

测序深度:

二代200×;三代30×

Contig N50≥60kb,

Scaffold N50≥500kb

纯三代

文库类型:Pacbio~20kb

测序深度:≥100×

组装指标视物种

具体情况而定





哺乳动物和鸟类(蝙蝠除外)



纯二代

文库类型:PE(250bp/500bp/800bp);

MP(2k/3k/5k/8k/10k/20k)/10X Genomics;

测序策略:Hiseq PE150

测序深度:100×


Contig N50≥40kb,

Scaffold N50≥2Mb





3-6个月

2+3

测序深度:

二代100×;三代1

Contig N50≥100kb,

Scaffold N50≥4Mb

纯三代

文库类型:Pacbio~20kb

测序深度:≥80×

Contig N50≥5Mb



送样要求

1.样品类型

动植物组织或者DNA


2.样品DNA需求量

250-500bp小片段PE文库> 2µg;3-5K大片段MP文库> 10µg;

5-10K大片段MP文库>40µg;10-20K大片段MP文库>60µg;

Pacbio文库>10µg;



3.样品浓度

小片段文库>50ng/µL;大片段文库>100 ng/µL。


4.样品纯度

OD260/280=1.8-2.0并确保DNA无降解,无污染。


5.样品保存期间切忌反复冻融,送样时请使用冰袋或干冰运输。






案例一:草鱼基因组测序揭示其进化与草食适应性[1]

草鱼是我国重要的淡水养殖鱼类,也是世界范围内最重要的淡水养殖品种之一,其产量约占全球淡水养殖总量的16%。基因组测序组装得到0.9Gb雌性草鱼基因组和1.07Gb雄性草鱼基因组序列。分析显示草鱼与斑马鱼的分化时间发生在4900-5400万年前,与斑马鱼相比草鱼发生染色体融合现象。转录组分析发现肝脏中甲羟戊酸通路和类固醇生物合成通路被激活与草鱼食性转变有关。


1 草鱼基因组组装与进化



2 草鱼与斑马鱼核型图



3 转录组分析揭示草鱼食性转变


案例二:菠萝基因组测序和CAM光合途径进化研究[2]

人类培育菠萝的历史已经超过了6000年,开始于现在的巴西西南部和巴拉圭东北部。全球80多个国家每年生产约2500万吨的菠萝水果,总产值接近90亿美元。基因组测序组装得到382Mb,占基因组72.6%;共27,024个基因,其中89%是完整的。染色体核型进化分析显示菠萝基因组经历了στ两次全基因组复制事件(图1)。CAM途径分析显示菠萝景天酸代谢光合作用不是通过全基因组复制或串联基因复制产生的重复基因演化而来(图2)。


1 菠萝基因组两次全基因组复制事件


2 菠萝景天酸途径的演化


参考文献


[1]Wang Y, Lu Y, Zhang Y, et al. The draft genome of the grass carp (Ctenopharyngodon idellus) provides insights into its evolution and vegetarian adaptation. Nature Genetics, 2015, 47(6): 625-631.

[2]Ming R, VanBuren R, Wai C M, et al. The pineapple genome and the evolution of CAM photosynthesis. Nature Genetics, 2015, 47(12): 1435-1442.




1)动植物基因组de novo测序之前为什么必须先进行survey

动植物基因组差异较大、结构复杂度(重复序列、杂合率),染色体倍性等差别较大,需要根据基因组情况制定合适的测序策略,如果直接测序组装,组装质量可能会非常差。

2)植物基因组测序对样品取样有什么特殊要求?

最好选择黑暗无菌条件下培养的黄化苗或组培样品取样;建议采用纯合二倍体或单倍体材料。

3)动物基因组测序对样品取样有什么特殊要求?

样品提取应选用肌肉、血液等脂肪含量较少的部位,并尽量选用同一个体进行取样。如果物种体积较小,单个个体所提取的 DNA 量不足一次测序反应,在保证量的情况下,应当尽量减少物种的个数,以减少个体差异性对后续拼接的影响。样品建议采用单倍体或纯合二倍体材料。

4)如何检测最终组装结果的准确性?

目前,主要可以通过以下几种方法来检验基因组组装的准确性。

通过构建BACFosmid文库,并进行常规测序,将所得序列与拼接好的Contigs做比对以判断基因组组装的准确率。同时也可以与CEGMA数据库中核心基因进行比较查看测序物种预测得到的基因完整性评估基因组的准确性。

将已知的基因序列与拼接好的Scaffolds做比对,查看两者是否吻合,吻合度越高,表明基因组组装越好。而且已知的基因序列越多,评价结果越可靠。

估计组装后基因组的单碱基准确度,如果95%以上的基因组单碱基覆盖度超过20×,则认为该基因组的单碱基准确度较高。

填写资料 (电话、邮编和备注选填,其余均为必填项)

微信扫一扫