美吉生物

项目文章 文章详情

助力客户登陆Nature子刊

项目文章2016-10-20

  内蒙古农业大学张和平教授团队采用美吉生物Illumina Hiseq 2000测序平台(相关测序工作由美吉生物协助完成)绘制了213株菌的基因组精细图谱,结合比较基因组学和功能基因组分析方法,解析与菌株分化相伴随的功能基因进化进程。研究成果"Expanding the biotechnology potential of lactobacilli through  comparative genomics of 213 strains and associated genera"发表在Nature子刊Nature Communications (IF:11.47)上。

技术:细菌基因组精细图   

测序平台:Illumina HiSeq2000

材料:乳酸杆菌

研究背景:

  乳杆菌属(Lactobacillus)是乳酸菌最大的一个属,在人和动物胃肠道微生态平衡有着重要的作用,也是乳制品发酵剂以及益生菌产品的主要菌株,乳酸杆菌属已经确认的种和亚种已经超过200多。发酵食品的生产加工过程中经常有乳杆菌的参与,如白酒、谷物、果蔬、面包、肉以及乳制品等,同时也在人和动物的肠道中有着广泛的分布。采用二代Illumina HeSeq 2000高通量测序平台绘制其基因组图谱,结合比较基因组和功能基因组分析方法,解析与菌株分化相伴随的功能基因进化历程,拓展其生物应用潜力。

主要研究结果:

1、属的多样性高于科的多样性

  采用Illumina HiSeq2000 PE(2*100)进行测序,平均每个菌株得到190M的高质量数据。组装最小基因组为1.23M,最大为4.91M。通过对213株研究发现共有44669个基因家族,对其中的73个核心基因进行ANI(平均核苷酸一致性)和TNI(总核苷酸一致性)的分析统计发现,Lactobacillus乳杆菌属的基因组TNI值为13.97%。说明尽管乳杆菌历来被定义为一个属,但是遗传多样性远高于其他典型的科水平的遗传多样性。



          Lactobacillus的ANI和TNI分布频率与传统的菌种分类比较

2、构建系统发育树

  选择来自26个门452个属的菌株和Lactobacillus属模式菌株,以它们同有的16个基因的氨基酸序列构建系统发育树,结果显示,Pediococcus、Weissella、Leuconostoc、OenococcusFructobacillus 这5 个属为 Lactobacillus 子分支。在过去很长一段时间有广泛的证据指明这5个属被认为属于Lactobacillus,本次分析结果与前人分析结果一致(图 2)。因此将Lactobacillus、Pediococcus、Weissella、Leuconostoc、Oenococcus和Fructobacillus等6个属命名为复合的乳杆菌属(Lactobacillus complex)。结果表明乳杆菌属为一个并系类群,是由从一个特定的共同祖先不断进化分化而成,即兼性异型发酵乳杆菌为了适应环境逐渐分化形成严格同型和异型发酵乳杆菌。



    图2:452属的进化树:基于16个标记基因的氨基酸序列利用最大似然法构建系统进化树,不同颜色代表不同的属。

3、糖苷水解酶在所研究的213个菌株中的分布

  糖苷水解酶glycoside hydrolases(GHs)数据库共有133个家族,本文中研究的213个菌株共有48个GHs家族(未经验证)(图 3)。图 3左边纵坐标是菌株名称,横坐标是不同的48个GHs家族,右边纵列不同颜色区域代表了菌株所附着的生物环境,图中每个菌株对应的GHs家族颜色从黑色到绿色分布,颜色越浅,代表该基因家族在该物种的拷贝数越多。


4、乳杆菌细胞表面互作因子

  我们在213株基因组中共预测1628个LPXTG蛋白,357转肽酶(sortase)。转肽酶和LPXTG蛋白在不同菌株中变化非常大(图4),LPXTG蛋白最多的是分离自牛奶中的Carnobacterium maltaromaticum DSM 20342菌。51株菌中共预测67个PCGs基因簇(图4),大部分菌株中只有一个PCGs(见补充分析)。L. casei/L. rhamnosus生态多样性分支中有大量菌毛有差异的菌株。一些菌株中,像L. equicursoris, W. confusa and L. parabuchneri (DSM 15352)仅通过菌毛种类区分各自的分支(图4c),具体原因目前无法解释。这项研究中发现50种新的PGCs,有望提供新的途径在益生菌和其他功能方面。


图4:不同的LPXTG蛋白编码基因、转肽酶、菌毛和细胞膜蛋白酶的丰度


    纵坐标表示基因或者基因簇的数,横坐标为菌株根据最大似然法的系统进化树的分布情况

5、CRISPR-Cas系统和可动的遗传因子

   CRISPR-Cas系统已经在真核和原核生物的基因工程和基因治疗中通过精确的目标区域操作得到应用。213株菌分析了62.9%基因组,其中137个CRISPR位点被鉴定。噬菌体序列和质粒序列分别检测了213株基因组的92%和41%。检测到的CRISPR序列能够与目标噬菌体序列和质粒序列匹配(图5),这与CRISPR-Cas适应系统来源于病毒序列是一致的。



    图5:比较分析CRISPR序列基于全部的Cas蛋白序列Cas1共线性分析之后构建lactobacilli菌和近缘生物进化树a;

进化树b基于Cas9的序列 共线性分析结果;通过Cas9关键序列预测的crRNA和tracrRNA序列结果

研究结论:

  从基因组水平首次揭示了乳杆菌属不同模式菌株间的系统发育关系,并指出乳杆菌属为一个并系类群,是由从一个特定的共同祖先不断进化分化而成,即兼性异型发酵乳杆菌为了适应环境逐渐分化形成严格同型和异型发酵乳杆菌,提出用于新种分类的新的基因组系统发育框架。通过比较基因组学分析,我们还发现乳杆菌属编码大量的碳水化合物水解酶和糖基转移酶,同时拥有丰富多样的CRISPR-CAS系统。在适应性进化过程中,伴随有蛋白水解系统获得、丢失的现象。

分享到:

微信扫一扫