The Genome of Medicinal Plant Macleaya cordata Provides New Insights into Benzylisoquinoline Alkaloids Metabolism
药用植物博落回基因组为苄基异喹啉生物碱代谢研究提供新见解
摘要
动物养殖业与医学领域中抗生素的过度使用已对公共卫生构成一系列潜在威胁。博落回(Macleaya cordata)是罂粟科(Papaveraceae)药用植物,为畜禽用抗菌饲料添加剂的研发提供了安全资源。已知博落回的活性成分包括血根碱(sanguinarine, SAN)、白屈菜红碱(chelerythrine, CHE)等苄基异喹啉生物碱(benzylisoquinoline alkaloids, BIAs),但该非模式植物中此类生物碱的代谢通路尚未见系统研究。本研究首先通过 13C 标记酪氨酸饲喂实验,验证了博落回中 SAN 与 CHE 的主动生物合成过程。为深入解析其分子机制,我们完成了博落回全基因组从头测序,这是罂粟科植物的首个基因组测序研究。博落回基因组大小为 378 Mb,预测编码 22,328 个蛋白编码基因,转座元件占比 43.5%。作为基部真双子叶植物的代表,博落回基因组未经历几乎所有真双子叶植物均发生过的古六倍体化事件。基于基因组数据,我们鉴定获得了完整的 SAN 与 CHE 生物合成通路基因集(共 16 个基因),并验证了其中 14 个基因的生化功能。这些基因组与代谢组数据揭示了博落回中保守的 BIA 代谢通路,为通过作物遗传改良或微生物通路重构实现 SAN 与 CHE 的规模化生产奠定了理论基础。
引言
动物养殖业与医学领域中抗生素的过度使用已对公共卫生构成一系列潜在威胁(Aarestrup, 2000;Aarestrup, 2012)。为此,欧盟自 2006 年起禁止养殖户在动物饲料中添加抗生素生长促进剂(Gilchrist 等,2007;Phillips, 2007;Aarestrup, 2012)。取而代之的是,植物源性物质等天然生长促进剂(natural growth promoters, NGPs)被广泛开发作为畜禽生产中抗生素的替代物(Windisch 等,2008)。血根碱(sanguinarine, SAN)和白屈菜红碱(chelerythrine, CHE)因其显著的抗菌活性和动物生长促进作用,受到学术界和工业界的广泛关注(Chaturvedi 等,1997;Kosina 等,2004;Kosina 等,2010)。目前,含 SAN 的产品已在 70 个国家上市(Ikezawa 等,2009)。北美血根草(Sanguinaria canadensis)是美国中东部的本土植物,也是全球 SAN 生产的主要原料来源,但由于过度开采,该物种被美国植物保护协会列为 "受威胁物种"(Predny 和 Chamberlain, 2005)。尽管罂粟科的罂粟(Papaver somniferum)能够生物合成 SAN,但该植物同时会产生吗啡和可待因两种主要麻醉性镇痛药(Park 等,1999;Samanani 和 Facchini, 2001;Dang 等,2012;Hagel 和 Facchini, 2013;Beaudoin 和 Facchini, 2014)。由于阿片类药物存在成瘾性风险且可能引发政治争议,全球对罂粟的大规模种植实施了严格限制。因此,寻找可靠的 SAN 替代来源迫在眉睫。
博落回(Macleaya cordata,中文名 "博落回",补充图 1A)是罂粟科多年生草本植物,传统上被用作抗菌药物(Kosina 等,2010;Sai 等,2015),其功效与用法在唐代早期的植物学与药物学百科全书《本草拾遗》中已有详细记载。更重要的是,该植物能产生高含量的抗菌性苄基异喹啉生物碱(benzylisoquinoline alkaloids, BIAs),如 SAN、CHE、原阿片碱(protopine, PRO)和别隐品碱(allocryptopine, ALL)(Zeng 等,2013;Sai 等,2015),而吗啡、可待因等成瘾性 BIA 则完全不存在(补充图 1B)。因此,博落回是替代北美血根草作为 SAN 工业化生产商业原料的理想选择。该植物已被欧洲食品安全局(EFSA)批准为饲料添加剂生产用安全植物(Franz 等,2005)。然而,尽管博落回在中国、日本、俄罗斯、乌克兰等国均有分布(Xuan, 1993),但它目前仍是野生物种,尚未实现广泛栽培,这限制了其作为天然生长促进剂中 SAN 来源的进一步开发利用。
除了从植物中直接提取外,在微生物宿主中重构异源代谢通路作为植物天然产物可持续生产的策略,已引起学术界和工业界的关注(Paddon 等,2013;Narcross 等,2016;Nielsen 和 Keasling, 2016;Xiao 和 Zhong, 2016)。尽管包括 SAN 在内的多种重要 BIA 的完整生物合成通路已被阐明,且其在微生物宿主中的异源生产已得到证实,但产量通常仅为微克至毫克每升水平,无法达到工业化生产所需的浓度(>1 g/L)(Facchini 等,2012;Fossati 等,2014;Brown 等,2015;DeLoache 等,2015;Galanie 等,2015;Narcross 等,2016;Schlager 和 Drager, 2016)。
从不同植物物种中获取具有理想催化活性的新型生物合成酶或酶变体,有助于推动植物天然产物的代谢工程研究(Fossati 等,2014;DeLoache 等,2015;Galanie 等,2015;Trenchard 和 Smolke, 2015)。随着新技术的出现和测序成本的显著降低,基因组测序已成为研究未探索非模式生物植物代谢的基础且强大的工具(Zerikly 和 Challis, 2009;De Luca 等,2012;Chae 等,2014)。已测序的植物基因组将为发现植物中的生物合成酶和基因簇奠定基础(Itkin 等,2013;Nutzmann 和 Osbourn, 2014;Shang 等,2014;Boutanaev 等,2015)。
本研究完成了罂粟科植物的首个基因组测序,并采用同位素追踪、代谢物谱分析和同源克隆等整合策略,解析了博落回中 SAN 和 CHE 的生物合成通路。通过对通路中间产物和终产物的深入分析,揭示了该植物高效生产 SAN 和 CHE 过程中可能涉及的调控与转运机制。
结果
博落回中保守的 SAN 和 CHE 生物合成通路
SAN 和 CHE 的生物合成始于两种酪氨酸衍生物(多巴胺和 4 - 羟基苯乙醛)在去甲乌药碱合酶的催化下缩合生成去甲乌药碱(Ziegler 和 Facchini, 2008;Beaudoin 和 Facchini, 2014)。随后,通过一条共同通路从去甲乌药碱生成斯阔任碱(Facchini 和 De Luca, 1994;Pauli 和 Kutchan, 1998;Choi 等,2001;Ounaroon 等,2003;Winkler 等,2006;Lee 和 Facchini, 2010;Lee 和 Facchini, 2011;Dang 和 Facchini, 2012)。在 SAN 生物合成通路中,斯阔任碱经细胞色素 P450 酶(CFS)和斯阔任碱合酶(SPS)催化转化为 STYLOPINE;而在 CHE 通路中,斯阔任碱在(S)- 斯阔任碱 - 9-O - 甲基转移酶(SMT)和(S)- 加拿大麻苷合酶(TDC)的作用下生成四氢 Columbamine(Takeshita 等,1995;Ikezawa 等,2003;Ikezawa 等,2007;Diaz 等,2011)。随后,四种具有广泛底物特异性的酶(四氢原小檗碱顺式 - N - 甲基转移酶 [TNMT]、(S)- 顺式 - N - 甲基 STYLOPINE 14 - 羟化酶 [MSH]、原阿片碱 6 - 羟化酶 [P6H] 和二氢苯并菲啶氧化酶 [DBOX])共同参与 SAN 和 CHE 的生成(Liscombe 和 Facchini, 2007;Hagel 等,2012;Beaudoin 和 Facchini, 2013;Takemura 等,2013)。
为验证在其他罂粟科植物中发现的完整 SAN 和 CHE 生物合成通路是否在博落回中保守,我们采用液相色谱 - 质谱联用(LC/MS)技术进行靶向代谢物谱分析。所有中间化合物(Cp1 至 Cp32)通过化学合成、商业采购或植物分离获得(补充表 1),其结构经核磁共振(NMR)光谱验证(补充图 2-7)。将 13C6(苯环)标记的酪氨酸(Cp1)加入培养基后,利用这些标准品鉴定图 1 所示的植物体内代谢中间产物。LC/MS 分析结果显示,除 6 - 羟基原阿片碱(Cp16)和 6 - 羟基别隐品碱(Cp23)外(图 1 及补充图 8-10;补充表 2),其余所有中间产物均在博落回中检测到,这两种化合物分别可自发转化为二氢血根碱(Cp17)和二氢白屈菜红碱(Cp24)(Takemura 等,2013)。这些结果表明,SAN 和 CHE 生物合成通路在罂粟科中具有保守性。有趣的是,在酵母异源合成 SAN 过程中产生的两种不良副产物 ——N - 甲基斯阔任碱(Cp26)和 N - 甲基白屈菜红碱(Cp27)(Fossati 等,2014),首次在植物中被检测到(图 1 及补充图 11),其结构经 NMR 分析进一步验证(补充图 12-13)。这些结果提示,博落回中存在涉及 Cp26 和 Cp27 的代谢网络,而非线性代谢通路。
图 1 博落回中血根碱(SAN)与白屈菜红碱(CHE)的生物合成通路
化合物的 [苯环 -¹³C₆] 标记结构以蓝色标注,推测的旁路途径以橙色虚线箭头表示。
我们进一步分析了博落回不同组织的代谢物谱。在其他罂粟科植物中,根是 SAN 和 CHE 生物合成的主要组织(Hagel 等,2012;Lee 等,2013)。与之相反,博落回中 SAN 和 CHE 主要在蒴果中积累,表明该生物合成过程可能涉及蒴果特异性表达的酶或潜在转运蛋白(图 2A)。值得注意的是,SAN(Cp18)和 CHE(Cp25)的前体物质 —— 原阿片碱(PRO, Cp15)和别隐品碱(ALL, Cp22)的定量代谢物谱显示:二者在根中积累量最高,在叶、花和蒴果中呈中等水平积累(图 2A);而在茎组织中仅检测到微量的 PRO 和 ALL(图 2A)。其他中间产物也呈现类似的组织分布模式,尽管其丰度显著低于 PRO 和 ALL(补充图 14)。
图 2 代谢物分布与候选酶表达谱的相关性
(A) 博落回 5 种不同组织中终产物(血根碱、白屈菜红碱)及两种高积累中间产物(原阿片碱、别隐品碱)的绝对定量分析。数据以平均值 ± 标准差表示(n=4)。(B) 39 个候选酶的表达谱采用梯度颜色呈现。基因表达量(TPM)经 log₂标准化处理,表达模式通过 R 包(Pheatmap)绘制。最小值统一设为 - 5(对应原始值 0)。具有预期表达模式的基因(红色标注)被筛选用于后续功能验证。预测基因的具体表达数值见补充表 15。
博落回基因组从头测序与组装
为系统解析博落回中 SAN 和 CHE 生物合成的代谢机制,我们对其进行了全基因组从头测序。博落回为二倍体植物,染色体数目 2n=20,分为 10 对同源染色体(补充图 15)。通过 HiSeq 2000 测序平台(由诺禾致源提供)构建 6 个插入片段长度为 180 bp 至 10 kb 的基因组文库,共产生 256.5 Gb 的双末端序列(读长 100 bp),基因组覆盖度约 466.4×(补充表 3)。19-kmer 分析显示,博落回基因组大小约为 540.5 Mb,杂合率为 0.92%(补充图 16 及补充表 4)。最终组装结果包含 4551 个 scaffold,总长度 378 Mb,scaffold N50 和 contig N50 分别为 308 kb 和 25 kb(补充表 5)。最长 scaffold 长度为 5.6 Mb,1426 个长度大于 51.9 kb 的 scaffold 占组装基因组的 90%,并覆盖 95.4% 的注释基因。推测的 540.5 Mb 基因组中约 30% 未被组装,可能与博落回基因组中重复序列占比高(63.1%)相关。为验证组装序列的高覆盖度,将可用表达序列标签(EST)映射至组装基因组:利用 BLAT 软件(Kent, 2002)默认参数分析显示,组装序列包含 NCBI 数据库中 395 条博落回 EST 的 95%。采用 Trinity 软件(V2.1.0)默认参数,基于 22 个博落回样本的 RNA 测序(RNA-seq)数据进行从头全长转录本组装(Haas 等,2013);通过 BLAST(TBLASTN,e 值 = 1e-20)分析,22328 个注释基因模型中 89%(19890/22328)与全长转录本组装序列存在重叠(补充表 6)。基于 BUSCO 软件(V2)(Simão 等,2015)评估,组装序列中鉴定到 91.3%(1315/1440)的完整真核生物保守基因和 90.4%(388/429)的完整植物保守基因,表明最终组装基因组的编码区覆盖度较高。组装结果中未获得完整线粒体基因组:以莲(Nelumbo nucifera)线粒体基因组为参考(GenBank 登录号 KR610474),通过 blastp 分析(e 值 = 1e-5,覆盖度 > 0.5,一致性 > 0.5)鉴定到 32 个同源线粒体基因,但未发现所有基因均与线粒体基因同源的 scaffold,仅 3 个 scaffold 中超过 50% 的基因与线粒体基因同源。由于测序材料为博落回根组织,组装过程中已过滤叶绿体基因组:以莲叶绿体基因组为参考(GenBank 登录号 KM655836),通过 blastn 分析(e 值 = 1e-10,覆盖度 > 0.9)未发现与叶绿体基因组高度相似的 scaffold。
博落回基因组的转座元件与基因注释
结合同源预测与从头预测方法,鉴定到转座元件(TEs)占组装基因组的 43.5%(157.7 Mb)(补充表 7),低于 19-kmer 分析预测的 63.1%,提示未组装区域主要由重复序列构成。优势转座元件为长末端重复(LTR)逆转录转座子,占 104.8 Mb(占所有鉴定转座元件的 66.5%)。其中,Copia 类和 Gypsy 类元件(Suoniemi 等,1998)在拷贝数和基因组占比上相近(分别为 37.3 Mb 和 51.3 Mb;补充表 8)。约 70% 的 LTR 序列与已知重复序列无同源性,表明博落回基因组中的转座元件多为支系特异性。
采用三种基因预测方法(cDNA-EST 辅助预测、同源预测、从头预测),共预测到 22328 个蛋白编码基因,基因、外显子和内含子的平均长度分别为 3708 bp、237 bp 和 577 bp(补充表 9)。约 94.03% 的基因在 TrEMBL 蛋白数据库中存在同源序列(阈值 e 值 = 1e-5),78.61% 的基因可通过 InterPro 数据库进行功能分类,总计 94.54% 的基因具有已知同源序列或可被功能注释(补充表 10)。此外,基于 RNA-seq 数据,超过 88% 的基因在根、叶或果实中表达,表明博落回基因组的基因预测准确性较高。同时,在博落回基因组中鉴定到 1355 个非编码 RNA(ncRNA)基因,包括 216 个 rRNA、815 个 tRNA、75 个 microRNA 和 249 个小核 RNA 基因(补充表 11)。
基因家族进化分析
基于序列相似性比对,利用博落回及其他 11 种已测序被子植物的蛋白编码基因集鉴定推定直系同源基因簇(Li 等,2003)。以无油樟(Amborella trichopoda)为外类群,307143 个非冗余基因被划分为 33824 个直系同源基因簇(每个簇至少包含 2 个基因)。博落回的 19198 个基因分属 12933 个基因家族,平均每个家族含 1.5 个基因。其中,337 个家族为博落回特有,包含 1122 个基因(图 3A)。该分类结果显示,10302 个基因家族在真双子叶植物三大基部支系中均存在,很可能代表基部真双子叶植物的 “核心蛋白质组”。其中,33 个直系同源基因群(148 个基因)仅特异性存在于三大基部真双子叶植物(博落回、莲、耧斗菜 Aquilegia coerulea)中。对博落回中这三大基部真双子叶植物特有基因的基因本体(GO)注释分析,揭示了与基部真双子叶植物支系关键创新特征相关的直系同源基因群的起源。
图 3 博落回(M. cordata)基因组进化及基因家族分布
(A) 维恩图展示四个测序数据集间基因家族的特有与共有情况:基部真双子叶植物(绿色)、博落回(黄色)、核心真双子叶植物(紫色)和单子叶植物(粉色)。涉及的物种包括 2 种基部真双子叶植物(莲、博落回)、6 种核心真双子叶植物(拟南芥、毛果杨、大豆、葡萄、番茄、马铃薯)、2 种单子叶植物(水稻、高粱),并以无油樟作为外类群。(B) 包含主要谱系测序基因组代表的陆生植物系统发育关系。系统发育树中用星号标注陆生植物进化过程中推测的多倍化事件:紫色星号表示 γ 古六倍化事件的进化时间(百万年前);红色星号表示博落回进化过程中的全基因组加倍(WGD)事件;绿色星号表示其他多倍化事件。(C) 博落回、葡萄和莲的种内及种间基因组 4DTV(四倍简并位点颠换率)分布。博落回的谱系核苷酸替换速率显著慢于葡萄。
基因家族大小的变异是塑造不同物种适应性自然变异的重要机制(Guo, 2013)。不同谱系间基因家族的平均扩张与收缩程度存在差异(补充图 17)。在 33,797 个基因家族中,479 个基因家族的进化具有非随机性(P < 0.01),其中 131 个基因家族包含博落回的基因。在这 131 个快速进化的基因家族中,31 个在博落回的终端分支上发生了显著变化(P < 0.01),其中 28 个显著扩张,包含 1030 个基因。例如,DBOX 酶负责血根碱(SAN)合成的最后一步催化反应,该基因家族在博落回基因组中显著扩张(含 35 个 DBOX 基因),而在莲中为 9 个、蓝花耧斗菜中为 4 个、葡萄中为 1 个、拟南芥中为 10 个、水稻中为 5 个(补充图 18)。
多物种共线性与基因组进化
全基因组加倍(WGD)作为基因起源的重要原始素材来源,在陆生植物基因组中普遍存在(Van de Peer 等,2009)。约 1.25 亿年前发生的 γ 古六倍化事件,在几乎所有已测序的真双子叶植物基因组中均被检测到(Vanneste 等,2014)。作为基部真双子叶植物的博落回,其基因组分析显示该物种未经历 γ 事件(图 3B),这与另一种基部真双子叶植物莲的结果一致(Ming 等,2013),表明基部真双子叶植物可能未发生该古六倍化事件。葡萄与博落回的共线性区块分析发现,葡萄中的一个区域通常对应博落回中的两个区域,而博落回中的一个区域对应葡萄中的三个区域(补充表 12),暗示博落回可能经历了一次物种特异性的额外全基因组加倍事件。在该加倍事件中保留的 2344 个博落回基因中,1306 个(55.7%)为单拷贝基因,621 个(26.5%)为双拷贝基因,417 个(17.8%)包含三个以上同源基因(补充表 13)。旁系同源基因的同义替换率(Ks)和四倍简并位点颠换率(4DTV)分布也支持这一特异性全基因组加倍事件。
基于博落回与葡萄全基因组水平的 Ks 分布证据,博落回的谱系核苷酸替换速率显著慢于葡萄,且博落回与葡萄的分化时间早于仅影响葡萄的 γ 三倍化事件。两种基部真双子叶植物(博落回与莲)的 4DTV 和 Ks 分布特征相似,进一步表明博落回的物种特异性全基因组加倍事件发生于约 98±16 百万年前(图 3C 及补充图 19)。
博落回中血根碱(SAN)与白屈菜红碱(CHE)的生物合成机制
利用博落回基因组数据,结合转录组测序和 cDNA 克隆技术,我们搜索了 14 个先前报道的参与 SAN 和 CHE 生物合成的酶的直系同源基因,包括 9 个来自罂粟的酶(6-O - 甲基转移酶 [6OMT]、小檗碱桥酶 [BBE]、TNMT、SMT、CFS、细胞色素 P450 还原酶 [CPR]、MSH、P6H、DBOX)、3 个来自耧斗菜的酶(4-O - 甲基转移酶 [4OMT]、可待因 N - 甲基转移酶 [CNMT]、TDC),以及各 1 个来自蓟罂粟和花菱草的酶(SPS、N - 甲基可待因羟化酶 [NMCH])(Hagel 和 Facchini, 2013)。通过基于序列相似性的基因组搜索,共鉴定出 39 个候选基因,结合转录组数据进一步筛选后(图 2B),候选基因数量缩减至 16 个 —— 由于茎中未积累 SAN 和 CHE 的前体物质,在缺乏明确生物合成通量证据的情况下,首先排除了在茎组织中高表达的酶(图 2B)。实时荧光定量 PCR(qPCR)进一步验证了这些候选基因的表达模式(补充图 20)。为验证候选酶的功能,我们将每个 cDNA 在酿酒酵母中表达,并通过底物饲喂实验检测其催化能力;对于细胞色素 P450 酶,将候选 P450 基因与 CPR 基因(Mco19967)在酵母中共表达。最终,共验证了 14 个参与 SAN 和 CHE 生物合成步骤的催化酶,包括 McP6H(Mco11229、Mco11218)、Mc6OMT/Mc4OMT(Mco2833)、McCFS(Mco217)、McNMCH(Mco2661)、McTDC(Mco9485)、McCNMT(Mco769、Mco8567)、McTNMT(Mco833、Mco830)、McSMT(Mco9487)、McBBE(Mco20113)和 McDBOX(Mco6407、Mco06408)(补充图 21、22)。尽管未能阐明 McSPS 和 McMSH 的功能,但推测主要原因是其在酵母中的蛋白表达量较低 —— 类似问题在罂粟中 PsSPS 和 PsMSH 的功能验证中也出现过(Diaz 等,2011;Beaudoin 和 Facchini, 2013;Fossati 等,2014)。有趣的是,博落回基因组中未鉴定到参与吗啡和可待因分支合成途径的网状番荔枝碱差向异构酶的直系同源基因(Farrow 等,2015;Winzer 等,2015),这与博落回不合成成瘾性阿片类物质的观察结果一致。除 McP6H(Mco11229)可能比花菱草中的同源酶具有更高的催化活性外(图 4 及补充图 23),这些酶的催化能力与其他植物物种的同源酶基本相当。
图 4 不同植物物种来源 P6H 酶的催化能力比较
(A) 转入Mco11229(黑色)、Mco11218(紫色)、EcP6H(绿色)基因的酵母菌株及对照组(蓝色)产二氢血根碱的液质联用(LC/MS)图谱。实验所用酵母均饲喂浓度为 10 μM 的底物 Cp15。(B) 对 (A) 中产物目标化合物含量的绝对定量分析。数据以平均值 ± 标准差表示(n = 3)。(C) 转入Mco11229、Mco11218或EcP6H基因的酵母蛋白样品免疫印迹检测结果。肌动蛋白(Actin)作为内参蛋白,采用抗 MYC 标签抗体检测带 MYC 标签的 P6H 融合蛋白。实验独立重复三次,结果一致。
除分离鉴定血根碱(SAN)与白屈菜红碱(CHE)的生物合成酶外,同位素示踪实验结果还揭示了博落回(M. cordata)中二者完整的生物合成途径。有趣的是,本研究首次在植物体内证实了 Cp27 的存在 —— 尽管此前在工程酵母中曾检测到该化合物的推测存在(Fossati et al., 2014)。这一发现表明,植物中可能存在一条由 Cp27 介导、将 Cp11 转化为 Cp14 的旁路合成途径(图 5,红色区域)。与该假说相符的是,McTNMT/McCNMT 酶能够分别催化 Cp11 和 Cp12 发生甲基化反应,生成 Cp26 和 Cp27(图 5,红色区域;补充图 24C、24D),其功能与同源酶 PsTNMT 一致(Fossati et al., 2014)。遗憾的是,我们未能鉴定出可催化 Cp26 或 Cp27 生成 Cp14 的细胞色素 P450 酶。这条尚未完全验证的旁路途径,或可缓解因 TNMT 酶催化广谱性而产生的副产物问题。
对博落回提取物的精细分析还首次证实,植株体内存在去甲劳丹碱(Cp30)、6-O - 甲基去甲劳丹碱(Cp31)及去甲网状番荔枝碱(Cp32)三种化合物(补充图 25);同时鉴定到负责催化 Cp30 经两步连续甲基化生成 Cp32 的关键酶 ——Mc6OMT/Mc4OMT(编码基因Mco2833)(图 5,顶部虚线框;补充图 24A、24B)。该催化过程或可绕过苄基异喹啉类生物碱(BIA)骨架后续的羟基化反应步骤(Fossati et al., 2014)(补充图 24C、24D、25)。已有研究表明(Morishige et al., 2000;Inui et al., 2007),罂粟(Papaver somniferum)中完成这一催化过程需要两种不同的酶(Ps6OMT 与 Ps4OMT)协同作用。随后,Cp31 和 Cp32 可分别在 McCNMT 酶(编码基因Mco769、Mco8567)的催化下生成 3'- 羟基 - 甲基可待因(Cp9)和 (S)- 网状番荔枝碱(Cp10)(补充图 24E、24F)。上述结果表明,博落回中可能存在一条循环式的生物合成途径(图 5)。
图 5 博落回(M. cordata)中血根碱(SAN)与白屈菜红碱(CHE)的详细生物合成途径
图中以绿色、红色和紫色矩形标注博落回血根碱与白屈菜红碱生物合成研究的新发现:首次在植株提取物中检测到化合物 Cp27 及 Cp30–Cp32;参与成瘾性苄基异喹啉类生物碱(BIA)合成关键分支途径的 STORR/REPI 基因直系同源物,未在博落回基因组中被注释;催化活性更优的 McP6H 酶以橙色和蓝色标注。虚线箭头表示博落回中催化该反应的对应酶尚未被鉴定。
如前文所述,血根碱与白屈菜红碱主要在果荚中积累,而大部分前体物质则在除茎以外的植株各组织中合成(图 2A 及补充图 14)。与这一观测结果相符的是,负责催化合成最后一步反应的两个功能性 McDBOX 酶(编码基因Mco6407和Mco6408)在果荚中特异性表达(图 2B 及补充图 20)。与 McDBOX 酶不同,博落回中同时鉴定到根特异性表达和果荚特异性表达的 McP6H 酶(编码基因Mco11218和Mco11229)(图 2B 及补充图 20)。尽管在根组织中检测到 McP6H 的高表达,且其底物(Cp15 和 Cp22)含量丰富,但其催化产物(Cp16 和 Cp23)及其自发反应产物(Cp17 和 Cp24)并未在该组织中积累(图 2A 及补充图 14)。上述结果表明,植株中可能存在潜在的转运蛋白,可将 Cp17 和 Cp24 从根组织转运至果荚组织;在果荚中,这两种化合物经果荚特异性表达的 McDBOX 酶催化,分别生成血根碱与白屈菜红碱。这一潜在转运机制的阐明尚需未来开展更多研究。
讨论
生物的遗传蓝图编码于其基因组之中(Toriello, 2002)。因此,基因组挖掘已成为研究天然产物的强有力策略(Zerikly & Challis, 2009;De Luca et al., 2012;Chae et al., 2014),该策略尤其适用于非模式药用植物与真菌物种 —— 这类生物是高价值代谢物的丰富来源,但缺乏便捷的基础研究工具。例如,灵芝是首个完成基因组测序的药用物种,通过对其基因组的挖掘,鉴定出大量参与次生代谢及调控过程的候选基因(Chen et al., 2012)。
尽管近年来对多种罂粟科植物的深度转录组分析,以及病毒诱导的基因沉默技术的应用,已推动苄基异喹啉类生物碱代谢研究取得进展(Desgagne-Penix et al., 2010;Dang et al., 2012;Farrow et al., 2012;Winzer et al., 2012;Xiao et al., 2013),但此前尚未有任何一种罂粟科植物的基因组序列被公布。为填补这一空白,我们对富含血根碱与白屈菜红碱的药用植物博落回开展了从头基因组测序。借助多种互补工具,我们鉴定出参与血根碱与白屈菜红碱合成的全套代谢基因。最终从博落回中鉴定出 16 个参与血根碱与白屈菜红碱合成的代谢基因,并验证了其中 14 个基因的催化功能(图 5)。本研究鉴定的酶Mco11229,其催化活性优于花菱草(E. californica)来源的直系同源酶 EcP6H(图 4)。因此,该酶可用于重构微生物合成体系,以提高血根碱的产量。
除生物合成过程外,解析苄基异喹啉类生物碱的调控与转运机制,对于其代谢研究及利用合成生物学策略实现规模化生产也至关重要。有趣的是,博落回中的血根碱与白屈菜红碱似乎严格在果荚中完成合成,而其他前体物质则主要在植株全身合成。血根碱可能被植株用于抵御植食性动物,从而保护富含营养的种子(Schmeller et al., 1997)。由此推测,植株中可能存在一种特异性转运蛋白,可将血根碱高效且选择性地在果荚中积累,而避免其在其他组织中留存,以降低其固有的细胞毒性。博落回的全基因组测序数据,将为揭示这一转运过程背后未知的分子机制提供宝贵资源。
综上,对罂粟科植物博落回的基因组测序,为系统性研究这一非模式药用植物中血根碱与白屈菜红碱的生物合成、调控及转运机制打开了新的突破口。本研究获得的基因组、代谢组及生物化学层面的信息,可用于优化药用植物或微生物体系中血根碱与白屈菜红碱的生物合成产量。
方法
实验试剂
可待因(Cp7)、N - 甲基可待因(Cp8)、斯库莱林(Cp11)、N - 甲基刺罂粟碱(Cp14)及 N - 甲基加拿大麻碱(Cp21)的合成参照已报道方法进行(Sun 等,2013;Cheng 等,2014)。白屈菜红碱(Cp12)、N - 甲基斯库莱林(Cp26)及 N - 甲基白屈菜红碱(Cp27)均从博落回(M. cordata)中分离提取。其余中间体购自美国 Sigma-Aldrich 公司及其他商业供应商(补充表 1)。采用电喷雾电离质谱(ESI-MS)、氢核磁共振(¹H-NMR)及碳核磁共振(¹³C-NMR)技术验证上述化合物的结构(补充图 2-7、12、13)。甲醇与乙腈为质谱级试剂(购自中国 CNW 公司);同位素标记的 [苯环 -¹³C₆]- 酪氨酸购自美国 Sigma-Aldrich 公司;实验用水经 Milli-Q Integral 纯水系统(美国 Millipore 公司)纯化制备;甲酸为高效液相色谱(HPLC)级试剂(购自美国 Merck 公司);其余试剂均为分析纯。
植物材料与组织培养
本研究采集的多份野生博落回种质资源均来自中国各地,采集过程无需相关许可,所有材料均种植于湖南农业大学实验基地。其中,血根碱(SAN)与白屈菜红碱(CHE)含量最高的种质源自福建省(编号 FJ1,种子可按需索取;地理坐标:北纬 27°46′23.408″、东经 117°25′12.560″)。为降低该种质的杂合度、获得单倍二倍体基因组,并确保后续实验材料具有一致的遗传背景,以 FJ1 植株叶片为外植体开展组织培养,获得组培苗用于同位素示踪实验、代谢物分析、基因组测序、转录组测序(RNA-seq)、实时荧光定量 PCR(qRT-PCR)及基因克隆。
FJ1 植株叶片先用 70% 乙醇振荡处理 1 min,再浸入含 0.02% 吐温 20(v/v)的 1.0% 次氯酸钠溶液中表面灭菌 10 min;经无菌蒸馏水漂洗 5 次后,将叶片横向切成 1.0 cm 长的小段,接种于含 3.0% 蔗糖且不含植物生长调节剂(PGRs)的 MS(Murashige and Skoog)固体培养基上,诱导体细胞胚发生。培养 3 周后,挑选疏松、生长迅速的胚性愈伤组织,转接至相同培养基继代培养。为促进体细胞胚萌发,将愈伤组织在无植物生长调节剂的培养基上培养 2 周后,转移至含 MS 培养基的培养瓶中。待组培苗在该培养基上启动生长后,转入植物生长箱内的新鲜 MS 培养基继续培养,培养条件为 12 h 光照(光照强度 4500-9000 lx)。培养 60 d 后,将再生植株移栽至大田,生长 5 个月后达到成熟阶段。
博落回代谢物提取
采集种植于湖南农业大学实验基地的 1 年生 FJ1 植株新鲜根、叶、茎、花及果荚组织,液氮研磨成细粉,冷冻干燥后获得干燥粉末。取 50 mg 干燥粉末,加入 25 mL 甲醇,室温超声提取 30 min;提取液经 0.22 μm 滤膜(美国 Pall 公司)过滤后,采用液相色谱 - 三重四极杆质谱联用技术(LC/QQQ-MS)进行定量分析。
[苯环 -¹³C₆]- 酪氨酸同位素标记实验
将 FJ1 组培苗在 MS 培养基上培养 60 d(株高 10-12 cm),向培养瓶内的培养基中添加 4 mL 浓度为 0.4 mg/mL 的 [苯环 -¹³C₆]- 酪氨酸溶液,以未标记酪氨酸处理组为对照。将培养瓶(直径 4 cm、高度 15 cm)封口后,置于 26℃培养箱中,给予 2000 lx 持续光照(暖白色荧光灯)。培养 6 d 后收获植株,每个处理设置 3 个生物学重复(n=3 株),按前述方法提取代谢物。提取液经 0.22 μm 滤膜(美国 Pall 公司)过滤后,采用液相色谱 - 四极杆飞行时间质谱联用技术(LC/Q-TOF-MS)分析。在总离子流图中,通过在质子化分子离子峰质量数基础上增加 6.02013(即 [M+H+6.02013]⁺),提取各类 [苯环 -¹³C₆] 标记化合物的特征峰。通过对比标记化合物与非标记标准品的保留时间、质谱精确质量数及二级质谱指纹图谱,完成标记化合物的定性验证。本研究中同位素标记酪氨酸示踪实验及对照组的原始仪器数据与 mzML 格式数据均已上传至 MetaboLights 数据库(网址:http://www.ebi.ac.uk/metabolights/MTBLS435)。
博落回生物碱的分离提取
取 100 kg 新鲜博落回根组织(采自湖南农业大学实验基地),加入 95% 乙醇,按料液比 1:6 在 70℃条件下回流提取 2 次,每次 2 h。提取液合并后,悬浮于 150 L 盐酸溶液(分 3 次添加,每次 50 L,pH=3)中,静置 24 h;加入氢氧化钾调节溶液 pH 至 10,继续静置 24 h 后,经 500 目尼龙滤布过滤,获得 150 g 不溶性浸膏。将浸膏上硅胶柱色谱(硅胶规格 200-300 目,色谱柱尺寸 105 mm×1000 mm),采用二氯甲烷 - 甲醇混合溶液(体积比 10:1 至 5:1 梯度洗脱),收集得到 4 个洗脱组分。采用荧光硅胶薄层色谱法检测各组分,展开剂为二氯甲烷 - 甲醇(体积比 8:1),结合紫外灯显色分析。取组分 2(7.8 g)上硅胶柱色谱(硅胶规格 200-300 目),以二氯甲烷 - 甲醇(体积比 95:5)洗脱,得到 6 个亚组分(F2-1 至 F2-6);取亚组分 F2-3(2.1 g)进一步上硅胶柱色谱(硅胶规格 300-400 目),以石油醚 - 乙酸乙酯(体积比 5:1)洗脱,得到 4 个混合亚组分(F2-3-1 至 F2-3-4);对亚组分 F2-3-3(0.3 g)再次进行硅胶柱色谱纯化,获得化合物 Cp12(分子量m/z=326.1383,质量 22 mg)。取组分 3(2.4 g)采用制备型高效液相色谱纯化,色谱系统为安捷伦 1260 高效液相色谱仪,配备制备型反相色谱柱(美国安捷伦 ZORBAX SB-C18 柱,粒径 5 μm,规格 9.4 mm×250 mm)、自动进样器、快速分离二元泵、柱温箱及二极管阵列检测器;流动相为甲醇 - 0.1% 甲酸水溶液(体积比 60:40),流速 3 mL/min,收集保留时间 6.2 min 的洗脱峰,获得化合物 Cp26(分子量m/z=342.1698,质量 38 mg)。取组分 4(3.7 g)经制备型反相高效液相色谱分离,流动相为甲醇 - 0.1% 甲酸水溶液(体积比 40:60),得到 5 个亚组分(F4-1 至 F4-5);取亚组分 F4-2 进一步纯化,流动相更换为乙腈 - 0.1% 甲酸水溶液(体积比 30:70),收集保留时间 11.2 min 的洗脱峰,获得化合物 Cp27(分子量m/z=340.1540,质量 16.2 mg)。在整个提取分离过程中,均采用液相色谱 - 质谱联用技术(LC/MS)监测并鉴定目标生物碱。
合成与分离生物碱的结构鉴定
对从博落回中分离的生物碱及人工合成的生物碱,均采用液相色谱 - 质谱联用(LC/MS)、氢核磁共振(¹H-NMR)及碳核磁共振(¹³C-NMR)技术进行结构鉴定。核磁共振谱图在布鲁克 ACF-400 型核磁共振仪上测定(¹H-NMR 测试频率为 400 MHz,¹³C-NMR 测试频率为 100 MHz),以四甲基硅烷(TMS)为内标;液相色谱 - 质谱联用分析在安捷伦 1290-6530A 液相色谱 - 四极杆飞行时间质谱联用仪上完成。
液相色谱 - 四极杆飞行时间质谱联用(LC/Q-TOF-MS)分析
色谱分离在安捷伦 1290 超高效液相色谱仪上完成,色谱柱为艾杰尔 X-aqua C18 柱(粒径 5 μm,规格 2.1 mm×150 mm);流动相 A 为 0.1% 甲酸水溶液(v/v),流动相 B 为 0.1% 甲酸乙腈溶液(v/v);流速 0.3 mL/min,进样量 1 μL。梯度洗脱程序设置如下:0-1 min,流动相 B 比例由 5% 线性升至 10%;1-6 min,升至 30%;6-7 min,升至 38%;7-9 min,保持 38% 等度洗脱;9-15 min,升至 60%;15-25 min,升至 75%;25.1-30 min,保持 95% 等度洗脱;30.1-35 min,降至 5% 并保持等度洗脱。自动进样器温度为室温。超高效液相色谱仪与安捷伦 6530A 四极杆飞行时间质谱仪联用,采用正离子电离模式,全扫描范围m/z 100-1000。质谱喷雾参数设置如下:干燥气温度 350℃,干燥气流速 11 L/min,雾化器压力 32 psi,鞘气温度 350℃,鞘气流速 10 L/min,毛细管电压 4000 V,喷嘴电压 500 V,碎裂电压 135 V;其余参数根据仪器调谐结果优化。采用嘌呤(C₅H₄N₄,m/z=121.0508,购自安捷伦公司)与 HP-0921(C₁₈H₁₈O₆N₃P₃F₂₄,m/z=922.0097,购自安捷伦公司)进行质量校准。通过四极杆飞行时间质谱仪配套数据处理软件计算质子化分子离子 [M+H]⁺的单同位素质量数。依据保留时间、质子化分子离子 [M+H]⁺或自由基分子离子 [M]⁺的单同位素质量数(质量误差 < 5 ppm)进行生物碱定性;采用安捷伦 MassHunter Qualitative Analysis 软件(版本 B.05.00)处理液相色谱 - 四极杆飞行时间质谱数据;通过与标准品比对,进一步验证各中间体的结构。