广告
科学新闻
来自研究机构

一个完整的基因组植物园

戴特:
1月24日,二千零一十九
来源:
千兆科学
总结:
一篇新的文章提供了基因组测序数据,用现有的基因组数据将植物物种数量增加了三倍。到目前为止,大约有350个陆地植物基因组被测序;本文提供了760个植物标本(689种)的多种数据类型。这包括图像,原始序列数据,组装的叶绿体基因组,以及初步的核基因组组合——都是免费提供的。实际上,这项工作是整个植物园的数字代表。
分享:
全文

为成像准备和编目的植物样品。另一种数字数据形式,可用作排序和采样数据的组成部分。
信用证:中国基因银行

今天在开放访问期刊上发表的一篇文章千兆科学提供数据,有效地将植物物种的数量增加三倍与可用的基因组数据。这项巨大的工作是在科学界不断努力的基础上进行的,以排序更多的植物基因组,以帮助理解其复杂的进化过程,并为提高农业产量提供实用信息。到目前为止,大约有350个陆地植物基因组被测序。随着10千年计划的宣布,对更多植物基因组序列的渴望最近得到了强调。其目的是最终对10000个植物基因组进行测序,以解决植物生命树所有主要分支的进化问题。这里的工作提供图像,原始序列数据,组装的叶绿体基因组,以及初步的核基因组组合——都是免费提供的。实际上,这项工作是整个植物园的数字代表。

中国基因库的研究人员,BGI瑞丽林业局,中国已对761个样品进行了采样和测序。代表137科49目689种维管植物。这些植物样本都来自瑞丽500公顷的植物园。中国的一个亚热带地区,与缅甸接壤。在中国生物资源丰富的地区,该园致力于保护濒危植物和中国特有植物,包括保存和归档这些种质资源,以协助其长期保存。这个项目是世界上第一个科学和系统的尝试,以基因组和代金券样本信息为基础,数字化整个植物园。

关于这种资源的科学潜力,华大基因首席执行官兼论文作者徐勋强调:“目前对植物进化及其在系统基因组背景下的多样性的理解是有限的,因为缺乏跨系统物种多样性的基因组尺度信息。这一创新项目整合了一种新的思考方式,即对所有植物物种进行数字化,以加强植物园的进化和生态研究。”

总而言之,研究人员产生了54兆字节的序列数据,平均测序深度为每种60倍。除了对这些物种进行DNA测序的基本挑战外,另一个主要任务是扩大物种鉴定,数字化样本图像,并在深圳新的中国国家基因库(CNGB)植物标本室建立新的植物标本室。到目前为止,在761个样本中,序列和叶绿体数据已使257种植物的物种水平和504个家庭水平的鉴定。深度学习也成功地应用于181个物种,使它们能够被鉴定到物种水平。

作者TingYang说这是“我处理过的最大数量的数据”。在数据分析过程中,我认为最大的挑战是序列检查和结果检查,“这要求研究人员分别检查761个样本的序列数据,并将叶绿体基因序列与标本进行比较,进行物种鉴定。

另一个困难与简单到能够做测序工作有关,那就是收集所有的样本。作者金普卫说:“我们与瑞丽林业局的专家合作,收集瑞丽地区分布的植物材料,建立数字植物园。经过45天的劳累,我们收集了1093种植物材料。虽然我们很难正确运输这些材料,我们最终确保了这些植物材料的高质量,以备将来的研究。”

通讯作者:刘欣补充说,该项目“是一个基线项目,用于微调和标准化采样,方法学,以及大规模基因组项目的数据积累和分析技术,如10千个植物基因组项目。从这个项目,我们在随后的样品采集方面积累了大量有用的经验,测序,和装配。同时,这项研究产生的数据可以有效地用于后续的基因组计划。”

尽管每个物种只建立了一个测序库,作者们能够为其中的17个装配初步的基因组,反映了DNA的质量和再利用潜力。香港中文大学的研究人员已经独立组装了他们感兴趣的物种的基因组。betway必威安卓更广泛的研究群体研究其感兴趣物种的潜力,改善其他基因组,开发工具和方法,为新一代科学家提供教育机会是巨大的。

主要作者刘欢补充道:“基因组特征将为植物基因组组装提供大量的基础数据,这将是10公里项目的良好开端。同时,为今后从宏观生态学和生物多样性到微观分子水平的相关机理研究奠定了良好的基础。

为了促进比提供序列数据更广泛的数据共享,研究人员还提供了数字化图像,并提供了进入标本室的途径。植物标本室(hcngb)是一个活的植物数据库,记录瑞丽植物园中生长的物种的位置,并监测每个物种的状态。

所有在此生成的数字数据(图像,原始序列数据,组装的叶绿体基因组,以及初步的核基因组装配)可通过NCBI SRA获得,千兆科学GigaDB数据库和中国国家基因库CNSA。此外,为了能够搜索数据和更新基因组和物种鉴定,元数据通过数据站点和GigaDB进行索引和链接。所有资源在CC0豁免下无限制释放。作者Sunil Kumar Sahu博士强调,这是该项目最重要的遗产,“该数据集对植物研究人员具有重要价值,更重要的是,可作为未来行星尺度基因组测序项目的参考,包括地球生物基因组项目(EBP)和10000植物基因组项目(10KP)。

故事来源:

资料提供者千兆科学.注意:内容可以根据样式和长度进行编辑。


日记帐引用

  1. 宦柳金朴伟婷洋魏雪牧Bo Song庹洋Yuan Fu王学兵郭海虎王胜丽洪成舟岳昌萧丽晨洪云晨乐诚薛飞鹤何晨彩咸楚彩梅望杨丽苏尼尔·库马尔·萨胡,金龙洋王羽冉昌牧刘婕简明炤訾恒皇Xun Xu刘欣。植物园的分子数字化:瑞丽植物园689种维管植物的高深度全基因组测序.千兆科学,2019;多伊:10.1093/GigaScience/Giz007号

引用这一页

GigaScience。“一个完整的基因组植物园。”《科学日报》。betway必威安卓betway必威安卓科学日报,2019年1月24日。 .
GigaScience。(2019)1月24日)。一个完整的基因组植物园。 betway必威安卓.1月28日检索,2019来自www.sciebetway必威安卓ncedaily.com/releases/2019/01/190124193357.htm
GigaScience。“一个完整的基因组植物园。”《科学日报》。betway必威安卓www.betway必威安卓sciencedaily.com/releases/2019/01/190124193357.htm(1月28日访问)2019)。

相关故事

从网络周围

以下是您可能感兴趣的相关文章。betway必威安卓《科学日报》与 趋势网络从第三方广告商那里获得收入,如有指示。