广告
科学新闻
来自研究机构

整个基因组植物园

戴特:
1月24日,二千零一十九
来源:
GigaScience
总结:
一篇新的文章提供了基因组测序数据,用现有的基因组数据将植物物种数量增加了三倍。到目前为止,大约350个陆地植物基因组已经测序;本文提供了760个植物标本(689种)的多种数据类型。这包括图像,原始测序数据,组装的叶绿体基因组,以及初步的核基因组组合——都是免费提供的。实际上,这项工作是整个植物园的数字代表。
分享:
全文

为成像准备和编目的植物样品。另一种数字数据形式,可用作排序和采样数据的组成部分。
信用证:中国基因银行

今天在开放访问期刊上发表的一篇文章GigaScience提供数据,有效地将植物物种的数量增加三倍与可用的基因组数据。这项庞大的工作是在科学界越来越多的努力下进行的,科学家们希望对更多植物基因组进行测序,以帮助理解其复杂的进化过程,并为提高农业产量提供实用信息。到目前为止,大约有350个陆地植物基因组被测序。最近,随着10KP项目的宣布,对更多植物基因组序列的渴望得到了强调,其目的是最终对10000个植物基因组进行测序,以解决植物生命树所有主要分支的进化问题。这里的工作提供图像,原始测序数据,组装的叶绿体基因组,以及初步的核基因组组合——都是免费提供的。实际上,这项工作是整个植物园的数字代表。

中国基因库的研究人员,华大基因研究院,瑞丽林业局,中国已对761个样品进行了采样和测序。代表137科49目689种维管植物。这些植物样本都来自瑞丽500公顷的植物园。中国与缅甸接壤的亚热带地区。作为中国生物资源丰富的地区,该园致力于保护濒危植物和中国特有植物,包括保存和存档这些种质资源,以协助其长期保存。该项目是世界上第一个基于基因组和凭据标本信息对整个植物园进行数字化的科学和系统的尝试。

关于这一资源的科学潜力,华大基因首席执行官兼论文作者徐勋强调:“目前对植物进化及其在系统基因组背景下的多样性的理解是有限的,因为缺乏跨系统物种多样性的基因组尺度信息。这个创新的项目整合了所有植物物种数字化的一种新思维方式,以加强植物园的进化和生态研究。

总而言之,研究人员产生了54兆字节的序列数据,平均测序深度60X /种。除了对这些物种进行DNA测序的基本挑战外,另一个主要任务是扩大物种鉴定,数字化样本图像,并在深圳新的中国国家基因库(CNGB)植物标本室建立新的植物标本室。到目前为止,在761个样本中,序列和叶绿体数据已使257种植物的物种水平和504个家庭水平的鉴定。深度学习也成功地应用于181个物种,使它们能够被识别到物种级别。

作者杨婷说,这是“我处理过的最大数量的数据”。在数据分析过程中,I think the biggest challenges was sequence checking and results examination." This required researchers to individually check each of the 761 sample's sequencing data,并将叶绿体基因序列与标本进行比较,进行物种鉴定。

另一个困难是要简单地达到能够进行测序工作的程度需要收集所有的样本。作者Jinpu Wei表示:“我们与瑞丽林业局的专家合作,收集分布在瑞丽地区的植物材料,建立数字植物园。经过45天的劳累,我们收集了1093种植物材料。虽然对我们来说,正确运输材料是一个挑战,我们最终确保了这些植物材料的高质量,以备将来的研究。”

通讯作者:刘欣他补充说,该项目“是对抽样进行微调和标准化的基线项目,方法学,以及大规模基因组项目的数据积累和分析技术,如10千个植物基因组项目。从这个项目,我们为日后的样本收集工作积累了丰富而有用的经验,测序,和装配。同时,这项研究产生的数据可以有效地用于后续的基因组计划。”

尽管每个物种只建立了一个测序库,作者们能够为其中的17个装配初步的基因组,反映了DNA的质量和再利用潜力。香港中文大学(Chinese University of Hong Kong)的研究人员已经独立组装了他们特别感兴趣betway必威安卓的物种的基因组。更广泛的研究群体研究其感兴趣物种的潜力,改善其他基因组,开发工具和方法,为新一代科学家提供教育机会是巨大的。

该研究的第一作者刘欢补充说:“基因组鉴定将为植物基因组装配提供大量的基础数据,这将是10公里项目的良好开端。同时,为今后从宏观生态学和生物多样性到微观分子水平的相关机理研究奠定了良好的基础。

为了促进比提供序列数据更广泛的数据共享,研究人员还提供了数字化图像,并提供了进入标本室的途径。植物标本室(hcngb)是一个活的植物数据库,记录瑞丽植物园中生长的物种的位置,并监测每个物种的状态。

这里生成的所有数字数据(图像,原始测序数据,组装的叶绿体基因组,以及初步的核基因组装配)可通过NCBI SRA获得,GigaScienceGigaDB数据库和中国基因银行CNSA。此外,为了能够搜索数据和更新基因组和物种鉴定,元数据通过数据站点和GigaDB进行索引和链接。所有资源在CC0豁免下无限制释放。作者Sunil Kumar Sahu博士强调,这是该项目最重要的遗产,“该数据集对植物研究人员具有重要价值,更重要的是,可以作为未来行星规模基因组测序项目的参考,包括地球生物基因组计划(EBP)和10000植物基因组计划(10KP)。

故事来源:

资料提供者GigaScience.注意:内容可以根据样式和长度进行编辑。


日记帐引用

  1. 欢,金朴伟停,魏雪牧Bo Song陀,Yuan Fu王学兵郭海虎王胜丽洪成舟悦,萧丽晨洪云晨乐诚贵院,他Hechen Cai,咸楚彩王美,杨,苏尼尔Kumar Sahu金龙杨于王,Ranchang亩,杰,简明炤訾恒皇Xun Xu刘欣。一个植物园的分子数字化:瑞丽植物园689种维管植物的高深度全基因组测序.GigaScience,2019;多伊:10.1093/GigaScience/Giz007号

引用这一页

GigaScience。“一个完整的基因组植物园。”《科学日报》。betway必威安卓betway必威安卓科学日报,2019年1月24日。 .
GigaScience。(2019)1月24日)。一个完整的基因组植物园。 betway必威安卓.3月5日检索,2019来自www.sciebetway必威安卓ncedaily.com/releases/2019/01/190124193357.htm
GigaScience。“一个完整的基因组植物园。”《科学日报》。betway必威安卓www.betway必威安卓sciencedaily.com/releases/2019/01/190124193357.htm(3月5日访问)2019)。

相关故事

从网络周围

下面是你可能感兴趣的相关文章。betway必威安卓《科学日报》在 TrendMD网络从第三方广告商那里获得收入,显示的地方。