美国能源部实验室的研究者利用大数据算法研究植物和微生物关键性状表达的相互作用,以改善生物燃料的生产,该研究成果发表在《能源研究前沿》。这项工作中使用的算法首次打破超级计算的亿亿级(exascale,10的16次方)障碍,有望在世界范围内使用。
生物质顽固性(即植物对降解或解构的抵抗力)是一种复杂的多基因控制的性状,对生物燃料的生产非常重要。为了更好地理解参与顽固性的分子的相互作用并识别参与木质素生物合成/降解的靶基因, 研究者分析了来自800多种不同杨树基因型的基因组数据、代谢组学数据以及热解-分子束质谱数据。研究者开发了一个“证据线”(LOEs)评分系统来整合不同层次的信息,并量化连接基因和目标功能的LOEs的数量。应用评分系统可以产生涉及木质素生物合成的新的候选基因假设。由此产生的全基因组关联研究网络被证明是一种确定多效性(影响多种表型的基因)、综合性(多个基因共同作用以影响单一表型)与细胞功能相关的关系的有效方法。
研究中使用的协同进化网络由CoMet软件中的算法创建。CoMet软件后来被移植到新的Summit超级计算机上。这是目前世界上最快、最智能的超级计算机。研究团队使用CoMet软件打破了亿亿级的障碍,实现了比任何先前报道的科学应用更大的运算量。科学家可以利用这种方法分析大量的数据集,以探究细胞如何工作的,再利用这些信息将有益性状转化到植物和微生物中。这种计算也预示着系统生物学的新时代。
信息来源:武汉文献情报中心https://mp.weixin.qq.com/s/FsHL79_jWYcPzCu1sgF_WQ
武汉文献情报中心https://mp.weixin.qq.com/s/NrfTehxdp2o1lsZ_UO9soQ