数据中心 频道

新方向 使用机器学习来寻找能源材料!

  【IT168 资讯】随着科技的发展,世界将需要更多的能量。各个地方的政府和企业都正在投入数十亿美元的技术来收获,转换和储存电力。随着硅太阳能电池接近其性能极限,研究人员正在寻找基于钙钛矿和量子点的替代品。对于储存能量的电池的要求是必须更便宜、更高效、更持久。而且器件需要用安全和丰富的材料制造,如铜,镍和碳,而不是铅,铂或金。材料的生命周期分析需要显示出改善的碳足迹,以及与全球能源挑战的规模相匹配的能力。

新方向 使用机器学习来寻找能源材料!
 在东京世博会上展出的太阳能组件

  大量的实验数据正在产生这些材料的特性。例如,美国国家标准与技术研究院拥有65个数据库,其中一些数据库的测量数量高达67,500个。此外,自2010年以来,光是有关电池和太阳能电池的科学论文就发表了170多万篇。

  将材料的结构与其功能相联系在一起是需要加速的。搜索空间很大,许多材料仍然是经验性地发现的:候选人一次制作和测试几个样本。在这个过程中,搜索受到人类的偏见影响。研究人员经常关注他们认为有趣的元素的一些组合。

  目前,正在开发一些计算方法,然后自动生成结构并评估其电子特征和其他属性。例如,材料项目正在使用超级计算机来预测所有已知材料的特性。目前它列出了70多万种材料的预测属性,但将这些数据转化为工业和商业应用的巨大潜力还远远没有实现。

  机器学习的经过训练以找到数据集中的模式的算法,可以大大加速能源材料的发现。它已经被用来预测量子模拟的结果,以识别流动电池,有机发光二极管,有机光伏电池和二氧化碳转化催化剂的潜在分子和材料。这些算法可以在几分钟内预测结果,而运行模拟所需的时间则为数百小时。

  然而挑战依然存在。编码材料没有通用的表示形式,不同的应用需要不同的性质,如元素组成、晶体结构和导电性。精心策划的材料实验数据很少,假设的计算测试依赖于假设和模型,这些假设和模型在实验条件下可能是不够现实的。

  机器学习和能源科学界应该进一步合作,他们必须了解彼此的能力和需求。我们提供了以下建议,这些建议是在马萨诸塞州波士顿5月份由加拿大高级研究院运作的研讨会中提出的。

  分享有意义的数据。材料科学家应该将他们的数据组织成标准化的、机器可读的形式,例如电子表格应用程序中常用的“逗号分隔值”文件。目前,研究结果往往被压缩成图表和表格,每个小组的数据组织方式不同,测试条件和实验设置也不尽相同。许多团队处理他们的原始光谱或正常化他们的数据和模型在没有实验证据的情况下往往容易出现错误和偏见以校准结果。

  政府资助机构和出版商应该要求数据上传到可公开访问的数据库,如材料项目、材料数据管理系统或Citrination平台。联盟和大学可以分担维护这些数据库的成本。另外,可以建立一个独立的实体来维护一个实验数据库,就像Protein Data Bank中目前共享的蛋白质晶体结构一样。包含负面消极的结果很重要,因为机器学习算法需要能够区分符合性能指标的材料和不符合性能指标的材料。

新方向 使用机器学习来寻找能源材料!
将二氧化碳转化为可再生燃料的纳米金催化剂的尖端

  材料科学界也需要鼓励共享文化。计算机科学和医学界正在通过为机器学习提供大量的数据集而获得巨大的收益。例如,马萨诸塞州剑桥的IBM Watson Health正在使用机器学习来改善药物发现和癌症治疗。

  刺激与竞争的合作。“大挑战”奖是促进创新的一种成本效益的方式。例如,XPRIZE计划已经在碳捕获和利用、海洋发现和人工智能方面取得突破。Kaggle平台利用竞争来解决计算机模型和数据科学问题提供解决方案,例如预测药物样分子的活性。在加利福尼亚州旧金山的AngelHack等公司运营的赞助黑客游戏已经为包括万事达卡在内的公司开发了应用程序。

  我们建议建立机器学习竞赛,以鼓励在公开可用的数据集(如材料基因组计划、欧洲新型材料发现实验室(NOMAD)倡议或Citrination)中找到新能源材料。目标将是预测特定应用程序或属性的材料。例如,纳米孔隙度是碳捕获材料的关键,电子波段之间的差距是太阳能电池的重要描述符,硬度可用于开发轻质复合材料的运输,机器学习可以同时考虑多个属性。

  比赛可以由大学部门或商业支持的机构赞助,比如加拿大的多伦多人工智能矢量研究所和蒙特利尔学习算法学院,或者美国的丰田研究机构。他们甚至可以采取与在线蛋白质折叠游戏Foldit类似的形式,在这种游戏中,人们既可以获得发现的荣耀,也可以打败别人的分数。而知识产权可以按照与XPRIZE类似的方式进行管理。

  开发共享语言。化学家、计算机科学家、机器学习专家、材料工程师、程序员和物理学家都有自己的专业领域和术语。例如,材料工程师擅长制作各种成分的材料,机器学习研究人员需要了解这些细微之处,才能预测实际使用的材料。

  我们建议大学举办研讨会和暑期学校,并制定跨越这些领域的课程。一些暑期学校已经为计算机科学应用教授常规的计算化学和机器学习。应该建立更多的论坛来进行培训,比如加利福尼亚州洛杉矶的纯应用和应用数学研究所运行的“理解机器学习的多粒子系统”。

  加速和自动化。作为一个快速发展的研究领域,能源材料的发现是高级机器学习技术的完美测试平台。机器学习倾向于假设一个固定的训练集。例如,用于自治汽车的机器人被训练成驾驶使用道路的图像或视频。但是这可能会很慢,结果很难在用户之间重复或变化。相比之下,随着新的信息和模型的出现,能源材料的数据格局不断变化。这里有用的是深度强化学习的不断增长的领域,在这个领域里,代理们探索他们不断发展变化的环境以找到最好的解决方案。将这样的算法应用到材料发现中会使搜索的效率逐步提高,并使学习者像化学家一样探索分子的空间。

新方向 使用机器学习来寻找能源材料!

  下一步的计划是什么

  开发机器学习方法是Mission Innovation全球合作运行的清洁能源材料创新挑战的主要目标之一。 合作由政府自愿承诺提供资金的,而各国必须履行其对必要投资的承诺。

  总之,世界各地的人工智能和机器人驱动的材料研究需要更多的投资。更多的数据必须提供给编程机器人的人。而实验家、机器人专家和算法设计人员应该进行更多沟通和协作,以促进快速故障排除。

  寻找世界所需的新能源的时间已经不多了!

0
相关文章