数据中心 频道

Chainer 发布:DL也可以很懂生物和化学

  【IT168 资讯】最近发布了一款Chainer Chemistry,Chainer 扩展来训练和运行神经网络,用于一些生物学和化学的任务。

Chainer 发布:DL也可以很懂生物和化学

  ·Github页面:https://github.com/pfnet-research/chainer-chemistry

  ·文档:https://chainer-chemistry.readthedocs.io

  以上的页面可以帮助您轻松地在分子结构上进行深度学习。

  例如,您可以将机器学习应用于毒性分级任务或HOMO(最高占用分子轨道)级别的回归任务。

  该库是在PFN 2017夏季实习期间开发的,它的一部分已由京都大学的实习生秋田弘高实施。

  支持的功能

  Graph卷积神经网络(作用于图的卷积神经网络)的实现

  最近提出的图形卷积网络打开了从“图形结构”输入进入应用深度学习的大门,图形卷积网络目前是一个活跃的研究领域。我们实现了几个图形卷积网络体系结构,包括今年的论文中介绍的网络。

  以下模型已经被实现:

  NFP:基于神经网络的指纹识别

  GGNN:Gated-Graph神经网络

  WeaveNet:分子图形卷积(Molecular Graph Convolutions )

  SchNet:连续滤波卷积神经网络(continuous-filter convolutional Neural Network )

  常见的数据预处理/研究数据集支持

  各种数据集可以与这个库的通用接口一起使用。此外,一些研究数据集可以自动下载和预处理。

  支持以下数据集:

  ·QM9 [7,8]:具有多达9个C / O / N / F原子的有机分子结构的数据集及其计算的物理属性值。这些值包括HOMO / LUMO水层级和内部能量。计算是量子化学的B3LYP / 6-31G级。

  ·Tox21 [9]:12个生物目标的毒性测量数据集

  可用的训练/推理示例代码:

  我们提供训练模型和推理的示例代码。您可以轻松地在这个库中尝试训练/推理这个模型,以便快速启动。

  ·https://github.com/pfnet-research/chainer-chemistry/tree/master/examples

  背景

  分子行为的模拟在发现新的药物领域是很重要的。当我们需要对量子效应进行高精度的计算时,DFT(密度泛函理论)被广泛使用。然而,它需要大量的计算资源,特别是大分子。在许多分子结构上应用模拟是困难的。

  机器学习领域有一个不同的方法:学习在以前的实验中测量/计算过的数据,然后预测未经分析的分子的化学性质。神经网络可以比量子模拟更快地计算出预测结果。

Chainer 发布:DL也可以很懂生物和化学

  一个重要的问题是如何处理化合物的输入/输出以便应用深度学习。主要问题是所有分子结构都有不同数量的原子,表现为不同的图形结构,而传统的深度学习方法是处理固定大小/结构化的输入。

  然而,“图形卷积神经网络”被提出来处理输入的图形结构。

  什么是图形卷积神经网络?

  卷积神经网络引入了“卷积”层,其将内核应用于图像中的局部信息。它在许多图像任务中显示出结果,包括分类、检测、分割、甚至图像生成任务。

  图形卷积神经网络引入了一个“图卷积”操作,在图上的相邻节点之间应用一个核函数来处理图形结构。

Chainer 发布:DL也可以很懂生物和化学

  CNN是处理一个图像作为输入,而基于图形的CNN则可以处理图形结构(分子结构等)作为输入。

  其应用不限于分子结构。 “图形结构”可以出现在社会网络、交通等诸多领域,图形卷积神经网络应用的研究是一个有趣的课题。例如,在图像上应用图形卷积,在知识库上应用,将其应用于交通预测上。

  目标用户

  ·深度学习研究人员

  该库提供最新的图形卷积神经网络实现

  图形卷积应用不限于生物和化学,而是应用于各种领域。我们希望很多人使用这个库。

  ·材料/药物发现研究人员

  该库使用户能够建立自己的模型来预测分子的各种化学性质。

  将来的计划

  这个库还是一个测试版本,并且正在积极开发中。可能会支持以下功能:

  ·为推理提供预先训练的模型

  ·添加更多的数据集

  ·实施更多的网络

0
相关文章