跨境派

跨境派

跨境派,专注跨境行业新闻资讯、跨境电商知识分享!

当前位置:首页 > 卖家故事 > 人工智能在量子、原子和连续统系统中的应用(一)

人工智能在量子、原子和连续统系统中的应用(一)

时间:2024-04-23 15:25:23 来源:网络cs 作者:胡椒 栏目:卖家故事 阅读:

标签: 系统  连续  原子  量子 
阅读本书更多章节>>>>

文章目录

1 介绍1.1科学领域1.2人工智能的技术领域综合多尺度分析符号

1 介绍

几十年的人工智能(AI)研究最终以深度学习的名义复兴了神经网络【勒昆等人1998】。自AlexNet【Krizhevsky等人2012】以来,十年的深入研究导致了深度学习的许多突破,例如,包括ResNet【何等人2016】,扩散和基于分数的模型【何等人2020;宋等2020】,注意力,transforms【瓦斯瓦尼等2017】,以及最近的大型语言模型(LLM)和ChatGPT【OpenAI 2023】等。
量子物理学家保罗·狄拉克(Paul Dirac)指出:“物理学的大部分和整个化学的数学理论所必需的基本物理定律因此是完全已知的,困难只是这些定律的精确应用导致方程太复杂而无法求解。”在量子物理学中,已知薛定谔方程提供了量子系统行为的精确描述,但由于其指数复杂性,求解这样的方程只可能用于非常小的系统。在流体力学中,纳维尔——斯托克斯方程描述了流体流动的时空动力学,但求解这些实际有用大小的方程要求很高,尤其是当还需要计算效率时。与这两个例子类似,许多自然科学问题的潜在物理学是已知的,可以用一组数学方程来描述。关键的难点在于如何准确有效地求解这些方程。最近的研究表明,深度学习方法可以加速这些方程解的计算。例如,深度学习方法已被用于计算量子物理学中薛定谔方程的解【Pfau et al.2020;Hermann et al.2020,2022】和流体力学中的纳维尔——斯托克斯方程【Kochkov et al.2021b;Brunton et al.2020】

除了提高效率,深度学习模型还表现出更好的分布外out-of-distribution (OOD) generalization,(OOD)泛化,范围扩展到更广泛的实际设置,其中训练和看不见的数据通常遵循不同的分布。在生物学等其他领域,潜在的生物物理过程还没有被完全理解,最终可能无法用数学方程来描述。在这些情况下,实验生成的数据可用于训练深度学习模型,以便对潜在的生物物理过程进行建模。例如,在生物学中,人工智能系统,如AlphaFold【Jumper et al.2021】、Rosetafold【Baek et al.2021】和ESMFold【Lin et al.2022a】,在实验获得的3D结构上进行训练,能够以与实验结果相当的精度计算预测蛋白质3D结构。除了技术挑战之外,这些领域的一个关键因素是大量实验数据的可用性。例如,AlphaFold、RosetaFold和ESMFold的成功高度依赖于使用实验生成并存储到数据库(如蛋白质数据库)中的大量蛋白质3D结构数据。

1.1科学领域

量子力学使用波函数在最小长度尺度上研究物理现象,波函数描述了量子系统的完整动力学。在量子物理学中,波函数是通过求解薛定谔方程获得的,这导致了指数级的复杂性。在这项工作中,我们提供了关于如何设计先进的深度学习方法来有效地学习神经波函数的技术综述。

密度泛函理论(DFT)和从头算量子化学方法是实践中广泛用于计算分子和材料的电子结构和物理性质的第一性原理方法。然而,这些方法在计算上仍然很昂贵,限制了它们在小系统(1,000个原子)中的使用。在这项工作中,我们对用于准确预测量子张量的深度学习方法进行了技术综述,量子张量反过来可用于推导许多其他物理和化学性质,包括分子和固体的电子、机械、光学、磁性和催化性质。我们还涉及密度泛函学习的机器学习方法。

小分子,也称为小分子,通常有几十到几百个原子,在许多化学和生物过程中起着重要的调节和信号作用。例如,90%的批准药物是小分子,它们可以与靶大分子(如蛋白质)相互作用,改变靶的活性或功能。近年来,在使用机器学习方法加速原子级小分子的科学发现方面取得了重大进展。在这项工作中,我们提出了关于小分子表征学习,分子生成,模拟和动力学的深入技术综述。

蛋白质是由一条或多条氨基酸链组成的大分子。人们普遍认为,氨基酸序列决定蛋白质结构,而蛋白质结构又决定其功能。蛋白质执行大多数生物功能,包括结构、催化、生殖、代谢和运输等作用。最近,机器学习方法导致了蛋白质结构预测的巨大进步【Jumper et al.2021Baek等人2021;林等2022a】。在这项工作中,我们提供了关于如何从蛋白质3D结构中学习表示,以及如何生成和设计新蛋白质的技术综述。

材料科学研究材料的加工、结构、性质和性能之间的关系。从原子尺度到微观尺度和连续尺度的材料的内在结构通过与外部刺激/环境的相互作用决定了它们的量子、电子、催化、机械、光学、磁性和其他性质。最近,已经开发了机器学习方法来预测晶体材料的性质和设计新的晶体结构。在这项工作中,我们提供了晶体材料的性能预测和结构生成的技术综述。

分子相互作用研究分子如何相互作用以执行许多物理和生物功能。机器学习的最新进展刺激了各种分子相互作用建模的复兴,如配体——受体和分子材料相互作用。在这项工作中,我们提出了对这些进展的深入和全面的审查。

连续介质力学使用偏微分方程(PDEs)在宏观水平上模拟在时间和空间中演化的物理过程,包括流体流动、热传递和电磁波等。然而,使用经典解算器求解偏微分方程有几个局限性,包括效率低、难以进行非分布推广和多分辨率分析。在这项工作中,我们提供了对最近用于代理建模的深度学习方法的评论,这些方法解决了这些限制。

1.2人工智能的技术领域

本文的总体分类结构。我们概述了本文中人工智能用于科学的领域,并总结了选定的问题、主要挑战和主要方法。
对称性:从许多科学问题中常见且反复出现的观察结果是,感兴趣的物体或系统通常包含几何结构。在许多情况下,这些几何结构意味着潜在物理学遵循的某些对称性。例如,在分子动力学中,分子在3D空间中被表示为图形,平移或旋转分子可能不会改变其属性。这里的对称性称为平移不变性或旋转不变性。形式上,对称性被定义为一种变换,当应用于感兴趣的对象时,使对象的某些属性保持不变(不变)或以确定的方式改变(等变)【Bronstein et al.2021】。对称性是非常强烈的归纳偏差,正如P.Anderson(1972)所说,“说物理学是对对称性的研究只是稍微夸大了一点。”[安德森1972]。因此,人工智能对科学的一个关键挑战是如何有效地整合人工智能模型中的对称性。我们使用对称性作为主要的共同线索来连接本文中的许多主题。图3还总结了每个区域所需的对称性。
可解释性:科学旨在理解物理世界的管理规则。因此,人工智能对科学的目标是(1)设计能够准确模拟物理世界的模型,以及(2)解释模型以验证或发现主导物理【E等人,2020】。因此,可解释性在人工智能中对科学至关重要。
分布外(OOD)泛化和因果关系:传统的机器学习方法假设训练和测试数据遵循相同的分布。实际上,训练数据和测试数据之间可能存在不同的分布变化,这就需要确定能够进行OOD概括的因果因素。OOD泛化在科学模拟中特别相关,因为这避免了为每个不同设置生成训练数据的需要。
基础和大型语言模型:当标记的训练数据不容易获得时,执行无监督或少量学习的能力变得很重要。最近,基础模型【Bommasani等人,2021年】已经证明了在自然语言处理任务上有希望的性能。通常,基础模型是在自我监督或一般监督下预先训练的大规模模型,允许以少量或零次方式执行广泛的下游任务。由于最近大型语言模型(LLM)的发展,如GPT-4,这种范式变得越来越流行。我们提供了我们对这种范式如何加速人工智能科学发现的观点。不确定性量化(UQ)研究如何在数据和模型不确定的情况下保证稳健的决策,是人工智能对科学的重要组成部分。应用数学、计算和信息科学的各个学科都研究了UQ,包括科学计算、统计建模以及最近的机器学习。我们在科学发现的背景下提供UQ的最新评论。
教育:人工智能促进科学是一个新兴和快速发展的研究领域,有许多有用的资源是物理或在线开发的。为了方便学习和教育,我们编制了我们认为有用的资源分类列表。我们还就社区如何更好地促进人工智能与科学和教育的整合提供了我们的观点。

综合多尺度分析

在这项调查中,我们在不同的层面进行分析,包括量子物理、密度泛函理论(DFT)、分子动力学(MD)和连续介质动力学。就近似的水平和它们所处理的尺度而言,存在显著的差异。具体来说,量子物理学通过求解多体相互作用系统的薛定谔方程来处理电子、质子和中子等粒子的行为和相互作用,以及它们的量子力学性质。量子物理学中的空间尺度通常是原子和亚原子级别,根据具体问题从皮米(10−12米)到纳米(10−9米)不等。DFT通过将多体相互作用系统映射到多体非相互作用系统来求解电子和离子的薛定谔方程,因此可以提供从埃(10−10米)到数百埃的真实材料如原子、分子和固体的电子结构的见解。MD模拟在更大的范围内运行,通常使用经验/半经验力场以及不断增长的机器学习力场,范围从纳米(109米)到微米(106米)。MD专注于原子和分子在各种热力学系综下随时间的运动和相互作用,允许研究动态行为、结构变化、动力学和热力学性质。
量子物理旨在求解多体相互作用系统的多体波函数和哈密顿量;DFT采用了一种替代方法,用于分子和材料的实际应用;MD模拟在更大的空间尺度和更长的时间尺度上运行,而不明确处理电子波函数的空间和旋量分量。为了解决更大的尺度并消除粒子的离散特性,偏微分方程(PDE)被用于研究从流体动力学中的微米(106米,如Kolmogorov微尺度)到气候动力学中的千米(103米)尺度的连续系统行为。我们在图3中比较了不同系统的空间和时间尺度。因此,这项工作的重点领域分为量子,原子和连续系统。理论水平的选择取决于感兴趣的现象和研究所需的计算复杂性。不同的分析可以相互受益,并导致综合分析。

符号

我们在这项工作中采用标准的数学符号。标量由小写字母表示,如a,而粗体小写字母,如a,用于表示向量。矩阵用大写字母表示,如A,它们的第i j项表示为 a i j a_{i j} aij​,第k列表示为 a k a_k ak​。元组或集合用书法大写字母表示,如。这些规则适用于所有符号,除了那些有特殊意义的符号,在这种情况下,我们使用它们的常规形式。例如,哈密顿矩阵用H表示,DFT中的系数矩阵用C表示,能量标量用E和V表示。我们提供了多个部分共享的通用符号的摘要,随后是各个方向的关键符号。

阅读本书更多章节>>>>

本文链接:https://www.kjpai.cn/gushi/2024-04-23/161529.html,文章来源:网络cs,作者:胡椒,版权归作者所有,如需转载请注明来源和作者,否则将追究法律责任!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

文章评论