最高精度“智能线虫”如何诞生?揭秘背后关键技术
智东西6月2日报道,在本周二开幕的2022北京智源大会上,智源研究院公布了一项面向类脑智能的重要进展:研发出当前已知生物精度最高的仿真秀丽线虫模型“天宝1.0”。它能像真实线虫一样,实现嗅探、蠕动等智能行为。
智源研究院院长黄铁军认为,面向2030新一代人工智能(AI)的主要技术路线有三条:一是信息智能,包括竞争已趋于白热化的深度学习及其发展的自监督学习;二是具身智能,通过强化学习在数字孪生或虚拟世界进行训练;三是类生智能,利用生物神经网络做出人工神经网络、神经系统甚至人工智能的生命。
面向难度更大的第三条路,智源研究院组建了生命模拟研究中心,并启动“天演”人工智能生命模拟工程。该工程的主要任务是搭建运行效率最高、模拟级别最精细、高精度生命模拟仿真软件系统,通过构建生命智能模型挖掘生物智能机制机理,启发和探索新一代人工智能。
天宝1.0便是这一工程的成果首秀。通过与智源研究院院长、北京大学教授黄铁军,智源生命模拟研究中心负责人、副主任马雷深入交流,智东西了解到这个处在神经科学与人工智能交叉领域的开创性研究工作的更多细节。
一、从模拟生物神经元,探索揭开智能的奥秘
神经科学领域已经认定了多种模式动物,这些动物在生物中有代表性,其身体及神经系统的构造相对便于通过各种科研仪器进行研究。
其中,秀丽线虫是当前生命研究最小的模式动物。它结构简单而功能完备:仅约1MM体长、302个神经元,却足以完成感知、逃逸、觅食、交配等一系列通用智能行为。近20年,有三次诺贝尔获奖的工作,均是围绕秀丽线虫实验展开。
自然界已经验证了生物神经网络的行之有效。生物神经元表征生物智能性,精细神经元具有的树突计算过程的非线性、高稀疏性,是现有简单神经元复杂深度网络难以表征的,所以神经元模拟的精细化程度越高,越能表征生物的智能水平。
2020年10月NATURE子刊发表的一篇论文曾论断:19个神经元控制了一辆自动驾驶汽车。如此推演,302个神经元,已经孕育有巨大的生物智能潜力。
另一篇去年8月在神经科学顶刊NEURON上发表的论文研究结果显示,大概5-8层深度神经网络才能模拟单个生物神经元所表征的计算复杂度。
生物脑的精细模拟,已是启发新一代AI的重要路径。随着科学家们对秀丽线虫神经系统研究地愈发透彻,实现秀丽线虫的精细模拟,有可能帮助我们去真正地揭开智能的奥秘。
通过采用多种离子通道模型、HODGKIN-HUXLEY模型和多舱室模型等数学模型,他们完成了秀丽线虫全部302个神经元及连接关系的精细建模,其神经元结构模拟采用多舱室模型,单神经元舱室最多2313个,神经元生理模拟支持14种离子通道。
团队对106个感知运动神经元组成的嗅觉和运动神经环路完成高精度建模,高精度还原了五类神经元(感觉神经元、中间神经元、指令神经元、头部运动神经元及身体运动神经元)电生理动力学。
据智源生命模拟研究中心负责人、副主任马雷介绍,在全球已知的各种研究科研进展中,“天宝1.0”是目前最高精度的线虫神经系统。
这条“智能虫”现已能做到像真实线虫一样,嗅探并控制身体蠕动至感兴趣的目标。
逼真的线虫身体建构和仿生环境也是天演线虫模型的一大特色。
天演团队认为,环境是智能的摇篮,环境变了,对应的生命体的结构、行为、智慧,复杂程度都大不一样。只有做到了极致的智能训练环境,才能进化出更高精度模拟的生命体。
因此,天演团队应用前沿图形建模和实时仿真技术,结合多种交叉学科的前沿技术,构成逼真的线虫肌肉和身体软体的模型,打造出高效可拓展、更适合大规模智能训练的线虫仿真环境,实现了仿真秀丽线虫与仿真环境的全闭环模拟。
一方面,通过高效的有限元建模,天演团队突破精神神经元系统与肌肉动力学结合的关键技术,构建了由具有解剖学意义的96块肌肉控制、3341个力学计算单元构成的秀丽线虫身体。
另一方面,团队构建了三维流体动态实时仿真环境,场景尺度达到线虫身长的1300倍。通过简化流体模型和投影动力学有限元结算等方法,其在CPU单核条件下单线虫仿真和可视化迭代时间快于0.1秒,并可支持线虫群体仿真。
这个环境框架包含三维建模、有限元求解、简化流体模型、强化学习、可视化等多个模块,能够最大程度上模拟线虫与环境的交互方式。
在这样的仿真环境中,团队通过计算神经电动力学信号传递过程,将仿真秀丽线虫训练得像真实线虫般,由高精度神经系统控制,并能与环境实时交互,最终可以实现动态蠕动前行等初级智能行为,表现出趋利避害的能力。
据介绍,这条“智能虫”能够高效、精准计算与流体环境相互作用的规律,并且所形成的流体仿真环境规模远超OPENWORM的方案,更适合作为智能体学习训练复杂任务的环境。
“智能虫”依托高精度模拟仿真软硬件平台天演1.0而诞生,这是一个在建的多GPU集群平台,未来该平台可用于高精度、大规模生物神经元的模拟,在众多科研领域和行业应用中发挥效用。
以高精准医疗为例,将HODGKIN-HUXLEY模型、亚细胞级别的各种离子通道模型,以及高精度虚拟心脏模型所需的关键计算三者部署在多GPU集群的天演平台上,有望解决推广和实现高精度虚拟心脏模型的应用问题。这将为心脏消融手术方案、心律失常治疗方案提供精准个性化模拟指导带来积极的影响。
综合来看,高精度生命模拟对推动脑科学与类脑智能研究、基于生命数字孪生的治疗诊断和药物研发等领域发展具有重要价值。
近年来,全球多家研究机构都在做精细化脑模拟与智能的相关研究,包括欧盟脑计划、欧盟脑计划支持下的BLUEBRAIN项目、美国脑计划等,谷歌、META等科技巨头亦在探索这一前沿方向。
黄铁军告诉智东西,生命科学、神经科学在生物神经网络的解析和实验数据获取方面,在过去十年进展特别快,生命模拟可用的基础数据越来越多,再加上更好的算力、算法等软硬件条件支撑,类脑智能相关研究得以在近些年快速发展。
“一旦类脑有了突破性进展,对人工智能发展的促进是根本性的。”他相信,所有生物神经网络都具备较为通用的生命智能,而传统所说的通用人工智能通常是与人类相比,要实现真正的通用人工智能,仍是一个长远目标。
这也是天演团队致力于探索的方向。天演团队希望通过模拟尽可能真实的生物大脑,重复实现智能的“自然选择”过程,通过不断提升模拟规模,创造出决策逻辑像人类、思考速度如光电的超级智能。
在黄铁军看来,以科学计算为基础的人工神经网络,仅解决了规模更大、更复杂的应用问题,并非通用人工智能的终极载体。从脑机理模拟的角度出发,探索生物脑内部的认知过程和范式,才是实现通用智能的根本途径。
天演团队的这项研究成果,代表精细神经元模拟实现通用人工智能的可行性路径迈出了重要一步。而这只是开始,下一步,天演线虫模型将逐步实现避障、觅食等更复杂的智能行为。
更长远的,天演团队将继续完善高精度生命模拟仿真平台,持续实现模式动物和重要生物器官的精细模拟,构建生命智能模型并挖掘生物智能机制机理,启发和探索新一代人工智能,从果蝇、斑马鱼、小鼠直至最高智慧的人类大脑。