人工智能应对困境，能够正确趋利避害

发布者：张夕 2020-11-30 06:42

导读文/陈根选择分轻重，更分难易。简单选择只需根据目标做出判断，但对于两难选择来说，则是一种更复杂的思考和抉择。同时，两难选择，也是生活的必经之路，是生物所具有的本能。探究生物在两难选择里的大脑机制，将为

人/陈根

人工智能应对困境，能够正确趋利避害

选择轻重，比较难易。简单的选择只需要根据目标来判断，而对于困境，则是一种更复杂的思考和选择。同时，困境也是人生的必经之路，是生物的本能。在困境中探索生物学的大脑机制将为人工智能学习提供一种研究途径。

人工智能应对困境，能够正确趋利避害

近日，中科院自动化研究所大脑智能研究中心的研究人员提出了一种用于果蝇大脑自主决策的脉冲神经网络模型，可以实现趋利避害的行为。并在困境下迅速做出明确的选择。在无人机强化学习、反转学习和困难决策任务中得到了有效的验证。

人工智能应对困境，能够正确趋利避害

具体而言，果蝇有两条主要路径：经验线性选择和非经验非线性选择。当面对选择的任务时，果蝇针对不同的复杂性，自适应地选择合适的路径。

以前的研究已经教会果蝇喜欢绿色的T型，而蓝色的T型伴随着热刺激的惩罚。在选择阶段改变惩罚和视觉线索的组合，果蝇可以在绿色倒置T和蓝色阳性T之间进行选择，以测试果蝇在冲突视觉线索下的困境行为。

实验表明，在不同的颜色强度下，通过计算飞行过程中果蝇在每个图案前面的时间分布，了解果蝇的连续选择行为，得到一条“S”选择曲线。

通过单细胞测序发现，支持困境下非线性曲线的神经机制是负责多巴胺能神经元的“增益门控”决策机制-GABA神经元-蘑菇体环，这是一种基于价值的非线性选择途径。果蝇，其蘑菇体受损，只能容纳进行简单的感性选择，得到线性选择曲线。

在本研究中，基于果蝇简单知觉选择（线性途径)和价值选择(非线性途径）的神经机制，冲动神经网络构建多脑协同选择模型。其中线性通路模拟中心复合体的记忆功能，以作出快速选择。非线性通路模拟了DA-GABA-MB环的增益门控机制。

随后，将类似果蝇的脉冲神经网络模型应用于无人机选择任务，并使用小拳头模拟惩罚信号。无人机可以学习飞行到安全的视觉图形。而视觉图形中包含的线索具有趋利避害的行为。此外，无人机可以灵活地适应任务的反转，只有在4次错误选择后才能学习反向规则。

人工智能对人类智能的方法是其未来的趋势，不仅在设定目标（有限游戏）的问题上，而且在自我进化和模仿生物直觉的能力上，同时享受人工智能带来的便利。还有更多关于人与智力的关系。为机器而站立将成为人工智能时代不可避免的问题。

免责声明：本文章由会员“张夕”发布如果文章侵权，请联系我们处理，本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系

标签：