军事呆板人毕竟找到最适用的演练模子

导读导读美国陆军希望将多域作战理念引入下一代作战车辆。 多域作战是美国陆军未来重要的作战理念,它要求装备学习组件的自动化代理能够与作战人员协同作战。techxplore.com

导读:美利坚合众国陆军蓄意将多域兴办观念引入下一代兴办车辆。 多域兴办(MDO)是美利坚合众国陆军将来要害的兴办观念,它诉讼要求装置进修组件的自动化代劳(如大陆呆板人)不妨与兴办职员共同兴办。techxplore.com网站本地功夫12月29日报道,美利坚合众国陆军接洽职员在新名目中贬低了现行反革命...

军事呆板人毕竟找到最适用的演练模子

美利坚合众国陆军蓄意将多域兴办观念引入下一代兴办车辆。

多域兴办(MDO)是美利坚合众国陆军将来要害的兴办观念,它诉讼要求装置进修组件的自动化“代劳”(如大陆呆板人)不妨与兴办职员共同兴办。techxplore.com网站本地功夫12月29日报道,美利坚合众国陆军接洽职员在新名目中贬低了现行反革命演练加强进修(reinforcement learning)策略的不行猜测性,使它们更实用于大陆呆板人。美利坚合众国陆军兴办本领振奋司令部(DEVCOM)的接洽职员Alec Koppel博士说:“这些进修组件将让呆板人完备推理本领,不妨符合贯穿变革的疆场前提。新机制由以加强进修为基础的策略产生。灵验获得这些策略对实行MDO的运转观念至关要害。加强进修中的策略梯度本领是贯串空间可扩充算法的基矗但是,现有本领无法调整更一致的计划目的,如妨害敏锐性、安定牵制等。”

加强进修对保守模子爆发了极大报复,由于它不妨实行很多搀杂工作,比方下围棋、下国际象棋等。但是,一致性试验对应的样品数是一个天文数字。如许搀杂的样品汇合,使很多罕见的演练机制不实用于下一代兴办车辆(NGCV)的MDO。为了激动MDO和NGCV的加强进修,演练机制必需在贯串空间中普及样品真实性。

Koppel共青团和少先队安排的新计划减少了赞叹积聚的振荡性,爆发了对未知范围的灵验探究,并产生了调整汗青体味的机制。“该接洽扩充了加强进修中的典范梯度定理。”Koppel表明,“这种革新对美利坚合众国陆军有深刻感化,由于它使加强进修目的超过了规范积聚汇报。值得提防的是,对于大地呆板人而言,数据获得的本钱很高。减少振荡性积聚、保证对未知范围的灵验探究以及体味调整,都对规则优化有要害意旨。”

Koppel表白,这项接洽的将来特出光彩。他说:“我达观地觉得,具备加强进修功效的呆板人将来不妨在疆场上扶助兵士实行勘查测量、观察和风险评价工作。”

科界原创

编写翻译:雷鑫宇

审阅稿件:西莫

责任编辑:陈之涵

根源:美利坚合众国陆军接洽试验室

原文链接:

https://techxplore.com/news/2020-12-army-effective-robots.html

版权证明:本文由科界平台原创编写翻译,华文实质仅供参考,十足实质以英文原版为准。转载请证明根源科学技术处事者之家科界App。

免责声明:本文章由会员“马悦华”发布如果文章侵权,请联系我们处理,本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系