英国《自然》杂志24日发表一项人工智能研究成果:美国团队报告了一类增强学习,可回溯过去、解决复杂任务,真正改善了对复杂环境的探索方式,有望应用于机器人、语言理解和药物设计领域。这类算法被统称为“Go-Explore”,其已经在一款经典游戏的算法挑战中得分超过了人类玩家和先进的人工智能系统。该成果被认为正朝着实现真正“智能学习体”迈出了重要一步。
增强学习,可让人工智能系统通过探索和理解复杂环境来进行决策,并学习如何以最优的方式获得奖励。奖励可以包括机器人抵达特定位置或是在电脑游戏中达到一定的等级。然而,当遇到很少给予反馈的复杂环境时,现阶段的加强学习算法就很容易碰壁,这让人工智能专家们非常苦恼。
美国“OpenAI”是由诸多硅谷巨头联合建立的人工智能非营利组织,推动者包括美国创业孵化器Y Combinator总裁萨姆·阿尔特曼、美国太空技术探索公司(SpaceX)创始人埃隆·马斯克等,其目标是希望能够预防人工智能的灾难性影响,并推动人工智能发挥积极作用。此次,“OpenAI”的科学家艾德兰·艾克菲特、朱斯特·赫伊津哈及团队,提出了有效探索面临的两个主要障碍,并设计了一类算法来解决这些障碍。
研究人员表示,“Go-Explore”可以对环境进行全面探索,同时构建一个档案库来记住它去过的地方,确保自己不会忘记通往有望成功的期中阶段或是最终胜利(奖励)的路线。其在雅达利经典游戏中的得分,超过了人类玩家和先进的人工智能系统,研究人员用这类算法,解决了之前未能解决的2600个雅达利游戏,验证了这类算法的潜力。“Go-Explore”在算法挑战《蒙特祖马的复仇》中的得分是之前的4倍,在另一个算法挑战《玛雅人的冒险》中的得分也超过了人类玩家的平均水平。而相对的,此前的算法一分都拿不到。
“Go-Explore”算法还能完成一个模拟机器人任务,在这项任务中,它必须用机械臂把东西捡起来并放到4个架子中的一个架子上,其中两个架子被关在两扇门的后面。
研究人员指出,记住并回到有望成功的探索区域的简单原则是一种强大、通用的探索方法。他们认为最新的算法有望应用于机器人、语言理解和药物设计。(记者张梦然)
2月23日上午消息,在今日开幕的MWC上海上,工信部副部长刘烈宏发表主题演讲。刘烈宏透露,目前中国已建成开通71.8万个5G基站,约占全球70%。SA独立组网覆盖全国所有地市。中国5G用户已超2亿,上市218款5G手机,其中售价2000元以上的中高端手机占比90%。最后他提出了5G发展的三个倡议,一是构建产业生态,加强产业链上下游合... [阅读]
工业和信息化部近日印发通知,支持创建北京、天津(滨海新区)、杭州、广州、成都国家人工智能创新应用先导区(下称“先导区”)。这是继上海(浦东新区)、深圳、济南-青岛3个先导区后,工业和信息化部发布的第二批先导区名单。至此,全国人工智能先导区已增至8个。 上海新兴信息通信技术应用研究院首席专家兼副院长贺仁龙接受第一财... [阅读]
2021年2月19日,工业和信息化部印发通知,支持创建北京、天津(滨海新区)、杭州、广州、成都国家人工智能创新应用先导区。这是继上海(浦东新区)、深圳、济南-青岛3个先导区后,工业和信息化部发布的第二批先导区名单。至此,全国人工智能创新应用先导区已增至8个。 工业和信息化部在发文中强调,北京国家人工智能创新应用先导区要结合北京... [阅读]
如果独居老人室内摔倒,谁会第一个发现?可能是家里的Wifi信号。 无线通信信号干扰一直是技术专家希望解决的问题,然而,这种干扰也是人与物互联的一种方式。能不能通过Wifi信号的变化捕捉并分析出危险情况,向看护人发出警告呢? “85后”教授伍楷舜把信号干扰这一问题变成了解决问题的方法。他带领研究团队... [阅读]
2024-11-22
2024-11-19
2024-11-18
2024-11-15
2024-11-11
2024-11-22
2024-11-19
2024-11-18
2024-11-15
2024-11-11