Google通过开源框架改进了AI模型培训
到目前为止,强化学习已被用于一些最令人印象深刻的AI演示,包括那些在Alpha Go和Dota 2击败人类职业游戏玩家的游戏。谷歌子公司DeepMind将其用于深度Q网络(DQN)。建立强化学习框架需要时间和重要资源。为了使AI充分发挥其潜力,它需要变得更容易获得。
从今天开始,Google正在开发基于TensorFlow的开源增强框架 - 它的机器学习库 - 可在GitHub上获得。
Google脑研究员Pablo Sa
谷歌正在帮助研究人员寻求通过开放一个用于自己项目的强化学习框架来培训人工智能模型。
到目前为止,强化学习已被用于一些最令人印象深刻的AI演示,包括那些在Alpha Go和Dota 2击败人类职业游戏玩家的游戏。谷歌子公司DeepMind将其用于深度Q网络(DQN)。
建立强化学习框架需要时间和重要资源。为了使AI充分发挥其潜力,它需要变得更容易获得。
从今天开始,Google正在开发基于TensorFlow的开源增强框架 - 它的机器学习库 - 可在GitHub上获得。
Google脑研究员Pablo Samuel Castro和Marc G. Bellemare在一篇博文中写道:
“灵感来自大脑奖励动机行为的主要组成部分之一,反映了神经科学与强化学习研究之间强烈的历史联系,该平台旨在实现能够推动激进发现的那种投机性研究。
此版本还包括一组协作,阐明如何使用我们的框架。“
Google的框架设计有三个重点:灵活性,稳定性和可重复性。
该公司为街机学习环境提供了15个代码示例 - 一个使用视频游戏评估AI技术性能的平台 - 以及四种不同的机器学习模型:C51,上述DQN,隐式分位网络和Rainbow代理。
强化学习是最有效的培训方法之一。如果你正在训练一只狗,提供治疗作为对所需行为的奖励是实践中积极强化的一个关键例子。
培训机器是一个类似的概念,只有奖励被提供或保留为零和零而不是美味的商品或薪水。
“我们的希望是,我们的框架的灵活性和易用性将使研究人员能够尝试新的思想,无论是渐进的还是激进的,”Bellemare和Castro写道。“我们已经积极地将它用于我们的研究,发现它使我们能够灵活地快速迭代许多想法。”
“我们很高兴看到更大的社区能够做到这一点。”
- 上一篇
DARPA引入了人工智能的第三次浪潮
五角大楼正在推出一种名为“AI Next”的新型人工智能推动器,旨在改善机器与人类之间的关系。 作为多年计划的一部分,美国国防高级研究计划局(DARPA)将在该计划中投入超过20亿美元。在该计划的宣传材料中,DARPA称AI Next将加速“第三次浪潮”,使机器能够适应不断变化的情况。 例如,自适应推理将使计算机算法能够基于对周围单词的分析来识别“主要”和“原则”的使用之间的差异,以帮助确定上下文。 DARPA
- 下一篇
AI可以通过眼球运动来确定您的个性
一个全球科学家团队发现人工智能可以通过分析他们的眼球运动来判断个人的人格特质。 今年早些时候,科学家们利用机器学习来发现眼球运动与人格特征之间的联系。有了这些信息,研究人员部署了AI来分析42名学生的眼球运动。结果于上周公布。 在心理学中,有五种基本的人格特质:外向性,宜人性,开放性,尽责性和神经质。 科学家们发现他们的AI能够找到学生眼睛和五个人格特质中的四个之间的相关性。开放性是它努力与眼球运动联系起来的唯一特质。 通过加强对个人的理解,研究人员希望他们的AI可以用来改善服务的个性化。 该项目的首席研