成功教育

您现在的位置是:首页 > 课外资讯 > 科技前沿

科技前沿

Google通过开源框架改进了AI模型培训

2021-06-25 18:20:18科技前沿
谷歌正在帮助研究人员寻求通过开放一个用于自己项目的强化学习框架来培训人工智能模型。
到目前为止,强化学习已被用于一些最令人印象深刻的AI演示,包括那些在Alpha Go和Dota 2击败人类职业游戏玩家的游戏。谷歌子公司DeepMind将其用于深度Q网络(DQN)。建立强化学习框架需要时间和重要资源。为了使AI充分发挥其潜力,它需要变得更容易获得。
从今天开始,Google正在开发基于TensorFlow的开源增强框架 - 它的机器学习库 - 可在GitHub上获得。
Google脑研究员Pablo Sa

谷歌正在帮助研究人员寻求通过开放一个用于自己项目的强化学习框架来培训人工智能模型。

到目前为止,强化学习已被用于一些最令人印象深刻的AI演示,包括那些在Alpha Go和Dota 2击败人类职业游戏玩家的游戏。谷歌子公司DeepMind将其用于深度Q网络(DQN)。

HTTP://WWW.dfjb.net豪仕法律网网采集不好玩哦◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐撒旦法师打发斯蒂芬

建立强化学习框架需要时间和重要资源。为了使AI充分发挥其潜力,它需要变得更容易获得。

◐◐◐◐●☛█▼▲东方金报网███████东方金报http://www.dfjb.net▼▲▼▲▼▲▼▲▼●●●●●●●▼▲▼▲▼▲

从今天开始,Google正在开发基于TensorFlow的开源增强框架 - 它的机器学习库 - 可在GitHub上获得。

Google脑研究员Pablo Samuel Castro和Marc G. Bellemare在一篇博文中写道:

◐◐◐◐●☛█▼▲东方金报网███████东方金报网HTtp://www.dfjb.net▼▲▼▲▼▲▼▲▼●●●●●●●▼▲▼▲▼▲

“灵感来自大脑奖励动机行为的主要组成部分之一,反映了神经科学与强化学习研究之间强烈的历史联系,该平台旨在实现能够推动激进发现的那种投机性研究。

此版本还包括一组协作,阐明如何使用我们的框架。“

◐◐◐◐●☛█▼▲◐◐◐◐●☛█▼▲◐◐◐◐●☛█▼▲HTTP://WWW.dfjb.net███████████████████████████东方金报网

Google的框架设计有三个重点:灵活性,稳定性和可重复性。

该公司为街机学习环境提供了15个代码示例 - 一个使用视频游戏评估AI技术性能的平台 - 以及四种不同的机器学习模型:C51,上述DQN,隐式分位网络和Rainbow代理。

HTTP://WWW.dfjb.net豪仕法律网网采集不好玩哦◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐撒旦法师打发斯蒂芬

强化学习是最有效的培训方法之一。如果你正在训练一只狗,提供治疗作为对所需行为的奖励是实践中积极强化的一个关键例子。

◐◐◐◐●☛█▼▲东方金报网███████东方金报http://www.dfjb.net▼▲▼▲▼▲▼▲▼●●●●●●●▼▲▼▲▼▲

培训机器是一个类似的概念,只有奖励被提供或保留为零和零而不是美味的商品或薪水。

“我们的希望是,我们的框架的灵活性和易用性将使研究人员能够尝试新的思想,无论是渐进的还是激进的,”Bellemare和Castro写道。“我们已经积极地将它用于我们的研究,发现它使我们能够灵活地快速迭代许多想法。”

◐◐◐◐●☛█▼▲东方金报网███████东方金报http://www.dfjb.net▼▲▼▲▼▲▼▲▼●●●●●●●▼▲▼▲▼▲

“我们很高兴看到更大的社区能够做到这一点。”

文章评论