返回   华枫论坛 > ◆ 工作学习◆ > IT交流




发表新主题 回复
 
只看楼主 主题工具
旧 Oct 18th, 2017, 23:49     #1
annarosa
Senior Member
级别:78 | 在线时长:6444小时 | 升级还需:113小时级别:78 | 在线时长:6444小时 | 升级还需:113小时级别:78 | 在线时长:6444小时 | 升级还需:113小时级别:78 | 在线时长:6444小时 | 升级还需:113小时级别:78 | 在线时长:6444小时 | 升级还需:113小时级别:78 | 在线时长:6444小时 | 升级还需:113小时
 
注册日期: Oct 2008
帖子: 21,028
积分:93
精华:31
annarosa has a reputation beyond reputeannarosa has a reputation beyond reputeannarosa has a reputation beyond reputeannarosa has a reputation beyond reputeannarosa has a reputation beyond reputeannarosa has a reputation beyond reputeannarosa has a reputation beyond reputeannarosa has a reputation beyond reputeannarosa has a reputation beyond reputeannarosa has a reputation beyond reputeannarosa has a reputation beyond repute
默认 最强“狗”3天走完人类千年棋史

日前,谷歌旗下的DeepMind团队公布了进化后的最强版AlphaGo ,代号AlphaGo Zero。

  新版本的AlphaGo究竟有多厉害?打败李世石的AlphaGo用了3000万盘比赛作为训练数据,AlphaGo Zero用了490万盘比赛数据。经过3天的训练,AlphaGo Zero就以100:0的比分完胜对阵李世石的那版AlphaGo。

  DeepMind联合创始人兼CEO 、AlphaGo之父戴密斯·哈萨比斯(Demis Hassabis)和AlphaGo团队负责人大卫·席尔瓦(Dave Sliver) 等人同时在官方博客上发表文章,详解最强版本阿尔法狗是如何炼成的,与前代有何不同。

  与学习大量人类棋谱起步的前代AlphaGo不同,AlphaGo Zero是从“婴儿般的白纸”开始,通过3天数百万盘自我对弈,走完了人类千年的围棋历史,并探索出了不少横空出世的招法。

  哈萨比斯等人专文:《AlphaGo Zero:从零开始》

  从语音识别、图像分类到基因和药物研究,人工智能发展迅速。这些专家系统,很多是借用海量人类经验和数据开发出来的。

  然而,在有些特定问题上,人类的知识要么过于昂贵,要么不靠谱,要么无法获得。因此,人工智能研究的一个长期目标就是跳过这一步,创造能在最有挑战性的领域,不用人类输入就达到超人水平的算法。我们发表在《自然》期刊上的最新论文,展示了实现该目标的关键一步。

  论文介绍了首个战胜人类围棋冠军的电脑程序AlphaGo的最新进化版本:AlphaGo Zero。AlphaGo Zero更为强大,可以一争史上最强围棋手。

  AlphaGo的前几代版本,一开始用上千盘人类业余和专业棋手的棋谱进行训练,学习如何下围棋。AlphaGo Zero则跳过了这个步骤,自我对弈学习下棋,完全从乱下开始。用这种方法,它很快超过了人类水平,对阵此前战胜人类冠军李世石的前代AlphaGo取得了100连胜。

  AlphaGo Zero之所以能当自己的老师,是用了一种叫强化学习的新模式。系统从一个对围棋一无所知的神经网络开始,将该神经网络和一个强力搜索算法结合,自我对弈。在对弈过程中,神经网络不断调整、升级,预测每一步落子和最终的胜利者。

  升级后的神经网络与搜索网络结合成一个更强的新版本AlphaGo Zero,如此往复循环。每过一轮,系统的表现就提高了一点点,自我对弈的质量也提高了一点点。神经网络越来越准确,AlphaGo Zero的版本也越来越强。

  这种技术比此前所有版本的AlphaGo都更为强大。这是因为,它不再受到人类知识的限制,而能够从婴儿般的白纸状态,直接向世界上最强大的棋手——AlphaGo本身学起。

  AlphaGo Zero相较前代还有几点明显的差别:

  首先,AlphaGo Zero仅用棋盘上的黑白子作为输入,而前代则包括了小部分人工设计的特征输入。

  其次,AlphaGo Zero仅用了单一的神经网络。在此前的版本中,AlphaGo用到了“策略网络”来选择下一步棋的走法,以及使用“价值网络”来预测每一步棋后的赢家。而在新的版本中,这两个神经网络合二为一,从而让它能得到更高效的训练和评估。

  第三,AlphaGo Zero并不使用快速、随机的走子方法。在此前的版本中,AlphaGo用的是快速走子方法,来预测哪个玩家会从当前的局面中赢得比赛。相反,新版本依靠的是其高质量的神经网络来评估下棋的局势。

  所有这些差异,都提高了系统的表现,使其更为普适。不过,是算法上的变化使得系统更为强大和高效。

  仅仅自我对弈3天后,AlphaGo Zero就以100:0完胜了此前击败世界冠军李世石的AlphaGo版本。自我对弈40天后,AlphaGo Zero变得更为强大,超过了此前击败当今第一人柯洁的“大师”版AlphaGo。

  通过数百万次自我对弈,AlphaGo从零开始掌握了围棋,在短短几天内就积累起了人类几千年才有的知识。AlphaGo Zero也发现了新的知识,发展出打破常规的策略和新招,与它在对战李世石和柯洁时创造的那些交相辉映,却又更胜一筹。

  这些创造性的时刻给了我们信心:人工智能会成为人类智慧的增强器,帮助我们解决人类正在面临的一些严峻挑战。

  尽管才刚刚发展起来,AlphaGo Zero已经走出了通向上述目标的关键一步。如果类似的技术可以应用在其他结构性问题,比如蛋白质折叠、减少能耗和寻找新材料上,就能创造出有益于社会的突破。

ZT
annarosa 当前离线  
回复时引用此帖
旧 Oct 18th, 2017, 23:54   只看该作者   #2
rasZX
Senior Member
级别:30 | 在线时长:1063小时 | 升级还需:22小时级别:30 | 在线时长:1063小时 | 升级还需:22小时
 
注册日期: Aug 2012
帖子: 8,012
声望: 21980394
rasZX has a reputation beyond reputerasZX has a reputation beyond reputerasZX has a reputation beyond reputerasZX has a reputation beyond reputerasZX has a reputation beyond reputerasZX has a reputation beyond reputerasZX has a reputation beyond reputerasZX has a reputation beyond reputerasZX has a reputation beyond reputerasZX has a reputation beyond reputerasZX has a reputation beyond repute
默认

引用:
作者: annarosa 查看帖子
日前,谷歌旗下的DeepMind团队公布了进化后的最强版AlphaGo ,代号AlphaGo Zero。

  新版本的AlphaGo究竟有多厉害?打败李世石的AlphaGo用了3000万盘比赛作为训练数据,AlphaGo Zero用了490万盘比赛数据。经过3天的训练,AlphaGo Zero...
以后没人学围棋了。
rasZX 当前离线  
回复时引用此帖
旧 Oct 20th, 2017, 15:23   只看该作者   #3
China_Soul
帅哥他爸
级别:50 | 在线时长:2756小时 | 升级还需:49小时级别:50 | 在线时长:2756小时 | 升级还需:49小时
 
China_Soul 的头像
 
注册日期: Jul 2004
住址: BC
帖子: 6,305
积分:63
精华:19
声望: 6806025
China_Soul has a reputation beyond reputeChina_Soul has a reputation beyond reputeChina_Soul has a reputation beyond reputeChina_Soul has a reputation beyond reputeChina_Soul has a reputation beyond reputeChina_Soul has a reputation beyond reputeChina_Soul has a reputation beyond reputeChina_Soul has a reputation beyond reputeChina_Soul has a reputation beyond reputeChina_Soul has a reputation beyond reputeChina_Soul has a reputation beyond repute
默认

引用:
作者: rasZX 查看帖子
以后没人学围棋了。
没人让你跟电脑下啊,计算器,字典发明这么多年了现在不一样有速算比赛,拼写比赛。

物有所不足,智有所不明
China_Soul 当前离线  
回复时引用此帖
旧 Nov 1st, 2017, 07:31   只看该作者   #4
googlebot
Senior Member
级别:68 | 在线时长:4973小时 | 升级还需:64小时级别:68 | 在线时长:4973小时 | 升级还需:64小时级别:68 | 在线时长:4973小时 | 升级还需:64小时级别:68 | 在线时长:4973小时 | 升级还需:64小时级别:68 | 在线时长:4973小时 | 升级还需:64小时级别:68 | 在线时长:4973小时 | 升级还需:64小时级别:68 | 在线时长:4973小时 | 升级还需:64小时级别:68 | 在线时长:4973小时 | 升级还需:64小时
 
注册日期: May 2006
帖子: 6,937
积分:4
精华:2
声望: 2095771
googlebot has a reputation beyond reputegooglebot has a reputation beyond reputegooglebot has a reputation beyond reputegooglebot has a reputation beyond reputegooglebot has a reputation beyond reputegooglebot has a reputation beyond reputegooglebot has a reputation beyond reputegooglebot has a reputation beyond reputegooglebot has a reputation beyond reputegooglebot has a reputation beyond reputegooglebot has a reputation beyond repute
默认

机器狗是利用规则漏洞,比赛规则是人和人比赛制定的,时间有限,对人很不利,

机器和人比赛,需要重新制定规则,比如一天一步棋,人类有充足时间来思考,人类肯定有机会胜利,
googlebot 当前离线  
回复时引用此帖
旧 Nov 5th, 2017, 01:26   只看该作者   #5
annarosa
Senior Member
级别:78 | 在线时长:6444小时 | 升级还需:113小时级别:78 | 在线时长:6444小时 | 升级还需:113小时级别:78 | 在线时长:6444小时 | 升级还需:113小时级别:78 | 在线时长:6444小时 | 升级还需:113小时级别:78 | 在线时长:6444小时 | 升级还需:113小时级别:78 | 在线时长:6444小时 | 升级还需:113小时
 
注册日期: Oct 2008
帖子: 21,028
积分:93
精华:31
声望: 26276170
annarosa has a reputation beyond reputeannarosa has a reputation beyond reputeannarosa has a reputation beyond reputeannarosa has a reputation beyond reputeannarosa has a reputation beyond reputeannarosa has a reputation beyond reputeannarosa has a reputation beyond reputeannarosa has a reputation beyond reputeannarosa has a reputation beyond reputeannarosa has a reputation beyond reputeannarosa has a reputation beyond repute
默认

引用:
作者: googlebot 查看帖子
机器狗是利用规则漏洞,比赛规则是人和人比赛制定的,时间有限,对人很不利,

机器和人比赛,需要重新制定规则,比如一天一步棋,人类有充足时间来思考,人类肯定有机会胜利,
有道理
annarosa 当前离线  
回复时引用此帖
发表新主题 回复

书签

主题工具

发帖规则
不可以发表新主题
不可以发表回复
不可以上传附件
不可以编辑自己的帖子

启用 BB 代码
论坛启用 表情符号
论坛启用 [IMG] 代码
论坛禁用 HTML 代码



所有时间均为格林尼治时间 -4。现在的时间是 22:15

请尊重文章原创者,转帖请注明来源及原作者。
凡是本站用户自行发布的任何信息,皆不代表本站的立场,
华枫网站不确保各类信息的正确性和可靠性,也不承担由此而导致的任何直接或间接损失以及任何法律责任。

Copyright © 1999-2017 Chinasmile