我们和聂卫平聊了聊,关于那场比赛,关于 AlphaGo

知乎日报 优达学城(Udacity) 152℃ 评论

我们和聂卫平聊了聊,关于那场比赛,关于 AlphaGo

图片:《吴清源》

Udacity 专访聂卫平:昨天的棋局,我输得很冤

优达学城(Udacity),Keep Learning and Stay Udacious!

来自机构帐号优达学城(Udacity)


昨天,一位神秘高手 Master 刷了人类的屏——Ta 以 60 胜的战绩,在网络围棋对战中横扫包括柯洁、古力在内的中国顶尖围棋高手,甚至打败了“棋圣”聂卫平。昨晚,这位高手的神秘身份正式揭晓,它就是二代目的人工智能 AlphaGo!AI 再次在围棋上超过了人类,而且,这一次赢得更彻底,赢得让它的人类对手更绝望。

在昨天聂卫平出手迎战 Master 后,优达君第一时间联络上了聂老,希望听听这位代表着人类围棋最高水平的大师,如何看待他的人工智能对手?在他看来,这对于人类来说意味着什么?围棋会因此而消亡吗?

以下内容整理自优达学城(Udacity)对聂卫平的专访。请勿擅自转载,如需转载请留言联系。

您当时和 Master 过招后,就确定 Ta 是人工智能了吗?

聂老:对对对,肯定,先不说是不是 AlphaGo 吧。

您和 Master 下棋前觉得自己胜算有多少?

聂老:如果说是我跟它下的话,它发挥正常,我也发挥正常,我认为我是肯定要输给它的。但 Master 开始布局下的很差,我已经优势很大了。 我后来走到一个角,我是活棋,自个儿给走死了,一下死了二十多目。如果说那个棋我活了,基本上它应该是不行了。我出了毛病之后,确实怎么走都是稍差一点。后来我拼了一下,差距变大,一个劫打不过来又损失好多。当然如果我不出开始那个毛病的话,应该赢很多了。出了毛病之后,差距还是很小的,输赢还是很接近的。今天我输得真的很冤啊。

跟它下棋和跟人类下棋,最大的区别是什么呢?您如何评价 Master 的围棋水平?

聂老:它在后来下得相当的准确。我看得很少,今天看了有七、八盘棋。我认为只要它发挥得正常,那人是肯定下不过的。

当时在您看来,Master 和 AlphaGo 是一个 AI 吗?他们水平比较如何?

聂老:这个 Master 肯定是比去年的 AlphaGo 厉害。Master 要全面的多了。不过那个时候的 AlphaGo,我认为我们的职业棋手,和它下也是没机会的,差距很大。

这次 Master 赢了 60 把,您最大的感触是什么?

聂老:对我们围棋来说,有这个 AlphaGo 的存在,是一个很好的好事儿,对我们的提高,就一直有一把尺子在那边量着。虽然人下不过他,但是我们应该这么想,它也是人发明出来的。只不过发明了一个深度学习,没有深度学习它应该还是不行。它还在不停地进步,这个真的太可怕了。

您觉得以后人类的围棋高手,是不是都会去不断挑战 AI,学习一些他们的思路和套路?

聂老:当然是能够通过它,自己也能获得提高。但由于它进步的速度要比人类进步的速度要快得多,所以人类和它的差距会越来越大。

如果请您和机器学习科学家、工程师一起,用编程教会另一个 AI 来打败 Master,您会怎么来设计它的思路?

聂老:让我去设计电脑程序,我肯定不懂,我只能在围棋上说三道四。如果科学家不懂围棋,我可以去给他们普及一下。但是人工智能,我认为它主要靠自身的深度学习,不是科学家去学习。我的理解是,你把它程序设置好后,它自己去学就可以了,用不着人去怎么怎么样。开发出 AlphaGo 的团队,任何一个人出来,水平都是和我们这些职业棋手差很远。

优达小课堂 (对具体技术不感兴趣的小伙伴可以跳过)

机器学习 有很多种方式,常见的有监督式学习非监督式学习强化学习。AlphaGo 学习下围棋主要用到了其中的监督式学习和强化学习。

监督式学习的意思,是你在训练程序时要提供已由人工标记好的成对的资料,每一对都包括输入和预期的输出。通过对每一对资料的学习以及获得的反馈,程序要模拟出一个函数,并用这个函数来预测新的输入应该获得的输出结果。

强化学习和监督式学习类似的是,程序也是通过学习资料集时获得的反馈来学习,但是它获得的反馈不是及时的,不会针对每一对输入输出资料。在强化学习中,程序获得的反馈可能是在做出好几步决策后,由更整体的结果来产生的。

更具体来说,AlphaGo 的初级大脑的训练是监督学习,输入一个棋盘(还有一些其他根据棋盘计算的特征),它就能输出一个落子。使用 6~9 段的棋谱作为训练和测试,100 万步的训练,正确率能达到 54%。

高级大脑的训练是强化学习,用初级大脑的网络作为初始网络,和对手池中一个随机对手对弈,得到棋局,获得的反馈是最终的输赢,然后利用增强学习的算法来更新自己的算法,每 500 次迭代后把当前版本的算法加入到对手池中,不断和过去版本的自己对弈。
优达学城 (Udacity) 上有由 Google 首席研究科学家免费开讲的内容,感兴趣的人可以赶紧来学习,一起揭开 AlphaGo 的神秘面纱吧!

人工智能现在这么强,以后围棋初学者会不会都直接和 AI 老师学下棋?

聂老:如果 Google 能开发出来供所有人来学,有个机器人会教的话,那当然可以用来普及围棋,对于大家的提高会有很大的帮助。

您觉得为什么最近人工智能要一直在围棋上和人类较劲?

聂老:因为在更早的时候,三四十年前,也有人研究人工智能和人类棋手下棋的,那会儿 AI 和职业选手水平差得很远很远,所以给我们造成一种错觉,我们都以为我们这一代人根本看不到人工智能能和职业棋手来下比赛。好像是在前年,也有一些研究出来的人工智能,被职业选手让了五个、六个子,还是输给了职业棋手。

您对人工智能在围棋上打败人类还是挺乐观的,会不会担心 Master 的出现,会打击到一些我们的职业棋手的地位或者是自信呢?

聂老:没有,我们对此应该淡然处之。应该承认科学的伟大,这一点没有损伤我们职业棋手的尊严,地球照样转,明天太阳一样看,围棋也不会因为受到人工智能的影响而衰败。

您对人工智能技术以及它对人类未来的影响,有什么看法和预测?

聂老:我对人工智能是个门外汉,我只希望人工智能,无论怎么发展,它能被用于我们所谓的“正道”。比如说在治病救人、医疗上,比如为每个家庭增添各种各样福利上,但一旦用于去打仗、军事上,或者是让我们匪夷所思的事儿,那就不好了。

Udacity 一直在做前沿技术的教育,机器学习、深度学习、人工智能的知识都是我们重点关注的领域,如果有机会的的话,您会愿意去学习一些这方面的知识,可以更好地了解人工智能对手的思路吗?

聂老:那当然可以啊!如果我能了解深度学习的思路,那我的围棋水平说不定也能提高很多。深度学习技术,在我看来真的太恐怖了。我们的职业棋手都聪明得很,如果能教会他们一些原理,说不得也能举一反三呢。

采访及整理:一只浣;编辑:Yuhang / Josie
以上内容整理自优达学城(Udacity)对聂卫平的专访,著作权归优达学城所有。请勿擅自转载,如需转载请留言联系。

「知乎机构帐号」是机构用户专用的知乎帐号,与知乎社区内原有的个人帐号独立并行,其使用者为有正规资质的组织机构,包括但不限于科研院所、公益组织、政府机关、媒体、企业等。这不仅是知乎对机构的「身份认证」,更是涵盖了内容流通机制、帐号规范等全套帐号体系。和个人帐号一样,机构帐号开通不需要任何费用,同时也受社区规范的监督管理,并要遵守相关协议。目前机构帐号入驻采用邀请制。您可以通过  什么是「知乎机构帐号」 来了解更多机构帐号信息。 

转载请注明:微图摘 » 我们和聂卫平聊了聊,关于那场比赛,关于 AlphaGo

喜欢 (0)or分享 (0)
发表我的评论