42%的胜率,并不是说还有四成赢的机会,而是在对手不犯错误的情况下,必输的意思。
alphago真的要输了?而且还是执白输?
要知道,在deepmind内部的测评中,在黑棋贴7.5目的现代规则中,相当于没开始下,黑棋就已经损失了一块地盘,白棋的胜率显著高于黑棋。
机器对弈下,alphago持白棋战胜自己的胜率超过55%。
其实这几年人类围棋界也有相同的看法,尤其在古杰异军突起后。
古杰去年执白全年只输过一盘,白棋胜率百分之九十七,而他执黑棋的胜率一下子就跌到了百分之六十。
而现在,阿法狗在执白的情况下,居然要输了?
而且还是在没有出现bug的情况下输掉了?
赢不了了。
当黑棋第125手的飞再次分割了白棋之后,就连只有业余四段实力的哈萨比斯也看出来,整盘棋面上,白棋的劣势已经非常明显。
而到了白棋第146手之后,阿法狗的自评胜率已经跌到了12%以内。
但阿法狗仍旧还在竭力抵抗,但谁都能看的出来,没有什么希望了。
它的对手太强大了!
怎么可能!?
怎么可能有这样的棋手?
哈萨比斯完全无法理解。
手持白棋不停落子的黄世杰同样也无法理解。
他是业余六段,阿法狗的实际开发人,没有人比他更理解阿法狗的棋力,哪怕面对的是李世实这样的顶尖棋手,他也能自信的说,他对ai思路的理解比李世实更准确。
但现在,黄世杰完全看不懂对手的棋路,也不敢说自己能够看得懂阿法狗的思路。
哪怕到了几十手之后,他都仍旧看不懂双方为什么会这么下。只知道莫名其妙的,黑棋似乎就占据上风了。
为什么下的很多招式是自己之前从未见过的?
对面的,真的是一个人类吗?
不,哪怕是ai,也一样是要用人类棋谱进行学习的,招数并没有真正的脱离人类的思考范畴,只是把人类的招数探索到了极致而已。
但现在在这个对手,所使用的招数,无论从布局,还是局部定式,完全和人类既有套路不一样。
除非……对方真的是个ai,并且从未学过任何人类的招数,只凭自我对弈,自我学习,自我推理,掌握了这个游戏!
黄世杰被自己的想法吓了一大跳。
如果他的猜测是真的,那就意味着,对方不止是在训练上走在了deepmind前面,在算法上,更是把deepmind远远甩在了后面!
此前他们也曾经设想过让alphago完全自我对弈来掌握围棋,但效果非常糟糕。
在实验中,他们发现,alphago所用的策略梯度算法在平衡探索新策略与利用已知策略之间存在严重的不稳定性,导致ai无法从整局优势的角度上去考虑胜负优势。
而且,围棋的胜负信号噪音太强了,如果没有初期的既有知识引导,会导致模型在初期训练阶段无法有效学习。
除此之外,还需要解决神经网络的“灾难性遗忘”问题和没有初始策略下的大量随即走子的问题。
可以说,这里面任何一个问题,可能都需要大量的人力物力和极为聪明的大脑来花费几个月的时间进行解决。
尤其是“灾难性遗忘”,这种学了新知识就忘了旧知识的现象在深度学习领域非常常见,可以说,整个深度学习领域迄今都没有找到太好的办法应对各种原因所造成的灾难性遗忘。
最终,alphago团队仍旧只能用人类棋谱训练alphago,当其成长到一定程度后,再让其自我对弈,迭代进化。
而现在这个对手……
但愿他是一个人类吧。
黄世杰虽然不需要考虑棋盘上的复杂变化,但额头上仍旧渗出了一层汗珠。
——
“嗨,各位,脸色怎么这么差?”谢尔盖布林和拉里佩奇刚刚赶回监控室,就看到deepmind每一个人都脸色铁青,沉默不语的盯着桌子上并排摆放的十几台显示器。
“白棋很危险啊,看来对方马上就要投了。”谢尔盖布林也会下围棋,而且水平还可以,有业余一二段的水平,一眼就看出白棋很危险。
“嗨,高兴一点,你们创造了历史!伙计们,三比零打败了李世实,这不是人类的失败,而是人类的另一场胜利!”谢尔盖布林用力拍了拍离得最近的大卫席尔瓦的肩膀。
他这话一说,大卫席尔瓦的脸色就更难看了。
监控室中更是一片安静。
“谢尔盖,alphago……是白棋。”哈萨比斯艰难的挤出一句话。
阿法狗是白棋?谢尔盖布林不由得愕然,仔细看了一眼屏幕,果然,阿法狗今天持白。
“是被对手找到了bug吗?”拉里佩奇不懂围棋,但他同样很清楚阿法狗的强大,在此前的模拟对弈中,除非被对手找到了bug,否则阿法狗几乎不可能输棋。
“没有。”大卫席尔瓦硬着头皮道,“今天对方下的棋很怪,在前30手就有3手棋出现在阿法狗的预判范围之外,到了第53手,虽然对手仍旧下出反常棋,但从价值网络上看,阿法狗的应对仍旧是合理的。”
大卫席尔瓦眉头紧皱,偷偷看了一眼两位老板:“今天赛后,我们还会重新再分析这局棋,到时候才能知道阿法狗到底出现了什么问题。”
谢尔盖布林抓了抓凌乱的头发:“你的意思是说,对方的棋力已经超过了阿法狗?有这样的棋手吗?”
听到希尔盖布林的话,几乎deepmind所有人在心里突然都想起了上午范辉说到的那个名字。
橘子。
这个神秘外援是你吗?
你是人类……还是……
也正在这时,屏幕之上,阿法狗的胜率终于降至了1%。
alphagoresigned!
alphago在边角处随意下了一颗棋后,屏幕上蹦出了一行盎文。
alphago认输了!
黄世杰从棋盒中拿出两个白棋,手指微微颤抖,摆在棋盘上。
所向无敌的alphago,居然真的输了。
谢尔盖布林看到屏幕上的“阿法狗认输”这几个字,摸了摸自己的胡子。
原定自己也要参加的赛后发布会,还要不要去?
谢尔盖布林突然有些犹豫。
莫名其妙的,谢尔盖布林突然想起了今天在电梯中碰到的那个亚裔青年说的那句话。
“希望晚上你们仍旧能有好心情。”
原本觉得输一盘也没什么的谢尔盖布林,突然心情真的变得不好了。
还是等真的赢下这场比赛,再出来参加发布会吧。
——
“胜里黑塔(胜利的高丽语)!!!”现场的高丽记者们一片欢腾,几乎所有的演播室中也都是欣喜不已。
“扎勒黑塔(干得好)!!!”
“李九段!对今天的胜利你有什么感想!?”
“请问今天的相谈棋取得了胜利,是否说明过去的两场失利是因为你对ai招法的不习惯而导致的输棋?”
“请问李九段,今天坐在你旁边戴口罩的人是谁?他似乎并非职业棋手,你能介绍一下吗?”
“今天你的棋风似乎和过去相比有了很大变化,这是你对ai思考出来的秘密武器吗?”
“哈萨比斯先生,对于阿法狗今天输棋,你有什么看法?”
李世实和一脸晦气却还要勉强保持风度的哈萨比斯对视一眼,似乎都在啊对方眼中看到了无奈。
“今天这局棋非常精彩,我们需要回去仔细检查一下,alphago今天到底出现了什么问题。”哈萨比斯拿起话筒干巴巴的说了一句,便不再说话,看向了李世实。
他早就准备好了今天获胜后的感言和记者可能会问到的问题。
但现在输了,他也不知道该说什么不该说什么。
如何面对媒体,是一项专业技能,同样也是要训练的,很不巧,哈萨比斯到现在还没真正熟练掌握这项技能。
绝世天才也不是什么都擅长的。
相比之下,自小就面对媒体的李世实就要游刃有余多了。
“非常抱歉,我必须先声明,今天的相谈棋,并非我个人的实力。”
“根据我与高丽棋院达成的协议,由于前两局我失败了,而且,第二局是完完全全的败了。因此,这一局的主导权并不在我这里。我今天的角色和黄博士是一样的,我对这一局的惊讶并不比大家少。”李世实细声细气道。
李世实这句话一说出来,现场媒体已是一片哗然。
谁都没想到如此骄傲的李世实竟能够将主弈权真的让出来。
究竟发生了什么?又有哪个棋手能这么强大,可以让天不怕地不怕的李世实甘心交出主弈权?
“至于我的搭档,我并没有见过他,他应该也没有在现场。”
“我身旁的那位先生,只是根据这位搭档实时传递过来的信息告知我落点。至于我搭档的名字,我相信很多棋迷都知道他,也猜出了今天是他在替我完成比赛,他就是两个月前在网络上先后击败古杰和我的神秘棋手,橘子。”
橘子!!!
这个听上去就像跟风苹果的名字正式出现在大众媒体面前。
此前橘子击败古杰和李世实,只是一小部分围棋爱好者中知道这件事,古杰获得梦百合冠军的时候虽然也说了一句,但影响力显然和现在是不能比的。
现在面对的可是全球媒体!
已经可以想象得到,不出两个小时,这个名字就会传遍整个世界,占领无数热搜!
李世实面色淡然。
“至于橘子究竟是什么身份,一会儿大家可以询问我旁边的这位华先生。”李世实指了一下藏在不起眼角落里的华泽成。
闪光灯咔嚓咔嚓的对仍旧戴着口罩的华泽成一通拍。
“请问,橘子到底是谁?既然他有这么强大的棋力,为什么不自己亲自挑战alphago?”
“有人说橘子是人工智能,请问是真的吗?”
“你如何看待这场胜利?”
……
华泽成被记者们如图其来的问题一下子搞的有些懵。
他头上戴的耳机中突然传来了声音。
华泽成凝神倾听,不由得露出惊讶的表情,看了一眼仍旧坐在椅子上的方豫,却见方豫向他点了点头。
“是的,橘子确实是人工智能。”华泽成摘下口罩,拿起话筒,简明扼要的回复了一句,“橘子是柚子科技研发的,全球第一个真正意义上人工智能大模型。”
哈萨比斯如遭雷亟。
柚子科技?
那个古狗本来就想收购的柚子科技?橘子是他们开发的?
大模型又是什么东西?
该死!
一瞬间,哈萨比斯就想明白了所有的事情。
坏了!这是有预谋的!
deepmind被狙击了!
哈萨比斯脸色瞬间白了起来。
被气的。
早知道不签那份赛前协议了。
大意了啊。
——
“怎么样!?我就说吧!?”演播厅中,古杰激动得腾一下蹦了起来,对着空中打了几拳,就像一只一米八几的猴子。
这几天他可是被骂坏了,他就不明白了,这么明摆着的事情,怎么这么多人还都看不出来呢?
叫你们骂我!?
打脸了吧?
“这、这……”演播厅里其他三名主持人都瞠目结舌。
“呃,刘教授。刚刚采访里说橘子人工智能是这家名叫柚子科技的公司开发的,对这家公司,你有了解吗?”陈颖赶忙转换话题,给刘子庆递了个瓢把儿。
“啊?”刘子庆还傻着呢,你这不是哪壶不开提哪壶吗?
我特么哪知道柚子科技是干嘛的?
——
“柚子科技!”
“哐!”
吴恩德懊恼的在桌面上重重锤了一拳,也不再顾虑其他,拿起电话就给robert拨了过去。
“andrew,我知道你要说什么,我会给你一个交代。”吴恩德还没说话,就已经听到电话那边robert温和但却坚定的声音,“千寻,现在必须allinai!”
——
“不是说最后一战再公布吗?”沈舒窈拉了拉方豫,闪着一双桃花眼,悄声问道。
方豫摇摇头:“不了,刚刚我看了一下现场氛围,过犹不及。”
“原本我是想要李世实被三比零击败后才插手的,但没想到李世实这么快就失去了战意,提前宣布了相谈棋。”
“如果只有两场比赛,而且是胜负已分之后的比赛,搞点噱头还可以。但现在,第三场比赛橘子提前介入,让所有人看到了人类获胜的希望,这时候再藏着掖着,到了最后一场结束后再公布,会被人抨击成为了噱头戏耍观众,那就很难办了。”
“所以,只能现在就宣布,随后正面挑战阿法狗!”
说罢,方豫就用袖子里的维尔德溺爱朝着华泽成施展了一个四环的“巧言令色”。
注1:现在的大模型llm指的是大语言模rgnguagemodel,主要使用了transformer架构。
llm的概念,在2017年才正式出现。
但书中的橘子大模型,和gpt这种主要依靠注意力机制的transformer架构大语言模型并不一样,而是基于柚子的底层法则而构建的,并由柚子重新开发出对应的神经网络算法搭建而成。因此,这里的大模型指的并非大语言模型,而是指的大参数模型。