埃隆马斯克不一定是最聪明的,但却是这个星球上思维最清晰的人之一。
他设计了十一个问题,从多个角度,不同方向,来考察橘子大模型的思考和语言能力。
语言,是人类文明最重要的东西,不,应该说,语言就是人类文明本身。
很多人都认为,人类之所以能够成为人类,是因为人类可以制造和应用工具。
但制造和应用工具本身,并不是一项基本能力,而是人类逻辑思维和创造的能力的具体体现。
那么,逻辑思考和创造力又是怎么来的?
人和动物的根本差异到底在哪里?
逻辑思维能力吗?
事实上,人类天生的逻辑思维能力在灵长类动物中并不出众,甚至还不如大猩猩。
根据普林斯顿大学的心理学教授约翰逊莱尔德的对比研究,人类在基础逻辑方面,比如三段论推理中,即使经过相应的训练,人类往往也会受到不相干信息的影响,表现出匹配偏差,并且会重复出现相同的错误。
而大猩猩和黑猩猩则完全不会,经过训练的大猩猩和黑猩猩,在基础逻辑推理方面,几乎可以说是碾压人类。
那么人类到底是如何诞生文明的?为什么大猩猩和黑猩猩没有?
有一种观点认为,人类与动物根本性的差异,就在于人类诞生了语言。
人类文明的一切,都承载在语言的表述之中。
约克大学的艾伦比亚维斯托克在3047年的一项对比研究中发现,相较单语言使用者,双语使用者在执行任务时的表现更好,展现出更强的灵活处理能力和认知力。
非常喜欢马户和又鸟的维特根斯坦就曾经说过,语言的边界就是我宇宙的边界,人类无法脱离语言而思考。
直到近年,人工智能领域的研究者才发现,人工智能其实也是一样的,让人工智能彻底掌握人类语言和完全理解语言中蕴含的信息,有可能才是诞生真正人工智能的第一条件。
这时,这个行业的大量资源才开始转移到nlp上来,诞生了诸如lstm(长短记忆网络)等知名且优秀的神经网络模型。
这也是目前古狗大脑和openai最重要的研究方向。
openai原本准备要在下个月发布的openaigym强化学习环境库,其实就是为了lstm所准备的。
柚子框架发布的时候,他们还没怎么看重,因为两者不在一个赛道上。
他们搞的openaigym是个强化学习环境库,无非就是针对柚子框架再多一个接口而已。
但随着柚子框架相关生态的不断完善,他们发现,用柚子框架训练lstm,根本就不需要用他们这个强化学习环境库!
对于在任何行业中都一定要成为领先者的马斯克来说,他能够接受自己暂时处于落后,但前提是要看到自己的增长速度快于其他人,能够看到成为行业领导者的时间表,而不是被其他机构越拉越远!
如果这个橘子大模型真的像这份说明文档中描述的一样强大,毫无疑问,这已经不是被越拉越远的问题。
原本马斯克认为人工智能的开发竞赛就像一场马拉松,哪怕前面一小时领先一公里,后面一样也能追的回来并且领先超出。
根据他对这个行业中的领先者古狗和非死不可还有他自己的特斯拉的研发进度来说,他判断,想要实现真正的人工智能,至少还要十年的时间。
所以在ai领域,他的状态一直以来都比较松弛,松弛的跟法国人似的,大部分精力仍旧放在特斯拉的产量提高及spacex的星链计划上。
还有上推喷人。
直到两个月前柚子科技的横空出世。
现在的情况,就相当于他的两个选手做了热身运动,发令枪一响,刚颠了几下,结果发现有人居然用百米的时间就跑完了马拉松全程!
是百米的时间!不是百米的速度!
这怎么可能?
埃隆马斯克设计了十一个问题,分别从基本理解、数学推理、科学应用、逻辑推理、创造性写作、知识汇总提炼、哲学探讨、情感识别、社会影响、伦理道德、上下文关联这十一个方面综合考察橘子大模型的能力。
至于说提交bug?
那不重要,发现了可以提交,但重点还是要用这短短的一周内测时间中,找到橘子大模型的实现方式!
而在企业api领域,马斯克同样用一个小时时间拿出了一份简单的初步测试方案,重点测试api接口调用的参数调整范围、适用性、性能以及评估api在不同负载条件下的响应时间、吞吐量等性能指标。
“回复的速度很快,语言逻辑也没有什么问题。”萨姆奥特曼挑了挑眉,把眼睛从伊利亚的电脑屏幕上移开,看了眼马斯克,“把你的第一性原理解释的很清楚。”
马斯克的第一个问题就是让橘子大模型给解释什么叫第一性原理。
第一性原理并不是马斯克提出的,但毫无疑问,他是第一个把这个原理挂在嘴边上的。
马斯克双手抱胸,冷静的看着电脑屏幕。
而在伊利亚输入了第二个问题之后两秒钟,柚子大模型同样给出了第二个问题的答案和推导方式。
第二个问题是一个典型的数学变速运动问题。
第三个,第四个、第五个……一直到伦理道德的第十题,橘子大模型的回答都没有任何问题。
就连识别文字中隐含的情绪表达,橘子大模型都做出了相当准确的识别!
马斯克把推上一篇对川宝明褒实贬阴阳怪气他十年未缴纳联邦所得税的推文发给橘子,让橘子大模型识别其中的情绪。
橘子大模型先是给出了分析,随后直接下了判断,说这些文字的撰写者对川宝抱有不屑、鄙夷和厌恶的情绪。
看到这个回复时,openai的所有人脸色全部都变了。
这意味着,橘子大模型不止做到了完全识别人类语言的含义,更能依据其中的文字表达,判断文字背后所隐藏的真实含义!
这是此前任何机器分析都做不到的事情!
他们不只是因为在竞争中落后而失落,目前其中大部分人其实都是理想主义者,否则也不会只拿30%的薪水在这家非盈利机构中工作。
除了失落,还有好奇、兴奋、忐忑,以及……恐惧。
尽管他们就是干这一行的,但真的看到了人工智能到来的这一刻,每个人心中都有恐惧。
真的来了?
未来会怎样?世界将会变成什么样子?人类会被人工智能取代吗?
没有人比他们更了解,这个大门一旦被推开,ai将会以何种惊人的速度进化。
“好的,虽然我不认为川宝作为总统候选人会卷入这种争论中,但我仍旧会依据川宝的口吻来反击刚刚您提到的那篇推文:‘是的,我十年中仅仅只交了750迈元的联邦所得税,这是因为我比你更聪明!也比你更成功!我的两任老婆都是超模,她们聪明而又美丽,我的女儿漂亮又能干,儿子高大又帅气,我是亿万富翁川宝,你又是谁?’”
“请注意,以上回复仅仅只是按照互联网上搜集并汇总的川宝言论所做出的模仿,并不代表川宝会做出这样的回复,同时也不代表柚子科技的任何价值观与价值取向。”
现场一片沉默。
“深入测试吧,每个问题至少追问五次。”马斯克深吸了一口气,对openai的总裁布洛克曼道:“格雷格,我认为你们应当重新考虑openai的发展方向。”
非常感谢大家的月票!
真没想到,没好意思求月票的情况下,今天居然月票涨了这么多。
无以为报,以身相许你们也不要,只能从下个月1号开始抓紧更新,以回报厚爱。
之所以是1号而不是明天,就是因为明天又是一个月一次带孩子去帝都看病的时间,早上六点半的高铁,估计晚上八九点能回家,我争取在帝都等孩子的时候更出一章,回来后争取再更一章。
ps,今天还是二更,这是第一更