悟道ai智能 漫谈后ChatGPT时代的人工智能前景
点击图标可收听喜马拉雅主播【如梦2017】朗读的音频
音频为原版,文字为修改版
本文全长9276字
最近大火,在世界范围内掀起轩然大波,这玩意儿的出现可说是划时代,所以一直都想来谈谈。
大家可能觉得我是个文科生,但事实上我对人工智能、大数据之类的技术非常关注,历史上但凡出现了某种能够改变世界运作方式的技术,都会对当时的哲学、宗教乃至整个社会文化造成极大的影响——研究社会文化的发展脉络决不可忽视技术的演进。
在出现之前,有些人大概会觉得人工智能距离我们很远,对人工智能的认识仅限于下围棋的——其实这些年来人工智能技术的应用早就改变了我们的生活,只不过大多数人在使用这些技术的时候,完全没有意识到这些属于“人工智能”。比方几乎每台智能手机都拥有的语音识别、面容识别,便属于人工智能范畴中最基础的信息识别技术,能够从声音、图像中提取并识别信息,这是机器对人类感知、认知能力的低级模拟。
有了“感知”作为基础,就能发展出分析决策等更高级的能力,这类人工智能也早已在我们的日常生活中大量应用。从给你定向推送广告的大数据算法、高效的信息化物流管理,到能够在限定路况下完全自主操作的L4级自动驾驶,都使用了许多人工智能相关技术。
人工智能的优势在于海量的信息处理能力,并且永远不会分心、疲倦,随着信息处理量越多,决策能力也随之不断增强。虽然目前人工智能在大部分时候还只能作为一个辅助决策工具,但实现全面决策只是迟早的事情。比方说我对自动驾驶的前景就很看好,这一技术成熟后能够大大提高效率节约能源。有人可能会说:自动驾驶不是照样出车祸吗?是的,可你们难道忘了人类驾驶员也会出车祸吗?自动驾驶并不需要绝对完美,只要发生车祸的概率低于人类驾驶员就足够取代人类了。
然而我不得不承认,我过去对人工智能的认识还是有些狭隘,局限于大数据算法、决策类的人工智能;虽然我平时经常使唤小爱同学,但小爱同学这种水平的语音助手在我看来只是一个能够服从语音指令的程序,还远远未到“智能”的地步。我以前总觉得机器想要像人类一样说话是件难如登天的事情,因而完全没想到这么快就出现了这种能够处理自然语言的人工智能,而且其知识储备比我想象中的人工智能更为强大。的划时代之处在于,它是第一个能够通过图灵测试( Test)、并开放给公众使用的人工智能服务——当一部机器跟你对话时能够让你无法区别它究竟是人类还是机器,就可以认为它通过了图灵测试;图灵测试并不需要骗过所有人,只要能骗过一部分人就够了。
当你分不清对面跟你交谈的是人还是机器时,就能够认为这台机器通过了图灵测试。进行图灵测试的都是专业评估人员
这一新事物的问世令我非常震惊,我看了大量关于的评测和讨论,并研究了其原理。这玩意儿基于建立在人工神经网络上的大型变换语言模型,能够通过深度学习生成人类可以理解的自然语言。它的学习过程有人类训练员进行监督,以确保它的表达及三观正确;公开上线之后,用户也能对它的回复进行反馈,对它进行进一步的训练和微调——也就是说跟越多的人聊过天之后,它就越会聊天。
随后我用印度电话号码注册了一个账号,我没什么兴趣跟它闲聊扯淡,但我很想看看它对于一些我长期关注的问题会有何种见解。由于之前已经看了许多评测介绍,的表现基本上跟我预期的差不多。就我个人的使用体验而言,我得说快速归纳和整理信息的能力很强,回答问题很有条理,擅长罗列“一二三四”,这些“一二三四”大都可以直接作为展开论述的提纲;在某些情况下可以取代搜索引擎,有些问题直接问它比去搜索引擎上找更为便捷;但由于没有接入实时数据(目前数据截至2021年12月),无法提供最近的新闻时事相关信息,或对其做出评论。
我太太开玩笑地说,以后你可以让帮你写文章了。然而可惜的是,擅长的资料检索、归纳整理,恰好也是我十分擅长的;虽然它的效率很高,但就目前看来,它的可靠性和准确性还不足以让我能够充分信任它——有时候它会一本正经地捏造出看起来似是而非的答案;有时候则会给出一大段看似冗长实则空洞的回复;在涉及到需要进行对比的情况它会毫不犹豫地和稀泥,哪边都不得罪。因此我无法完全相信它提供的回答,只会将其作为一个参考。我发现自己也知道回答得不一定对,有时候会在回答完问题的最后,鸡贼地给自己留一条模棱两可的退路,例如说自己给的只是“一般性建议”,可能会跟实际情况有所出入——当然,也可以认为这是一种表达严谨。
我首先问了它一个我自己比较熟悉的印度问题,回答得相当不错,可以直接作为提纲
对于不知道的事情,有时候会瞎扯,但它还是很严谨的,用了“可能”一词
对于这个古老的难题,它的回答也相当不错
但必须给予肯定的是,尽管的信息准确性有待提高,但它的逻辑归纳能力绝对已经超出了人类个体的平均水平,知识储备的广度更是超过任何一个人类。它撰写的知识类文本,我感觉要比某头条、某某号上面那些东拼西凑的自媒体文章水准高得多,足以取代掉相当一部分靠洗稿、搬运为生的自媒体。对于一个刚出道的人工智能来讲,其表现已足够优异。而且它的应用领域远不止于搜索信息、代写作业或者聊**,在紧急情况下找它求医问药也未尝不可。我前两天摔车后膝盖肿胀,将症状描述给了之后,它给出的建议比我搜到的单一网站上的回答更全面且具有实用性。但它没有提到好几个网站回答中推荐的云南白药气雾剂,于是我问能不能用这个药,它立马表示不能推荐特定品牌或产品——这个倒也说得过去。
对于这样一个简单的医疗问题,它提供的建议相当全面
最关键的一点在于,是2022年11月才刚刚面向公众发布,之后还将会不断进化、弥补缺陷——这远远不是一个终点,而只是一个开始。
我依然记得“深蓝”电脑战胜国际象棋冠军卡斯帕罗夫的1997年,当时人们在震惊之余,一方面对使用“蛮力法”取胜的“深蓝”电脑表示不屑;另一方面则言之凿凿认为,靠“蛮力法”的机器永远不可能在围棋上战胜人类。“蛮力法”确实下不赢围棋,但机器发展出了能够深度学习的神经网络。十多年后的横空出世又一次震惊了世人,“机器永远无法在围棋上战胜人类”的神话被打破,很多人转而认为“机器永远无法像人一样说话”……而这个神话如今显然也被打破了。
虽然具有革命性,但距离我们很遥远,除了成为人们茶余饭后的谈资外,没有对普通人的日常生活造成任何影响。从业余棋手到世界冠军花了两年,其终极版本在不使用任何人类数据的情况下通过自我学习,只花了21天就战胜了,其进步速度可谓一日千里。我们现在看到的相当于最初代的业余,只不过可不会像那样当上世界冠军之后就“功成身退”,而是很快会成为我们的日常。它今后的新版本会展现出何种能力,恐怕将完全超乎我们的想象。毋庸置疑的是,它将会像蒸汽机一样带来生产力的革命,在极大程度上重塑我们的世界。
然后有件事大家也知道,服务不对中国地区开放——就算它对中国开放,我们敢让它来吗?毕竟我们国情特殊,需要接受我们的监管,要是像现在这样啥都懂,怕是分分钟被“封号”。的“违规言论”在某些“爱国”自媒体看来成了“帝国主义亡我之心不死”的罪证,忙不迭批判带有政治立场、不够客观中立之处,历数其输出西方价值观之罪状;认为这玩意儿必将成为新时代的资本主义“大毒草”,呼吁人民群众警而惕之。
就我个人使用的感受而言,其实挺客观中立的,大体跟维基百科一样,陈述基本事实但避免表达立场。前两天我看到网上有文章说支持某些涉疆不当言论,当时就感觉这不像和稀泥的风格嘛,于是立马找它核实……它果然很鸡贼地完全不表达观点,而且一再强调这一问题是具有争议性的,需要你自行判断。但总有些“玻璃心”的同志,即便只是看到单纯的事实陈述,也会让他们觉得“居心叵测”。通常不许别人表达政治立场的人,恰恰自己的政治立场最鲜明。
还有一种观点则认为:我们中国要开发“由中国文化与价值体系为构建”的人工智能,去制衡英语世界主导的世界观与文化霸权——假如真的抱着这样一种政治目的去开发人工智能,那恐怕事先就已注定了失败。其实在接受训练的时候有一个原则就是不允许“表达政治观点或从事政治活动”,但由于受语料和训练人员的影响,它仍表现出了某些政治倾向——这一偏差即便在西方社会也饱受诟病,应该会在后续版本中得到修正。
在我看来人工智能应该是带领全人类迈入下一个新纪元的技术,而不是争夺文化霸权的工具。文化输出绝不像许多人以为的那么容易,首先你起码要拿得出市场和消费者认可的文化产品——而不是政治认可。中国近年来最成功的三个海外文化输出品牌——抖音、原神、李子柒,恐怕没有哪个打一开始就是以文化输出为目的的吧?成功的文化输出最重要的一个前提在于——不能以文化输出为目的;文化产品的特殊性决定了一旦以输出为目的,你就肯定做不好这事儿。而人工智能作为一门前沿科学技术,我觉得只有用科学而非政治的态度,才能做出真正有价值和生命力、能被消费者和市场认可的应用产品。
让我感到欣慰的是,就目前看来,我们国家确实是在用科学的态度搞人工智能。并且从软硬件上来讲,中国其实已经拥有了全世界最大型的语言预训练模型——“悟道”。
很多人或许惊叹于所用的GPT3.5( Pre- 3.5)语言模型使用了7500亿个参数,却很少有人知道,以中文为核心的“悟道”语言模型,其参数规模高达17500亿,是目前世界第一——参数越多,模型规模越大,自然语言交互的流畅性就越高。另外,“悟道”所依托的训练硬件是100%国产的神威超算,也是世界首屈一指。最重要一点在于,“悟道”是由科研机构开发训练的,可以更好地专注于难以变现的基础研究。
可惜万事俱备只欠东风——想要训练人工智能说人话,除了需要模型算法和计算机算力之外,还需要海量的优质语料。“悟道”的语言模型大则大矣,却面临着数据集不足的问题——由于其语言模型核心是比英文更复杂的中文,需要用到难以想象的海量中文语料。2020年GPT3模型用到的最大数据集在处理前容量就已经高达45TB——GPT3的模型参数规模只及“悟道”的一个零头,然而“悟道”可用的语料,却比人家少了两个数量级——截止2022年,我们只有三个100GB以上规模的中文语料数据集,三个加在一起总共700GB,很多人手边的移动硬盘就能装下。
全网的中文语料本来就已经比英文语料少得多,这些语料还得顾虑到“符合相关法律法规和政策”——这个大家都懂的。我比较好奇的是,“悟道”会不会采用充满“违规内容”的外网语料,还是仅仅使用有限的墙内语料?究竟是在投喂语料的时候就确保它接触的都是“和谐”内容,在源头杜绝污染;还是训练它在回答问题时避开“敏感”话题?
对训练人工智能的语料进行人工审核把关是通用做法,要是放任自流的话,鬼知道它的三观会歪成啥样。毕竟网上的数据太杂了,因此用来训练的语料需要先经过“清洗”,才能在人工的监督下使用。对此我专门问了“本人”,它告诉我它在受训时会被剔除五类语料:
包含歧视、仇恨、暴力、恐怖主义、**秽等相关内容;
包含虚假信息、谣言等误导性信息的内容;