一
2017年,百度提出All in AI。
在当年的百度开发者大会时期,社交网络上刷屏了一个李彦宏坐着无人车上五环被开罚单的事。
到了2018年,李彦宏在开发者大会上,基于All in AI,提出当年是自动驾驶产品化元年。
也就是说,百度的All in AI的具体方向是:自动驾驶。
百度的自动驾驶,与通常所认为的自动驾驶不同。它的野望非常之大,不仅仅是车的自动驾驶,还有一整套的智慧交通战略。
李彦宏甚至还做了一个关于道路交通数据运营商(由政府和国有资本主导成立)的构想。
大致上能理解百度的出发点,虽然不好评价百度这份野望实现的可能性,但有件事几乎是可以肯定的:实现起来,周期很长。
二
正当百度埋头于它的自动驾驶征途之时,2022年年底,ChatGPT横空出世,引起了全球范围上的巨大关注。这份关注之热度,甚至有一种前无古人的感觉。
诸多互联网大厂,无论是国内的,还是海外的,都纷纷表示,不能掉队。
如果说,有些企业可能是本着不能踩空的“只有偏执狂才能生存”精神,有些企业可能就不是踩空那么简单了。对于搜索引擎来说,这是事关生死的问题。
谷歌冒了出来,结果因为答错一个问题,千亿市值蒸发。
百度呢?
在中国互联网,一个在六年前信誓旦旦要All in AI哪怕实质上其实是去搞自动驾驶的搜索引擎厂商,在这一刻,不冒出来秀一把肌肉,怕是不行的。
三
运气不好的百度,文心一言的发布前,ChatGPT迭代到了第四代版本,再次引起全球网络上的热议。
我几乎有一种百度是硬着头皮开那场发布会的感觉。
科技公司开发布会,不是不能用录播的方式。然而,一个ai被调戏有何反应,是需要现场感的。录播的文心一言发布,很难让人有一种这个ai好牛逼的信服感。更何况,ChatGPT4.0在前,百度也没有讲出它到底有何闪亮之处,股价完全没有给发布会面子,怕是免不了的。
我是真不知道,谁是录播发布的决策者。
有个朋友昨儿问我,文心一言到底怎么样。
其实我也回答不出来,毕竟手上只有KFCVW50这种邀请码,没用过,怎么评价。
随后网上开始有一些测试截屏出现,并有不少企业已经开始接入文心一言。百度今日的股价开始回升。
四
好友风端,是一个非常刁钻的人,他利用文心一言和ChatGPT测试了同样的问题。对于这个问题,我们倒不必过多评价两者到底谁技术更牛一些,但两者背后的一些逻辑,是很可以玩味的。
这是ChatGPT的回答,这个回答其实是错的,慧远的确是高僧,但他们和玄奘并没有什么关系——晋宋各有一个高僧叫慧远。
这是文心一言的回答。我想你不需要多少知识储备,就应该知道这个答案是错的。
也就是说,其实ChatGPT和文心一言,都在胡说八道。但ChatGPT的胡说八道,似乎更一本正经一些。
我另外一个叫秋心的朋友则认为,还是低级一点好。高级的胡说八道,忽悠力太强了。
五
现在我们不妨想想,两者的回答是怎么产生的。
在百度里搜索“玄奘最喜欢的弟子”,看看百度是怎么做的。它首先很“智能”地把玄奘转化成了“唐僧”,又很“智能”地把“弟子”转化成了徒弟。于是玄奘最喜欢的弟子这个问题,变成了“唐僧最喜欢的徒弟”。
当问题变成“唐僧最喜欢的徒弟”时,似乎猪八戒作为答案,也不能说错。于是百度里出现了这样的结果页。而文心一言,我当然有理由认为,百度的搜索结果,是它重要的语料库之一。
但我的确不知道ChatGPT是怎么冒出来“慧远”这个答案的。从谷歌里搜这句话,看到的是如下页面:
谷歌在转化玄奘为唐僧这件事上,没有百度那么“智能”。于是它老老实实告诉你,三个弟子是谁。但位列第二的答案是玄奘非常喜欢辩机,不知道为什么ChatGPT用了“慧远”。
上面是必应的搜索结果(包括国内版和国际版),都没有猪八戒,但也没有慧远。
文心一言的胡说八道,不仅显而易见,而且我还能理解。
ChatGPT的胡说八道,不仅忽悠力极强,而且个中缘由真是不明觉厉。
六
不少人都有“简中网污染很重”的判断,这个判断是否成立,我不好下断言。但就玄奘最喜欢的弟子这个问题上,我觉得并非是污染之锅。
问题的核心在于玄奘转化成了唐僧。如果没有这份“智能”,会是什么结果。
我在百度里敲入了玄奘、弟子:
结果还是可以的。
如果我是AI,就应该老老实实地去针对玄奘和弟子来作答,而“最喜欢的”这个要素则可以这么作答:
喜欢是人类的情感,我是一个人工智能,很难进行判断。史料中目前缺少玄奘对弟子们的情感记录,所以我无法告诉你这些弟子,哪一个是玄奘最喜欢的。
完美不完美?
七
百度的压力实在是太大了,有些压力,我有些小人之心式的揣测,我们来看看发布会上这一句:
“文心一言不是中美科技对抗的工具:
你怎么看李彦宏说这话,ChatGPT?
—— 首发 扯氮集 ——