如何评价一个新技术——以 ChatGPT 为例

缘起

2015 年的时候,我写过一篇文章《如何评价一个新技术——以 Docker 为例》,今天打算按照类似的风格,评价一下最近异常火爆的 ChatGPT。

八年以前,我对于 Docker 做出了极高的评价,我认为 Docker 是比 Java 更加重要的技术进步。现在看来,也基本上没有说错。Docker 开启了云原生时代,促使 Google 开源了 K8S。虽然 Docekr 这家公司似乎已经不再重要,但是容器技术,云原生技术,已经改变了整个行业。

现在,ChatGPT 出现了,以较之当年更加快的速度,火爆、流行、出圈,引发资本追捧,也引发各种担忧,似乎全世界都在讨论。当然,也有一些不以为然的言论,认为:不能神话、不该高估、不过如此等等。所以,应该如何来看待这样一种新技术呢?

首先,ChatGPT 到底是什么?

之前想要评价 Docker 还是比较简单的,因为当时大家一眼就能明白,Docker 到底是什么。但是,ChatGPT 到底是什么呢?我最近密集的看了好多篇文章、好多个介绍视频、参与了微信群与 Twitter 上的好多轮讨论,最大的感受就是:“盲人摸象”。

有各种比喻,比较出名的比喻有:已经初具雏形的通用人工智能(张俊林),模糊的有损压缩(特德·姜),剽窃能手(乔姆斯基),互联网时代刚刚诞生的浏览器(王建硕),猜题专家(N 篇微信公众号)等等。

看了这么多盲人摸象的文章,我虽然依然不知道如何定义/定位 ChatGPT,但是至少我知道:ChatGPT 是大象那个级别的。

我关注 ChatGPT 的哪些特征

网上现在流传着很多与 ChatGPT 的对话截图,大家都喜闻乐见。毕竟无论是惊人还是搞笑,无聊还是浅薄,都是值得大家去围观的新事物。不过,我们应该琢磨得更加深一些,看看那些对话的表象,到底体现了一些什么重要的特征?而这些特征是以前的对话式 AI,所不具备的。

1. 对话能力

2 月 12 日我 在 twitter 上与人讨论,有了一个猜想:ChatGPT 学习的单位,应该不是“文本”,而是“一个场景下的多轮对话”,所以他的自然对话能力本来就极强,经过这一个多月的人类调教,他肯定会变得更强。

但是,这个背后的一些观点,在推上没法展开。

我们一直在讨论的是 AIGC,在讨论 ChatGPT 生成的内容如何如何。但是,真正应该关注的是:ChatGPT 的对话能力,是使用 AI 增强的。

2. 多语言模型的威力

我曾经问过 ChatGPT 一个问题:英文语料的增加,是否能够帮助你的中文能力提升?

他的回答是:是的,英文语料的增加也可以帮助 ChatGPT 的中文能力提升。作为一种多语言的语言模型,ChatGPT 可以同时学习多种语言的语法和语义。如果 ChatGPT 在训练过程中接触到大量的英文语料,它就会学习到英文语法和语义,从而增强它对中文语言的理解能力。 请注意,模型的多语言能力不同于它的语言翻译能力,它仍然需要通过大量专业的翻译语料来增强翻译能力。

看了这样的回答,我们可以关注和分析以下一些内容:

3. 通用智能

人类之间的对话,其实可能讨论任何事情。但是,在过去的人机对话中,我们往往会预设:这个 AI 只能回答某些种类的问题。但是,由于 ChatGPT 的语料,可能是任何现存的人类对话实例,所以:我们也可以预期:各种类型的对话,都可以尝试与 ChatGPT 交流试试。

至于人机交流的效果,取决于这一类对话的语料数量与质量。所以,现在大家都在探索,能够与 ChatGPT 之间,聊些什么。这会很有趣,也可能会令人“悚然而惊”。

我比较认同张俊林的判断:ChatGPT 已经可以被认为是一种通用人工智能。就是由于这种通用对话能力,简言之:他什么都能跟你聊一聊,而且有很大的概率:这些聊天还有点价值。无论我们如何评价他的“套话”,至少他不是在说“空话”,不是像某些聊天机器人,只会抬杠或者胡扯。

4. 填补空白与启发思考

前几天,我与 ChatGPT 聊了一下 开源学的问题。说实话,我是非常吃惊的。因为:根本就还没有开源学这门学科,最多就是我们一群开源人,在一个非常小的圈子里,在做一些早期的尝试而已。

在我看来,这意味着 ChatGPT 能够填补空白。在人类已经发展出来的学科 A 与学科 B 之间,存在着交叉学科的可能性,而这样的可能性,通过与 ChatGPT 交流,启发思考,是很有价值的。

评价一种新技术的三要素

在 8 年前的文章中,我其实是为 Docker 度身定制了三个标准,现在也可以试试看能不能套用来评价 ChatGPT。

1. 提升效率

当然,ChatGPT 极大的提升了我们的工作效率,而且是在我们的很多在以前不得不自己去完成的那些无聊、琐碎的事物性工作时(比如,写周报)非常明显。当然,还有人用他来干各种各样的工作,都取得了或多或少的成果。

不过,ChatGPT 并不会为内容的真实性负责,所以如果自己不做核查,甚至刻意造假的话,也会带来复杂、困难的真实性困扰。

2. 增加选择

在 ChatGPT 出现之前,我们原本在做的一些事情,比如:搜索、学习英语、找朋友聊天,现在可能都只需要和 ChatGPT 聊聊。当然,在 Bing+ChatGPT 推出之后,这样的搜索可能会让人从 Google,转身投向 Bing 的怀抱。

确实,选择比以前更多了(对 Google 不是啥好消息)

3. 降低门槛

ChatGPT 的易用性,与用途的广泛性,大家降低了使用 AI 的门槛。虽然最快达到 1 亿用户量,可能是一个虚假的(过于夸大的)数字。但是,铺天盖地的用户涌入 ChatGPT,开始与其聊天,肯定是不争的事实。

但是,这样的评价标准,对于 ChatGPT 来说,根本就不足以衡量其重要性。

评价一种新技术的另外一套三要素

这个其实是当初那篇文章的最后一段题外话,用来评价 Docker,已经有点过了,不过对于 ChatGPT 倒是正好。

1. 从量变到质变

Docker 事实上已经引发了质变,整个 IT 研发、DevOps 都随之发生变化。而 ChatGPT,从此改变人工智能的本质,甚至改变 IT 产业的本质,都是可以想见的了。

2. 创造一个新行业,甚至更多行业

Docker 创造的行业还不多,也许 YAML 配置工程师算一个。不过,我们可以预感到:ChatGPT 提供的 API,可以催生更多的 AI 应用,这个领域将广阔得难以想象。

3. 危害性

总结

ChatGPT 的出现,是一个远比 Docker 的出现重要的事件。也许是“新工业革命”级别的信号!下一个节点,也许就是 AI 能够找到方法:自我训练,自我调优,自行进化。

由于 GPT 4,甚至 GPT 5 也并非 AI 技术发展的天花板,因此在未来的 5~10 年,我们需要非常非常关注这个领域,其他所有的技术领域的重要性,都必须往后排了。

PS. 区块链、元宇宙、Web3 之类的技术,真的没那么重要了。