2023 February 11 AI

如何评价一个新技术——以 ChatGPT 为例

缘起

2015 年的时候，我写过一篇文章《如何评价一个新技术——以 Docker 为例》，今天打算按照类似的风格，评价一下最近异常火爆的 ChatGPT。

八年以前，我对于 Docker 做出了极高的评价，我认为 Docker 是比 Java 更加重要的技术进步。现在看来，也基本上没有说错。Docker 开启了云原生时代，促使 Google 开源了 K8S。虽然 Docekr 这家公司似乎已经不再重要，但是容器技术，云原生技术，已经改变了整个行业。

现在，ChatGPT 出现了，以较之当年更加快的速度，火爆、流行、出圈，引发资本追捧，也引发各种担忧，似乎全世界都在讨论。当然，也有一些不以为然的言论，认为：不能神话、不该高估、不过如此等等。所以，应该如何来看待这样一种新技术呢？

首先，ChatGPT 到底是什么？

之前想要评价 Docker 还是比较简单的，因为当时大家一眼就能明白，Docker 到底是什么。但是，ChatGPT 到底是什么呢？我最近密集的看了好多篇文章、好多个介绍视频、参与了微信群与 Twitter 上的好多轮讨论，最大的感受就是：“盲人摸象”。

有各种比喻，比较出名的比喻有：已经初具雏形的通用人工智能（张俊林），模糊的有损压缩（特德·姜），剽窃能手（乔姆斯基），互联网时代刚刚诞生的浏览器（王建硕），猜题专家（N 篇微信公众号）等等。

看了这么多盲人摸象的文章，我虽然依然不知道如何定义/定位 ChatGPT，但是至少我知道：ChatGPT 是大象那个级别的。

我关注 ChatGPT 的哪些特征

网上现在流传着很多与 ChatGPT 的对话截图，大家都喜闻乐见。毕竟无论是惊人还是搞笑，无聊还是浅薄，都是值得大家去围观的新事物。不过，我们应该琢磨得更加深一些，看看那些对话的表象，到底体现了一些什么重要的特征？而这些特征是以前的对话式 AI，所不具备的。

1. 对话能力

2 月 12 日我在 twitter 上与人讨论，有了一个猜想：ChatGPT 学习的单位，应该不是“文本”，而是“一个场景下的多轮对话”，所以他的自然对话能力本来就极强，经过这一个多月的人类调教，他肯定会变得更强。

但是，这个背后的一些观点，在推上没法展开。

我曾经提出过一个机器学习的语料来源，就是开源社区里的 PR，包括：代码提交 Diff，围绕各种评论，不断的改进，然后代码是否被合入。这样的一个讨论串，有代码，有自然语言，有针对具体代码行的评论，有代码前后的变化，有最终的判别结果。如果机器能够学习这样的素材，自然能够更好的提供编程的建议。
推广到社交网络上的各种素材，其实 BBS，Blog，邮件列表，各种聊天室，社交网络等等地方，到处都在发生着对话。
- 这些对话不是单一内容，单一场景，单一语言的（很可能是混杂，甚至不断跑题的）
- 这些对话展现的是人类互相理解，各自表达，互相交流的过程
在 ChatGPT 推出之后，这个过程发生在人机之间，每一次的对话（这个在 ChatGPT 的界面上分得非常清楚），每次人类对于对话的评价（有点赞按钮），都是人们在帮助 ChatGPT 在继续训练
- 人们在对话中纠正 ChatGPT 的内容，同样也是训练输入

我们一直在讨论的是 AIGC，在讨论 ChatGPT 生成的内容如何如何。但是，真正应该关注的是：ChatGPT 的对话能力，是使用 AI 增强的。

2. 多语言模型的威力

我曾经问过 ChatGPT 一个问题：英文语料的增加，是否能够帮助你的中文能力提升？

他的回答是：是的，英文语料的增加也可以帮助 ChatGPT 的中文能力提升。作为一种多语言的语言模型，ChatGPT 可以同时学习多种语言的语法和语义。如果 ChatGPT 在训练过程中接触到大量的英文语料，它就会学习到英文语法和语义，从而增强它对中文语言的理解能力。请注意，模型的多语言能力不同于它的语言翻译能力，它仍然需要通过大量专业的翻译语料来增强翻译能力。

看了这样的回答，我们可以关注和分析以下一些内容：

ChatGPT 采用多语言模型
- 其实不仅仅是多种自然语言，而是多种自然语言，加多种编程语言，再加多种“人造语言”（比如：Markdown、XML、CSS、CSV 之类）
这么多种类的语言，在 GPT 3.5 内部，应该是能够互相促进，互相增强的一个整体
代码与语言的混合输入输出，多语言之间的翻译，都是 ChatGPT 基于统一的模型产生的能力
例如：ChatGPT 的翻译不是“准确翻译”，是“意译”，这个其实更加厉害
再注意他回答的最后一句：“模型的多语言能力不同于它的语言翻译能力，它仍然需要通过大量专业的翻译语料来增强翻译能力”
- 在 ChatGPT 使用的各种语言料中，是进行分类的
- 不同种类的语料，各有专长，但是又能互相增强
- 这句话，是他自己想到要说的，我的问题中，其实不包含翻译能力的提问。我只能猜测，在其他的多轮对话中，已经有无数人，问过 ChatGPT 的翻译能力从何而来的问题了

3. 通用智能

人类之间的对话，其实可能讨论任何事情。但是，在过去的人机对话中，我们往往会预设：这个 AI 只能回答某些种类的问题。但是，由于 ChatGPT 的语料，可能是任何现存的人类对话实例，所以：我们也可以预期：各种类型的对话，都可以尝试与 ChatGPT 交流试试。

至于人机交流的效果，取决于这一类对话的语料数量与质量。所以，现在大家都在探索，能够与 ChatGPT 之间，聊些什么。这会很有趣，也可能会令人“悚然而惊”。

我比较认同张俊林的判断：ChatGPT 已经可以被认为是一种通用人工智能。就是由于这种通用对话能力，简言之：他什么都能跟你聊一聊，而且有很大的概率：这些聊天还有点价值。无论我们如何评价他的“套话”，至少他不是在说“空话”，不是像某些聊天机器人，只会抬杠或者胡扯。

4. 填补空白与启发思考

前几天，我与 ChatGPT 聊了一下开源学的问题。说实话，我是非常吃惊的。因为：根本就还没有开源学这门学科，最多就是我们一群开源人，在一个非常小的圈子里，在做一些早期的尝试而已。

在我看来，这意味着 ChatGPT 能够填补空白。在人类已经发展出来的学科 A 与学科 B 之间，存在着交叉学科的可能性，而这样的可能性，通过与 ChatGPT 交流，启发思考，是很有价值的。

评价一种新技术的三要素

在 8 年前的文章中，我其实是为 Docker 度身定制了三个标准，现在也可以试试看能不能套用来评价 ChatGPT。

1. 提升效率

当然，ChatGPT 极大的提升了我们的工作效率，而且是在我们的很多在以前不得不自己去完成的那些无聊、琐碎的事物性工作时（比如，写周报）非常明显。当然，还有人用他来干各种各样的工作，都取得了或多或少的成果。

不过，ChatGPT 并不会为内容的真实性负责，所以如果自己不做核查，甚至刻意造假的话，也会带来复杂、困难的真实性困扰。

2. 增加选择

在 ChatGPT 出现之前，我们原本在做的一些事情，比如：搜索、学习英语、找朋友聊天，现在可能都只需要和 ChatGPT 聊聊。当然，在 Bing+ChatGPT 推出之后，这样的搜索可能会让人从 Google，转身投向 Bing 的怀抱。

确实，选择比以前更多了（对 Google 不是啥好消息）

3. 降低门槛

ChatGPT 的易用性，与用途的广泛性，大家降低了使用 AI 的门槛。虽然最快达到 1 亿用户量，可能是一个虚假的（过于夸大的）数字。但是，铺天盖地的用户涌入 ChatGPT，开始与其聊天，肯定是不争的事实。

但是，这样的评价标准，对于 ChatGPT 来说，根本就不足以衡量其重要性。

评价一种新技术的另外一套三要素

这个其实是当初那篇文章的最后一段题外话，用来评价 Docker，已经有点过了，不过对于 ChatGPT 倒是正好。

1. 从量变到质变

Docker 事实上已经引发了质变，整个 IT 研发、DevOps 都随之发生变化。而 ChatGPT，从此改变人工智能的本质，甚至改变 IT 产业的本质，都是可以想见的了。

2. 创造一个新行业，甚至更多行业

Docker 创造的行业还不多，也许 YAML 配置工程师算一个。不过，我们可以预感到：ChatGPT 提供的 API，可以催生更多的 AI 应用，这个领域将广阔得难以想象。

3. 危害性

AIGC 的危害，到了能够以假乱真的 ChatGPT 出现之后，进入了一个新的阶段
多家科研期刊，已经明确禁止 ChatGPT 参与的论文写作与投稿
已经有专家在非常严肃的讨论：AI 失业问题

总结

ChatGPT 的出现，是一个远比 Docker 的出现重要的事件。也许是“新工业革命”级别的信号！下一个节点，也许就是 AI 能够找到方法：自我训练，自我调优，自行进化。

由于 GPT 4，甚至 GPT 5 也并非 AI 技术发展的天花板，因此在未来的 5~10 年，我们需要非常非常关注这个领域，其他所有的技术领域的重要性，都必须往后排了。

PS. 区块链、元宇宙、Web3 之类的技术，真的没那么重要了。