开源学:开源史学纲要

按照上一篇文章的描述,我试着从历史学的角度,来切入“开源学”的话题。所谓纲要,其实就是一个提纲,作为一个历史学的外行,来畅想一下:假设我是一个历史学家,我会如何来研究开源。

一、从历史看开源

我最喜欢的历史学家钱穆先生,在《国史大纲》的前言中说道:“治国史之第一任务,在能于国家民族之内部自身,求得其独特精神之所在。” 按照同样的思路来看开源的发展史,也不能仅仅把一堆人物、事件、技术、企业罗列出来,而是要寻求发展背后的独特的“精神”所在。是什么促成了开源的出现?又是什么,推动开源不断的发展变化?

1. 开源的史料在哪里?

当然,研究历史,基本功还是要有。首先,就是收集史料。但是,开源的史料在哪里呢?第二个问题:开源的史料,如何整理呢?

目前看来,开源相关的信息,绝大多数,都是在互联网上以公开信息的形式,存在着的。但是,要想完整全面的收集,却非常困难。

如下所示,是我最近正在思考的一个关于开源的元数据提纲,尽量能够容纳与开源相关的所有信息。

更多请参考 OpenSource MetaData

这些内容,从大的分类来说,可以分为两类:算法能够处理的数据、与人工才能阅读理解的信息。相较过去的历史学,我们的确可以做更多的数据处理工作,从中看到比例、趋势以及特征。但是,那些无法结构化,无法汇总统计的事情,依然是非常重要的。

最近我正在读的一本书《历史的技艺》,其中有一段非常有启发:“如果历史学家屈服于自己的材料,而不是把自己强加于材料,那么,那些材料最终会对他说出历史谜团的答案。 ”

2. 开源的历史上有哪些重要的时间点?

在软件开发领域,我们通常会划分N个里程碑。如果是小的里程碑,我们的软件版本,大概会是从1.1到1.2,甚至1.1.1。如果是大的里程碑,则可能从1.x,升级到2.0。

在历史领域,也非常重视里程碑的标志性作用。XXX事件,标志着某某事件,进入YYY阶段。

对于开源来说,最重要的一个时间节点,自然是1998年2月,Open Source Initiative(开放源码促进会)成立。标志着开源正式诞生!但是,在这一重大时间的前后,还有哪些时间节点呢?

2.1. 自由软件运动

2.2. Linux内核项目

2.3. 开源软件运动

2.4. 互联网与万维网爆发

2.5. 云计算兴起

3. 如何理解开源的发展历程

我想提出的一种历史研究的思路是:虽然不能简单的断定因果,但是可以做依赖分析。在历史发展的过程中,一个事物的诞生,虽然我们不能找全所有的充分必要条件,但是必要条件(前置依赖项),是可以找到的。

3.1. 开源诞生的文化基因

3.2. 开源发展的推动力

4. 如何给开源的历史分期?

似乎,历史学家都喜欢给历史上的长长短短的时间,进行分期,然后再给起一个好名字。比如“青铜时代”、“封建社会”、“黑暗的中世纪”、“镀金时代”等等。

有些时代,有明确的起止时间,有些却是混沌一片。不过,既然要学习历史学家的思维模式,咱们也不能免俗,应该试着给开源的发展历程,再分一分期。

4.1. ~ 1983 蒙昧时代

在 GNU 与自由软件运动出现之前,整个软件行业,对于源代码的相关权益,都处于蒙昧的状态。

4.2. 1983 ~ 1998 自由软件时代

从 GNU 成立,到 Open Source 出现之前,是自由软件高唱理想主义的时代。

4.3. 1998 ~ 2018 开源黄金 20 年

从 OSI 成立,到微软收购 Github、IBM 收购Red Hat。开源、互联网与商业的关系,越走越近,互相促进,共同发展壮大。

4.4. 2018 ~ 至今 开源混沌期

2018年,尤其是2019年之后,我们在开源社区观察到了很多不和谐的现象:修改License,赶走创始人,开源与云计算的矛盾,中美对抗等等。一方面欣欣向荣,另一方面又暗藏隐忧,这样的混沌期,还不知道何时会结束。

以下的内容,目前我还没有能力写出来,先存目吧……

二、从开源看历史

1. 今后的历史会发生在哪里?

2. 开放式的史料数据库,是否可能?

3. 时间、地点、人物是什么?

4. 简单的因果链条,如何演变为复杂的因果网络?

三、从开源历史看中国

1. 在中国的开源事件有哪些?

2. 目前的中国开源,处于哪个阶段?

3. 未来的中国开源,将会如何发展?

四、从开源历史看世界