思考tags与主题词、敏捷与CMM、草根与精英

对立往往是能够通过沟通来化解的! ——庄表伟

一直在思考很多事情,标题里列的这些词,是我最近思考的比较多的一些主题。我有这样的思考习惯,或者说有一个直觉的思考方向,那就是万事万物背后的道理,都应该,也是有可能融会贯通起来的。我的不少朋友都了解我这个毛病,并且基本上是善意的不“频繁”泼我的冷水。其实我还是有一定自知之明的,只是这样的思考总是更令人着迷罢了。

先说tags与主题词。因为工作的关系,我在上一家公司的最后一个项目,就是与中国科学技术信息研究所合作开发一个“主题词管理系统”。所以我有机会非常深入的了解了经典的主题词体系结构以及为何设计成如此结构的原因。可以说,包含“用、代、属、分、族、参、范畴”等多种特征的主题词体系,其实是非常精巧,也是经过了很多很多专家的深思熟虑的。而主题词的根本目的,自然是为了能够:“快速”、“准确”、“无遗漏”的查找到需要寻找到信息。

再说tags,我一直订阅keso的blog,有一篇blog引起了我的注意:《东拉西扯:tag与关键字》,其中不但谈到了主题词(一般民间都叫做关键字),还提到了一个我认识的朋友jiangwei。当初我们一起合作,我完成了主题词的管理系统,而他做的是主题词计算机辅助标引部分。大概是jiangwei的“技术炫耀”让原本对主题词没什么了解的keso对主题词本身发生了误会。说什么:“tag是一种人类活动,而主题词是一种机械产生的”。唉,其实主题词标引能够做到像jiangwei炫耀的那样计算机自动提炼,实在是最新的科技进步——在此之前的很多年,主题词的维护和文章的标引,都是通过手工完成的。也就是keso以一种自豪的口气称呼的“人类活动”。因此,tags与主题词的区别不在于是不是人类活动,而在于这个标引的行为,从过去的集中变成了现在的分散,从过去的专家变成了现在的普通大众,从过去的有限选择变成了现在的任意选择。

在keso的那篇blog下面的跟帖,更是让人觉得“文艺”得很。

Tag与关键字之别不仅仅是人机之别,说到底还是人与人的主客观念之别,都是人的东西,机器只是一种反映,无非:Tag是以主观之,关键字是以客观之;Tag是我的,关键字是别人的;Tag用“心”,关键字用“聪明”;Tag是乐,关键字是音;Tag是曲,关键字是词;Tag是诗歌,关键字是文字;Tag是情绪的,关键字是理智的;Tag是自由的,关键字是必然的;Tag是可爱的,关键字是可信的; Tag是“灯”,关键字是“镜子”……窃以为二者在帮助我们认识自我和认识世界时相辅相成,相得益彰,是不二的!

撇开那些不懂的人不谈吧,我也不认为tags和主题词之间有什么根本的分歧,无非是有管理的tags和无管理的主题词罢了。还是说说我一直在思考的更为有意义的另一个问题吧。主题词究竟该以什么方式来进行管理呢?当初我设计那个主题词管理系统的时候,也曾经考虑过这个问题,因为一个主题词系统需要与实际的主题词应用相衔接,必然需要建立一个灵活反馈机制。这个反馈机制必须兼具灵活性与统一性。当时的设想是通过wiki协作的方式,收集对于新词的使用、定义、相互关系、使用范围等等方面的信息——也许将来会有机会去完成这个设想——这样就能够打通使用者与管理者的界线,使得知识管理的自动化水平更上一个台阶。

接下来,我们来看看wiki这个模式如何能够帮助tags与主题词。首先,任意的设置tags并不困难,但是这样可能导致很多类似的信息被定义为不同的tags,导致信息的分散与查找到遗漏。主题词虽然能够解决词条的统一与规范问题,但是不可避免的存在着滞后性,毕竟能够决定如何统一的专家总是忙不过来的。而wiki呢?wiki自然是大众知识共享的好工具,而且生来就有草根的特质,如果能够以这样一种模式来使用:

tags选择或自造——>新词进入wiki——>wiki协作编辑整理——>正式主题词——更新tags可选集。

这样,一个良性循环就建立起来了,只是要应用这个模式,现在的wiki还需要经过改造。目前的wiki,任何人都可以修改,并且不断继续修改一个词条。而事实上,如果能够利用等级权限控制修改人数,那么词条的解释与词条之间的关系,就能够逐渐固化下来,成为“知识”的一部分。当然,这样的wiki,也就打破了草根与精英之间的界线了。

再说敏捷与CMM,这又是一对矛盾。敏捷方法得到了大多数开发人员的支持,算得上是草根出身,而CMM基本上是从学院派来的,特别能够诱惑公司老总,算得上是精英出身。这两者的对立如何沟通呢?

我曾经写过一篇文章《定论——软件开发的方法论探讨》,仔细讨论过这个问题,得出的初步结论是:“撇开各种隐喻的迷雾,软件开发目前尚未成为一种科学,而真正能够成为科学的标志就是——有一个科学的检验各种方法效果优劣的标准。在这样的标准出现之前,所有的方法都是待检验的零件,在各个零件都经过检验之后,才谈得上将合格的、有效率的零件组合起来使用的问题。”

草根自有草根的坚持,精英自有精英的道理。 ——庄表伟

接着说这个对立的问题。第一篇是讲tags与主题词,第二篇是讲敏捷与CMM的,昨天到今天我就一直在想,如何展开讨论“草根”与“精英”的关系问题。正好keso的评论可以帮助我引出想要讨论的话题。

我一开始就认为tags与主题词其实没有本质的区别,而keso认为其中大有差别。他的评论说到:

无论是人工处理,还是机器处理,主题词都是直接跟文档本身相关的,比如一份关于物价调整的报告,主题词就必定要包含“物价”,但tag是跟人相关的,它反映的是每个独立个体的思维。还是那份调价的文件,有人可能就会给它个“官僚”的tag。一张两会的照片,主题词可能是“两会”,或者“人大代表”,tag则可能是“老人”、“美女”。

我感到这个评论大有启发,回复如下:

你的评论使我想到了另外一个tags与主题词的区别: tags是方便设定tags的人的。 主题词是方便检索的人的。 …

后面还有keso的评论,我就不引了。

从这里我们可以看出,tags其实是很草根的,他是个人的,个性的,是不必考虑他人的,也不必为了他人而委屈自己的。而主题词是很精英道,是公共的,是统一的,是有规范的,是不能全依着自己的性子乱选的。

我们来做一个假设,如果一个人设置tags,完全由着自己的性子设置,人家都是“GIRL”,他偏要用“小妞”,甚至更为个性的词语。那么,他的资源就只能够属于他个人,别人也找不到他的东西。这样本没有问题。但是假设这个现象被推到极致,每个人都用各自不同的词语来标识“GIRL”这同一个概念,那么tags还会有什么意义吗?

回到现实世界,其实人与人之间的差别没有那么大,因此即使是随意的选择tags,也会有很多的重叠,而这样的随意选择后的重叠,也就成为tags的乐趣之一了。

从草根到精英,要牺牲好多的! ——庄表伟

我必须承认,我不够厚道。自从我开始写自己的blog以来,我的友情链接的第一、第二位是我认识的朋友,而第三个就是keso。keso的blog和网摘我每天都用RSS Reader收下来看,这里面的规律我很早就知道啦。 一个共生的圈子是这样形成的:

在自己的blog里谈论keso——>keso会在他的网摘里加上那篇blog的链接——>那篇blog的访问量一日爆涨——>更多人愿意在blog里或赞扬或漫骂keso——>一个不断长大的共生圈……

如何加入这样的圈子呢?你必须使用圈内的常用词(常用tags也是一回事),比如tags、blog、RSS、草根,诸如此类。这样你的文章才能够被keso发现,师父领进了门,接下来就要靠自己努力了。

再来说草根与精英的对立现象,其实草根与精英并无本质上的对立,一个草根如果打算与更多的人交流,希望自己的声音被更多的人听到,就必须规范自己的语言,溶入一个圈子,牺牲自己的“自然语言”,而加入一个更为高级的“话语体系”。更高的目标,就是首创、发明更多的圈内的语言,丰富这个“话语体系”,成为“话语霸权”的拥有者……

这一切都是那么显而易见,唯一需要犹豫的是我,我到底要不要也走这条路呢?后来我想通了,这个世界只有一种游戏规则,就是精英们制订游戏规则,要在这样一个世界中发出更能影响他人的声音,就必须加入这个游戏。如果用tags打比方,我如果越是希望别人发现我发布的信息,就必须给这个信息标识一些更为“规范的”、“流行的”、“有吸引力的”——tags。这样的tags与主题词还有区别吗?

当然了,tags毕竟是宽容的,他允许你自娱自乐,不强制你必须在“规范主题词表”内选择。这样的形式,使得“不媚俗”也可以很“流行”。注意这个逻辑背后的“悖论”。就像“草根的代言人,也是精英的一种”一样。

让我再复述一遍:精英自有精英的道理,因为唯一的规则,是他们制订的。

理性就是用智慧分析问题;建设性就是用智慧解决问题。 ——庄表伟

我从来都不是一个愤青,所以如果你看到我前面的那四篇blog,认为我是在控诉这万恶的“精英规则”,那你就错了。我当年相当喜欢读《经济观察报》,其中一个重要的原因,就是在它报头上的那一行字:“理性、建设性”,并且在挺长的一段时间内,用上面的这句话作为自己的签名档。所以我看待这些对立问题的时候,首先想到的是分析,深入的分析,而不是急于进行所谓的道德评判。

在这篇blog的第一部分中,我就写到:“对立往往能够通过沟通来化解的!”这背后的理由是相信技术理性的力量。有很多对立的问题,比如tags与主题词、敏捷与CMM、草根与精英之类,都可以通过更为深入的分析,发现其本质上的关系:

tags与主题词的关系,从本质上来说,就是在标引的自由度与可检索性之间的一个权衡。要解决这个矛盾,就需要采用更加方便灵活的技术,同时提高标引的自由度与可检索性。

敏捷与CMM的关系,从本质上来说,就是在对人的重视与对过程的重视之间的一个权衡。要解决这个矛盾,需要有一个能从本原上判别各种开发方法与技巧好坏的标准,最终求得一个最优解。

草根与精英的关系,从本质上来说,就是在多个不同的、或大或小的话语体系之间进行选择,在保留多少个性与溶入多少群体之间进行权衡。这个问题很难解决,我们只能说,最理想的状态是:“大家都能够知道有这么个规则,而且,还能不去理睬这个规则,仅仅是为了愉悦自己,而不用为了别人委屈自己。”

其实还可以再联想到很多东西,不过就不再挂在这个标题下面了。keso的光已经沾得不少了。:p

原文写于:2005年5月,是连续的5篇文章,在这里合并为一篇。