自上世纪70年代自由软件诞生,到90年代 Linux 面世,开源从依托学术团体支持,到开始走上商业化的路径。如今,商业化程度在开源的价值衡量标准中不可或缺,比如 OpenHarmony 的开源生态已经覆盖包括金融、交通、市建、教育、制造等各行各业。然而,除了将商业落地作为重要标准之外,还有哪些评估指标可以作为开源项目是否成功的标的?这个问题着实不易回答。首先,开源作为技术服务体系,技术地基需要牢固;其次,开源又是连接开发者的重要桥梁,需要从人文视角进行评价。此外,可能最重要的是,当开源上升为一种科学理念,它的成功标准还不能脱离基于理性的复杂辩证。所以,看似简单的抽样调查、样本数据和分析评估,除了在商业层面可以进行客观指标解读,在技术、开发者和理念上,都需要更加深入的对评价标准自身的探讨。为此,第5期《源知源味》邀请到南京大学教授汪亮、开源中国 CTO 红薯,以及北京帕累托森林 CEO 李朝政,三位嘉宾与主持人——华为首席开源联络官任旭东,从开源生态评估的各个维度,展开一次深入浅出的思想交锋。
开源的商业化如今看起来毋容置疑,但开源的成长力和商业社会的底层逻辑冲突一直存在。仔细品味,开源的理念源动力在于价值观,而软件繁荣的根基又在于商业化。那么,应该如何衡量开源的成功与否?开源、软件、商业,三者之间存在怎样的关系?开源生态又如何促进软件生态的构建?
任旭东:大家好,欢迎参加本期《源知源味》圆桌,我是主持人任旭东。大家都在讨论开源生态,但开源生态和商业生态,以及软件生态之间应该是什么关系?开源成功与商业成功又是怎样的关系?如何评判一个开源项目或者开源社区成功?想听听各位的看法。
红薯:首先对于“成功”的定义,可能每个人的角度都不太一样。在过去的十几年,我一直在做“开源中国”(开源技术社区),接触到大量经由开发者或者是爱好者开发的开源项目。其实我认为,绝大部分开源项目是没有商业价值的,占到百分之九十几或者更高比例。但它们仍然不失为成功的开源项目,因为给开发者带来了直接的帮助。所以,我们不能从单一的角度来看“是否成功”。
汪亮:确实是这样,我们很难从简单化的角度来衡量是否成功,开源的成功也分多个层面。开源软件是一个持续开发的过程,在这个过程中,它获得的某种意义上的成功可能并不是因为产品,比如在项目进展的过程中,有没有培养出社区文化,发展出基于网络合作的创新团体,这些多样化的成功形式都是存在的。
任旭东:基于互联网和移动互联网,大家对于商业生态的理解更深了,包括软件也有生态。进入到开源语境后,我们也经常在圈子里讨论开源生态,但在开源生态和商业生态之间存在的鸿沟,圈内人和圈外人的理解就很不一样。具体到软件,软件的生态和它所依托的开源项目的生态之间,或者在开源社区构建开源生态,到底有没有可能促进软件生态的发展?
红薯:你说的这两者,就是开源的生态和后续商业软件的生态,肯定是有联系的。但它们的联系不是那么直接,我们现在做开源和做商业化其实好像没什么联系。但潜在的联系肯定有,比如我们不少合作客户都是从前期开源建设过程中不断沉淀下来的。
在这一 Part 中,嘉宾从开发者“人”的层面,映射到学术。通过“chaos”来说明看上去难以实用的学术,需要通过混沌,甚至是偶然性的转化才能真正实用。开源的实用性转化也存在这样的 chaos。那么,如何避免过高的前期投入,在短时间内实现高效转化?应该在项目开始时就进行有意的商业设计,将商业化作为目的,而开源是手段。就如 Red Hat 走出的模式,基于开源构建商业模式。
任旭东:我们在开源社区看到的开发者和商业伙伴那里遇到的开发者之间到底是什么关系?肯定不是完全一样,但有没有交集?
红薯:我认为是有交集的,但这个交集和开源关系不大。假如我们做出一个软件,不一定必须开源,通过软件免费开放使用也可以培养大量的用户。而当我去做商业化的时候,它依然会有转化。其实如果看现在整个行业的开源项目,无论是否著名,商业可能都不是项目开发的初心。从 Linux 开始,包括现在各种各样耳熟能详的著名开源项目,一开始都不是冲着商业化去的,但是在发展过程中逐渐演化出来合适的路径,这种路径其实就算是不开源,依然可以打通,所以我认为没有特别大的关系。
李朝政:这一点我非常有同感。其实开源有点像学术界,它和学术界的本性实际上是一样的,比如学术界里很多伟大的数学家都有一个观念,就是认为数学没用。和刚才红薯老师提到的问题类似,学术的本质并不是为了实际的“用”,而是潜在的“用”,但是这个用处很难解释。比如说,观察宇宙有用吗?现在看好像没有什么用,但是一百多年后我们可能突然发现它有用了,所以这个用处其实并不是没有用,而是它的转化路径,具有某些 chaos(混沌、混乱)。
红薯:对,是这样。我觉得商业化是目的,开源是手段,可以通过这个手段来培养早期用户或者早期活跃群体,这些都会促成商业的成功,但开源本身并不是目的。
红薯:是的,可以理解为开源原生。我平时和大量开发者打交道,认识很多团队,其中有一家规模不大的开源公司,就是通过一款小型开源项目给客户提供服务,养活了十个人。所以,从开始就商业化,也不在于项目的大小,这就是从当下的有用性出发的。
任旭东:我也观察到这样的现象,不少小公司都可以模仿 Red Hat, 直接基于开源构建自己的商业模式。
任旭东:刚好想问在座各位,一些不是直接在某个开源社区做贡献的从业者,但又在近距离观察开源、评估开源。这样的评估工作,究竟对开源运营或者过程把控有什么样的帮助?如何判断这些评估标准能够帮助开源项目获得成功?
汪亮:我的切入点是群体智能行为,可能听上去比较理论化,但做评估就是为了让抽象概念不抽象。一个软件健不健康,将来有没有可能发展繁荣,这是定性的理解。如果要进行更加理性的观察,就离不开定量的度量,需要用数学分析工具进行建模和预测。
李朝政:我们很关心内生变量,这是被市场所决定的,但是我们不关心意图变量。比如,当你去问“你到底喜欢这杯咖啡吗?”这个问题时,所有人可能都会说“喜欢”。但是如果问“这杯咖啡在你心目当中值多少钱?”,就没有标准答案了。有些人情感非常丰富,他说我超级喜欢,但实际上只出价一块钱,有些人则说我感觉一般喜欢,但可以出价100元。所以,不要做 survey(民意测验),survey的主观性是对数据分析过程中对客观性的践踏。再简单点说就是,看脚往什么地方走。
任旭东:朝政说的就是对社区的一种观察:用脚投票。但你说的又有点像量子力学里面的训练,不要尝试去测量,它测不准。
红薯:我是 Compass 的深度参与者,现在开源项目大家大多看 Star 数。这个数据真的很讨喜,为什么呢?首先是容易理解,Star 数越多听上去越牛。而且它也很容易操纵,项目运营者就非常喜欢。但实际上,它存在不够客观的弊端,需要一个更加客观和全面评估开源项目的方法。在做Compass 之前,我们先做了 Gitee 指数1.0,这个指数从一个主观衡量指标变成了五个客观指标,衡量维度更严谨,就不容易被操控了。
任旭东:我们一直拿评估指标与健康体检进行类比,体检的手段非常多,包括 X 光、CT,甚至核磁共振,方法越来越精细。这里面还存在对医学底层哲学认知不同的问题,比如人的构成,究竟是像西方医学所认知的是基于分子、细胞,还是像中医学所认识的,人是一个系统?类比开源,它运作的底层逻辑是一个有机体,还是一行行的代码?
红薯:这就说到 Compass,可以把它当成 Gitee 指数2.0,是一个更全面的、有机的复杂系统。从社区的参与,到团队活跃情况,再到人员的参与,都提供了全面的指标。现在最大的问题是它所代表的视角,主要还是基于具有较大商业化价值的开源项目,而一些也很成功的小型开源项目,可能还不适合通过这些指标进行衡量。所以,给这些项目提供指标解读,是 Compass 下个阶段致力于的方向,或者以后可能也会演化成多种视角。
李朝政:其实,我觉得社会上有些观念不太正确。比如说,有一些社会现象,包括淘宝刷单,大家关注的是单次量和积累量两个 KPI,但不管是对于客户,还是员工,只关注静态指标都会产生很大的问题。当我们进行考核的时候,会关注项目所发生的每一次变化。虽然也关注之前的积累,但并非我们主要考虑的问题。而如果关注变化的话,就会让原本想在其中进行操作的人没有操纵的意图了。
任旭东:时间最难被操纵,从单一指标变成复杂指标,再变成过程指标。
李朝政:没错,所以我相信积累量这个概念在商业领域会被逐步取代。
在价值指标不断丰富的背后,是对开源认知的逐渐深化。而伴随认知深化,如何实现现实中存在的简单与复杂、抽象与具体的矛盾统一,是开源社区在运营层面面临的难题。
任旭东:汪老师一开始说软件系统、信息系统,它们本身已经足够复杂,但是现在它的复杂性又加了一层,就是人的介入。社区是一个人的聚集地,这样一来就更难评估了,所以汪老师怎么看,我们度量开源价值的基本假设是什么?
汪亮:首先,是伴随着我们对开源生态认知的不断深入,会有相应的度量指标配合这种认知。如同体检现在可以检查的项目越来越多,是对于我们人体健康的认知,包括医学技术手段的不断发展,都是相辅相成的。其次,要厘清这些度量指标背后的结构关系。我的理念是在指标的基础上,还要构建计算模型。比如,如果错误地把相关性解读成因果性,就会在解决方法的选择上发生谬误。所以,看底层逻辑,我觉得还是对于事物本身认知的不断深化。
任旭东:汪老师谈到一个非常好的理念,指标是服务于我们认知的,而不是认知被指标所驱动,所以缺乏对开源社区的认知和理解,指标可能会演变成支持偏见的工具。接下来还想了解下,我们所谓的社区治理和社区度量,究竟对 Compass 有哪些潜在的影响?
李朝政:主要是对项目多方面的度量,比如衡量是否活跃。“活跃”是一个抽象概念,比如一些人你看他好像总在神游四方,但其实他们脑子里装着很大的事情,就像数学家,有一个很有名的数学家叫埃尔多斯,他一生发了1000多篇文章,并且拿了菲尔兹奖,但是他绝大部分时间都在旅游,在旅行途中把论文写完了。
任旭东:他的思考可以是在途中,而且是深度思考。
李朝政:即使和一些并不了解数学的人交流,他也能受到启发,从而解决内心的疑问。所以,真正的活跃是心灵的活跃,而不是只是行为活跃。真正存在壁垒的是思想壁垒,思想才是深不见底的。所以说,应该把公司的所有代码和策略都开源出去,但目前开源社区的核心仍然存在防御机制。
任旭东:所以我们经常说,如果只把一个社区的代码 down 下来,虽然能编译、能运行,但这还不是真正把一个社区“镜像”了。
红薯:不过这点又跟我们度量的维度有点对立,从度量的角度来看,应该是抽丝剥茧,更加具象化,让展示能够更清楚、简单,从而更容易理解。李朝政:恰好我认为这可能是对我的错误解读。最好的论文一定是很清楚的,框架一定是非常清晰的。一个能够扩展的框架一定满足全面性,同时也满足垂直性。
任旭东:我理解朝政想表达的,就是复杂和简洁是一对矛盾统一,比如,相对论这么复杂,更应该用简洁的公式把它表示出来,这也恰好是 Compass 的核心价值。
开源社区的建设仍然不能缺少“领头羊”的作用。一方面,通过贡献者画像能识别出 Top 的核心贡献者;另一方面,还需要回到社区建设的多样性和活跃性,通过时间的积累,沉淀出开源领域的“意见领袖”。
任旭东:在开源社区中,灵魂人物、核心贡献者的贡献不容忽视。那么,我们应该通过怎样的方法来识别顶级的核心贡献者?
汪亮:首先从定义来看,应该基于产出多少贡献来对这个角色进行定义。当然,与之伴生的,是在什么方面做出了这些贡献。所以,一个狭义的回答是通过制定规则来进行识别。
任旭东:您说过通过“贡献者画像”能够识别出一些 Top 的社区领袖?
汪亮:对,是可以“画出”一些核心贡献者。随着时间变化,通过画像还能判断出有可能存在的流失情况。
任旭东:所以还是回到生态的多样性和活跃性。
任旭东:对于程序员来说,在一个社区里他究竟如何能感受到组织确实在运营,但同时又能够基于每个个体进行自我链接,是一个盆景还是一个活的生态。很明显,当我们去看景的时候,是能感知到的,但感知这个东西应该如何被Compass 有效呈现出来?
红薯:我认为目前整体的架构还是可以的,通过新贡献者的模型展示,能够反映出项目是否具有社区活跃度,包括对组织活跃度、issue的处理、PR的响应等相关情况的把控。
汪亮:关键是在反映的同时还能呈现出动态,就像任总刚才说的,它是一个过程性的,在持续地进行度量。
任旭东:这个过程性又和朝政一开始说的“形成了时间的积累”相对应了,这也是生态的魅力所在。作为主持人,我认为今天的讨论非常好,探讨的价值不在于找到终极答案,而是对有价值的开源话题进行不断地探索,感谢各位嘉宾。
围绕“开源生态的发展和趋势,以及如何共建繁荣的开源社区”主题,本期《源知源味》从开源的商业化和如何转化、价值理性的衡量、指标与认知的辩证、社区运营架构和核心贡献者的识别等角度,三位嘉宾与主持人一同带来了一场关于开源评价的理性思辨盛宴。
转载自丨CSDN
编辑丨张可芯
相关阅读 | Related Reading
开源亚洲行,和开源社一起出发 FOSSASIA SUMMIT!
COSCUP 2024 正式启动议题征集,开源社专属邀请通道开启,欢迎报名参加!
开源社简介
开源社(英文名称为“KAIYUANSHE”)成立于 2014 年,是由志愿贡献于开源事业的个人志愿者,依 “贡献、共识、共治” 原则所组成的开源社区。开源社始终维持 “厂商中立、公益、非营利” 的理念,以 “立足中国、贡献全球,推动开源成为新时代的生活方式” 为愿景,以 “开源治理、国际接轨、社区发展、项目孵化” 为使命,旨在共创健康可持续发展的开源生态体系。
开源社积极与支持开源的社区、高校、企业以及政府相关单位紧密合作,同时也是全球开源协议认证组织 - OSI 在中国的首个成员。
自2016年起连续举办中国开源年会(COSCon),持续发布《中国开源年度报告》,联合发起了“中国开源先锋榜”、“中国开源码力榜”等,在海内外产生了广泛的影响力。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。