中国教育和科研计算机网 中国教育 高校科技 教育信息化 下一代互联网 CERNET 返回首页
如何破除“唯论文”?详解伯克利“科研重工业模式”的成功经验
2020-03-16 北京智源人工智能研究院

  2020年2月18日,教育部、科技部联合印发了一份引起国内学术圈广泛关注的意见书:《关于规范高等学校SCI论文相关指标使用树立正确评价导向的若干意见》,呼吁进行科研评价时要“破除唯SCI至上”、“探索建立科学的评价体系”等。早在2018年,国家教育部等便先后发布了“清四唯”、“清五唯”的通知,“唯论文”均首当其冲,而这次意见书的出台再一次说明用“唯论文”等代表的旧工业“计件绩效考核”模式,已经成为阻挠中国科研和学术健康发展的严重掣肘,一场以变革评价体系为核心的科研体制改革已经刻不容缓;同时不可避免的是,对于长久以来已经习惯了“唯论文”,乃至“四唯”、“五唯”等模式的国内诸多科研机构、学者们来说,也将遭遇到诸如此类的问题:如果不唯论文、唯SCI等,我们该如何生存与发展?该如何建立一个可持续的全新科研评价体系?

  2020年春节前夕,在智源研究院的年度交流会上,智源学者、中科院计算所研究员包云岗发表了题为《伯克利科研模式探讨》的主题演讲,可以为解答上述问题提供一个全新的视野。据包云岗介绍,依托于中科院计算所的计算机体系结构国家重点实验室曾在内部探讨发展模式时,发现了一个不唯论文数量的典型模板,那便是加州大学伯克利分校计算机系。尤其是计算机系统方向,自上世纪70年代以来尽管其发表的论文数量并不突出,但伯克利通过一种“科研重工业模式”,大量投入研发真正落地应用的创新系统,孕育出了Ingres、BSD、RISC、RAID等一系列具有世界级影响力的科研成果。

  在演讲中,包云岗从伯克利的RISC-V项目切入,层层剖析了伯克利的科研运作模式和价值观,并追溯了伯克利近50年的科研历史,探讨了图灵奖获得者David Patterson教授总结的三条伯克利模式法则。这些内容,对于国内科研机构“破除SCI至上”的突围之路,将提供有益的参考。下面,让我们顺着包云岗的演讲脉络,看看伯克利究竟是如何独辟蹊径,将一条不“唯论文”的科研道路走得风生水起。

  提升科研影响力的两种发展模式

  据包云岗介绍,关注伯克利模式缘起于2014年1月,当时中科院计算所刚获批成立计算机体系结构国家重点实验室(以下简称:国重)不久,于是针对“国重应该走什么样的发展模式”开展了一场内部讨论。中科院计算所的传统优势是“做真实的系统”,其成果产出令世人印象深刻,远到103、107、757、联想PC系统等,近有曙光系列、龙芯等,并由此争取到了国家重点实验室平台,但在当时国内科研评价“唯SCI至上”的压力下,他们对于国重接下来的发展路径产生了困惑。

  此时,麻省理工学院Bill Freeman教授的一份报告进入了大家的视野,它“正本清源”般地梳理出了两种提升科研影响力的研究模式(如图1):第一种模式是通过不断累加论文数量的过程,自然而然产生好的研究想法,从而形成相当的影响力——这种模式已被各国学者广泛采用;第二种模式则可遇而不可求,是通过一篇或少数文章直接产生颠覆性的影响。

图1:两种不同的研究模式

  这两种模式在科研实践中都是可行的,但很显然第一种模式国内由于过度使用,尤其纳入科研绩效评价体系后已经泛滥成急功近利的“唯SCI至上”等现象;而第二种不唯论文数的发展模式,包云岗在报告中认为非常契合中科院计算所擅长做系统的历史优势,这便为探索国重的未来之路带来了理论上的信心,于是下一步的思路也就明确了:在实践层面和国际范围内为国重寻找到第二种发展模式的参照模板。

  经过一番探索,大家将目光聚焦到了加州大学伯克利分校的计算机系。

  伯克利计算机系的辉煌:不唯论文数量论英雄

  下面一系列统计数据,可以说明为什么伯克利模式是个值得借鉴的发展模板。下图(图2)是2005年美国科学院针对1965年到2005年间核心信息技术发展史的剖析,它涵盖了每一个核心技术从基础研究到形成10亿美元市场的过程。

图2:核心技术发展史(1965~2005)

  那么在核心信息技术的发展历史中,产业界与学术界各自做了多少贡献?在产业界中(如图3),我们可以看到IBM的贡献量最为巨大,一共贡献了9个核心的技术,其它如Xerox、贝尔实验室的成就也颇为不凡;而在学术界中,我们会发现伯克利贡献了7个核心技术,接下来是MIT、斯坦福和CMU,它们分别贡献了5个、4个和3个核心技术,由此可见伯克利在整个世界核心技术发展史中确实做出了举足轻重的贡献。

图3:产业界的技术贡献统计(1965~2005)

图4 :学术界技术贡献统计(1965~2005)

  在2007年,伯克利自己也做了一次统计,盘点了其引以为傲的诸多贡献,包括理论层面的密码学复杂性问题,技术系统方面的Unix操作系统、Ingres(关系数据库)等,伴随着这些创新历程,伯克利还孕育出了包括David Patterson、Michael Stonebraker等在内的8位图灵奖得主。

  那么伯克利取得硕果累累的内在原因是什么?包云岗回忆,借助国重在2016年进行的一次论文发表统计调研,发现了其中的端倪。当时国重统计了2006~2015十年间全球所有研究机构(包括企业)在计算机体系结构领域四大国际顶级会议(ASPLOS、HPCA、ISCA、MICRO)上发表论文的数量,结果显示(如图5):德州大学奥斯汀分校、威斯康辛大学曼迪逊分校和密歇根大学位列前三(分别发表了99篇、92篇和90篇);中科院计算所则共发表了19篇,位列世界第25名、亚洲第一;但令人深感意外的是,伯克利仅仅发表了18篇论文,位居中科院计算所之后。这表明伯克利在计算机体系结构领域的学术声誉和产业影响并不是通过论文数量产生的,它肯定有一套独特的自身评价机制和工作体系。

图5:2006~2015年计算机体系结构领域四大国际顶级会议发表论文的数量

  随后,伴随着参加伯克利RISC-V社区的相关活动和研究工作,包云岗得到了一个可以近距离观察伯克利科研工作体系如何运展的契机。他发现,RISC-V项目自2010年启动以来的几年时间里,伯克利除了没有发表论文外,几乎投入了全方面的工程研发和运营推广工作。其中包括:

  五年投入12次流片。首先令包云岗吃惊的是,伯克利在5年里(2011~2015)围绕RISC-V竟然进行了整整12次流片,这样的流片次数和频率远超全世界范围内所有其它大学。流片,就是像流水线一样通过一系列工艺步骤制造芯片,所以12次流片,意味着伯克利做了非常大量的工程投入。

  成立RISC-V基金会。2015年,伯克利成立了专门的基金会推动RISC-V,目前签约企业已经超过了300多家。

  成立RISC-V workshop。2015年,第一届RISC-V workshop就吸引了来自33家企业和14所高校的144位与会者,2019年12月召开的RISC-V workshop已经吸引了超过2000人参加。

  巡回演讲,大力宣传。David Patterson教授在2015年内访问了哈佛大学、普林斯顿大学、康奈尔大学、华盛顿大学、伊利诺伊大学香槟分校、加州大学洛杉矶分校与圣塔芭芭拉分校、新加坡南洋理工大学等,深入世界各地进行了十余场巡回演讲。

  科研教育,双管齐下。2017年10月在MICRO上举办的“基于RISC-V的体系结构研究研讨会(CARRV)”,超过了机器学习主题成为MICRO参加人数最多的研讨会,并出版了基于RISC-V的教科书。

  直到2016年,伯克利才“姗姗来迟”般地在国际顶级期刊上发表了第一篇关于RISC-V的总结性论文[1],包云岗对这篇论文的评价是“开创了一个全新的方向,引领、启发了全世界往这个方向的发展”。

  伯克利模式之魂:自由创新和集体主义

  如果回溯伯克利几十年的科研历程,尤其是在系统领域,他们一直沿袭着RISV-V项目所表现的科研价值观。如下图6所示,以2017年图灵奖得主、在RISC领域取得突出贡献的David Patterson教授为例,他于1976年加入伯克利,但早年发表的论文寥寥无几,其研究生涯前10年左右时间,平均每年仅2篇论文发表。作为参照,我们再看一下同为2017年图灵奖得主、在MIPS领域成就斐然的斯坦福大学教授John L. Hennessy的论文发表情况。我们发现John L. Hennessy除了1982年将之前累积的论文作了一次清零,一年内发表了9篇以便安心投入MIPS研究之外,其研究生涯早期的论文发表频率基本和David Patterson一样。两位图灵奖得主在论文发表上的殊途同归,从某种角度验证了伯克利模式的科学性。

图6:David Patterson 和 John L. Hennessy 职业生涯早期论文发表情况

  国重主任孙凝晖院士将伯克利这种不热衷于发表论文、潜心研制系统来真正改变产业的模式称之为“科研重工业模式”。相对应的,我们可以将快速发表大量高水平论文的模式称之为“科研轻工业模式”。包云岗认为,“科研重工业模式”是一种“Hard模式”,论文少、见效慢、风险高,即使在全世界范围内愿意采用这种模式的学者们也少之又少。不过在美国,至少还有伯克利在践行,如下图6展示了伯克利“科研重工业模式”从上世纪50年代到90年代研发的芯片或系统,那一个个闪亮的名字无不曾在全球科技产业界留下鲜明的烙印。

图7:50~90年代伯克利芯片和系统研究进展情况

  2015年,David Patterson临退休之际发表了一篇文章,篇幅不过290个单词,却对他心目中的伯克利模式做出了高度精炼的总结。由此我们可以一窥伯克利在科研组织和管理上的特色,以及它所秉承的价值观,该文强调了三点:

  1.要吸引与培养出色的年轻人;

  2.要积极采用激进式的集团作战模式;

  3.行事的出发点是将计算机系的利益最大化,而非自己的方向或个人利益。

  首先,我们来看第一条——“培养年轻人”。包云岗指出,伯克利早年间并不出众,正是一帮年轻人的奋斗使得它在70年代迅速崛起。70年代初期,排名美国高校计算机系前三甲的是麻省理工、斯坦福和卡内基梅隆,此时的伯克利计算机系还处于二流位置,甚至与康奈尔大学相比都存在一定差距。经过10年的发展,伯克利完成了P/NP、SPICE、Ingres、BSD等一些标志性的工作,由此跻身全美Top 4的行列。伴随期间的,是伯克利迎来了如Butler Lampson、William Kahan、Richard Karp、Chuck Thacker、Manuel Blum等一批年轻学者。包云岗介绍说,这批年轻人当初实际上是冲着伯克利的“自由精神”而去的(编者注:伯克利是60年代美国嬉皮士、反越战等运动的发源地,被誉为是美国最自由、包容的大学之一),结果他们发现事实并不尽人意,问题一大堆,但他们相互欣赏、相互鼓励,能勇敢地克服问题,坚定地迎接挑战,从而奠定了伯克利崛起的基石;到1980年代,伴随着RISC、IEEE 754浮点标准、RAID等项目进一步巩固了伯克利的地位,伯克利也由此吸引了更多的优秀人才,在经过实践、已见成效的团队价值观和工作方式下,进入良性循环的状态。

  值得注意的是,这些年轻人们在伯克利自由、包容的创新气氛下,在科研实践中却碰撞、探索出一套颇具集体主义色彩的团队价值观和工作模式——即David Patterson总结的第2、3条伯克利模式:激进式的集团作战、实现计算机系利益的最大化。David Patterson本人便是这种模式的忠实践行者,在他40多年的研究生涯里,其主持的诸多项目都采用了集团作战模式:如图8所示表格的第3、4列,每个项目均由几个教授联合协作,并带领着十几个或者几十个学生们一起完成。初看之下,这种模式似乎很难衡量每个人做出的贡献,但David Patterson认为在这种模式下,只要是成功的项目,最终每个参与者都会受益。事实也证明了这一点,在与David Patterson合作过的27名教授中,有11个都在之后成为了美国工程院院士——这种集团作战模式并不会稀释每个人的贡献。

图8:David A. Patterson参与项目一览

  对于这种集团作战模式的具体管理方法, 2014年,David Patterson曾撰文总结了伯克利团队管理的8条经验(如图9),内容涉及制度、学术交流、项目管理、团队价值观等等。

图9:伯克利团队管理8条经验

  包云岗认为,判断一个好团队凝聚力的标准,就是一个项目结束15年后成员们能否骄傲地在一起聚会。如图10所示的是RISC团队、RAID团队、NOW团队在15年后的聚会场景,我们从这个侧面不难感受到伯克利团队文化的魅力,亦不难感受到,David Patterson总结的三条伯克利模式,从人才培养、工作方法到价值观等是伯克利研发经验的精华,在一年又一年的时间沉淀中,已经形成一个越来越茁壮的正向循环。

图10:伯克利团队成员聚会

  结束语

  包云岗演讲结束时表示,和伯克利计算机系当年一样,现在像北京智源人工智能研究院这样的新型研发机构,也同样由一大群年轻学者聚集在一起,只要能探索出真正适合自己的发展道路,同样有希望取得一系列有影响力的成就。

  联系近两年来教育部、科技部多次发布破除“唯论文”、“唯SCI至上”等方面的通知、意见书,中国的科研体制改革已是箭在弦上,而通过对伯克利模式的学习,我们体会到一个科学的评价体系、发展模式尽管未必有固定的模式,但相信它一定能包容自由创新的学术精神,能有效地促进科研团体的生存和发展、提升团队的凝聚力和积极性,能立足于中国科技学术和产业创新的时代需求,以及能更好地孕育年轻一代学者们的茁壮成长。

  参考文献

  [1]Lee,Y.,Waterman,A.,Cook,H.,Zimmer,B. Keller,B.,Puggelli,A....and Chiu,P.An agile approach to building RISC-V microprocessors.IEEE Micro 36,2(Feb.2016),8–20.

教育信息化资讯微信二维码

特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。

邮箱:gxkj#cernet.com
微信公众号:高校科技进展