中科院研究员谈Matlab被禁:把东西做出来,而不是追求把论文发出来

大千世界 241 0

  6月10日,Mathworks 称,迫于美国政府的政策,禁止向哈尔滨工业大学、哈尔滨工程大学提供技术以及客户支持服务。此后,这一言论被证实,两校师生无法使用该公司旗下数据分析、图像处理软件 Matlab。

  近日,来自中科院计算所研究员、先进计算机系统研究中心主任包云岗在中国计算机学会青年计算机科技论坛(CCF YOCSEF)上对此发表了自己的看法,他认为在我们解决 Matlab 被禁的同时,也需要思考,凡事不能期望速成,而是需要长期地累积,把一项技术做到极致,从而成为某个细分领域的隐形冠军。

  撰文 | 包云岗(中科院计算所研究员)

  责编 | 叶水送

  ●  ●  ●

  很多人都在思考如何解决 “Matlab被禁” 这个燃眉之急问题。大家回顾了中国的工业软件发展之痛,批评国内的盗版问题、知识产权保护问题、重硬件轻软件等一系列问题。也提出了很多好的建议,比如给了针对Matlab 各种功能的开源软件替代方案。这些都算是“昨天和今天”的事。现在我想和大家一起讨论一下关于 “明天” 的事。我们每个人可以问自己一个问题:从现在这个时间点开始,给10年时间,甚至20年时间,我们能做出一个卡别人脖子的东西吗?

  并不是说真的要去卡别人脖子,而是说要成为别人离不开的东西。如果从这个角度来看这次 “Matlab被禁” 事件,那么也许可以给我们更多的是启发。我们都知道 Matlab 最初只是美国新墨西哥大学 Clever Moler 教授在1970年代用于教学中的一个小工具软件,那它为什么能在几十年后成为卡我们脖子的利器?我们一起来梳理一下 Matlab 发展过程中折射出来的几个理念。

  1

  把东西做出来,而不是追求把论文发出来

  Matlab 网站上有一篇 Cleve Moler 教授自己在2018年写的 Matlab 简史。他在开头就写道,在1971年和1975年他所在团队向 NSF 申请了两个项目,目标是 “探索开发高质量数学软件的方法、成本和资源”。

  Moler 自己也认为,某种程度上这两个项目是失败的,因为他们没有发表出一篇论文,他们只是开发出了两个软件:一个是 EISPACK,另一个 是LINPACK。而且这两个软件也谈不上多大的学术创新,因为 EISPACK就是把1965-1970年发表论文中用 Algo60 写的算法翻译为 Fortran,而 LINPACK 则是直接用 Fortran 重写一遍。

  2

  把东西用起来,而不是做完就扔了

  虽然 EISPACK、LINPACK 没有论文,学术创新也似乎不是很高,但确实两个很有用的软件。EISPACK 的开发团队在1974年代写了一本使用手册,我在 Google Scholar上查了一下,到现在已经被引用了1800多次,1970-1980 年代使用非常广泛。LINPACK 更是世界超级计算机排行榜 Tops500 的基准测试程序,可以说是影响了世界超级计算机的发展。

  3

  把教学场景用起来,而不是把教学当作负担

  Matlab 是 Coler 教授想把 EISPACK 和 LINPACK 应用于教学过程中的产物。如果 Moler 教授不是用心去做教学,不是为了能让学生更好地掌握线性代数与数值分析,更容易地使用 EISPACK 和 LINPACK 这两个软件,那么他就不会有动机自己动手去写一个 Matlab 小工具来把这两个软件接口封装起来,从而方便学生使用。今天,由于严苛的科研竞争环境和考核压力,很多人都把教学当作了一种负担,认为会影响科研。但教学其实是试验新技术、新工具最好的应用场景,因为试错成本很低,而且学生的创新性和主动性,还能帮助改进优化技术和工具。

  Matlab 最终走上商业化,就是因为 Coler 教授在斯坦福大学给学生上课时,有两个学生对 Matlab 很感兴趣,主动提出用C重写一遍,同时移植到 IBM PC上。很多技术最早都是从课堂上发展起来,比如 RISC 架构是 David Patterson 教授在伯克利的课程实验。

  4

  把持久战意识树立起来,而不是期望速胜论

  坚持围绕一件事做,几十年后的累积效应是惊人了。中国今天被卡脖子的东西,几乎都是别人积累了20年以上的东西。从第一版 Matlab 算起到现在已经有40年,1980年代初的第一代EDA软件到现在也有快40年,Intel 在1970年左右第一代微处理器到现在已经有50年。台积电1987年成立到现在也是积累了30多年。其实在学术界也有很多有影响力的工作也是积累很多年的产物,我们可以看一下 ACM System Software Award,获奖的软件基本上都是持续积累了几十年,比如 LLVM 持续优化了17年、Eclipse 优化了19年、Wireshark 优化了22年、Coq 优化了31年,GCC 则有33年。

  再仔细剖析一下 Matlab 以及对应的公司 MathWorks,可以说是持久战的典范。MathWorks 在1984年成立,只有1名员工。第一笔收入是1985年卖给了MIT10个 Matlab 版权,收入500美元。MathWorks 公司早期很不起眼,有个玩笑称它前7年员工数每一年翻一番,1984年1个员工,1985年2个员工,1986年4个员工,直到7年后的1991年也才只有128个员工。和今天很多初创公司相比,这个成长速度就像是蜗牛了。但是他们力出一孔,围绕着 Matlab 不断增加功能,使 Matlab 成为一个行业领先的工具软件。

  1997年,MathWorks 的营业额达到了5000万美元,380名员工。如今2019年 MathWorks 公司营业额是10亿美元,3000多员工,全球有400多万用户。虽然从营业额看并不大,但其实我们更应该学习这种模式——不断积累。把一项技术做到极致,成为某个细分领域的隐形冠军。最后总结一下,当我们在思考如何解 “Matlab 被禁” 这个解燃眉之急的同时,更需要考虑如何才能在未来做出像 Matlab 那样的工作,做出能 “卡别人脖子” 的技术。这需要我们做出改变:观念上的改变,行动上的改变。至于哪些具体的改变,我想前面梳理的四点就算是抛砖引玉了。


抱歉,评论功能暂时关闭!