把“不可能”变为现实的龙芯团队(科技视点·“关键核心技术攻
原题:历时十八年,从研发龙芯一号到三号,从产品到产业化,一路披荆斩棘
把“不可能”变为现实的龙芯团队(科技视点·“关键核心技术攻关记”之五)
芯片是信息产业的灵魂,通用CPU(中央处理器)可以说是芯片中的“珠峰”。自主研发CPU,难度很大。
在这个故事的起点,2001年8月的一个清晨,当龙芯第一代产品龙芯1号成功启动操作系统时,龙芯CPU首席科学家胡伟武和团队在中科院计算所实验室大声欢呼。
一年后,2002年8月,我国首款通用CPU龙芯1号流片(检验测试芯片是否符合设计性能和功能的过程)成功,终结了中国计算机产业“无芯”的历史。
2016年10月,龙芯第三代处理器3A3000研制成功后,胡伟武给自己放了一天假。在尝尽了自主研发芯片的艰辛以后,面对来之不易的成果,胡伟武却显得很平静。
如今,最初的激情和豪迈逐渐消退,但胡伟武愈发感到,龙芯距离掌握信息产业核心技术更近了。
“不掌握核心技术,就成了卖盒子,打开里面都一样”
胡伟武把3A3000看得极重,认为它是我国自主研制CPU的里程碑,代表我国自主研发的芯片跨过了国际通用处理器的第一道门槛。
自主研制芯片,胡伟武设想过种种困难,然而道路之曲折、过程之艰难,仍然大大超出他的预料。
2002年,龙芯1号诞生,可就在流片截止日期的前几天,测试组发现处理器的1万多个触发器的扫描链无法正常工作。如果不能及时修复,只能放弃流片。这意味着此前的努力可能白费。
别无选择,团队决定手工修改版图,连续工作了两天两夜,才把触发器的扫描链连上。
设计第二代产品龙芯2号时,一个电源的规划问题成为困扰科研人员的一块心病,团队熬夜做物理设计。“那时我们一点吃饭的胃口都没有,只在晚上胡乱吃几口。直到布完线、解决完问题后,我和两位团队成员到一家粥铺吃晚饭,才觉得饿坏了,那顿饭竟然吃空了17个盘子,撑得腰都弯不下来。”胡伟武说。
龙芯3号的研制过程更是一波三折。按设计,龙芯3B型号芯片的一些性能可以达到世界领先水平,但2010年11月测试时,竟然连操作系统都启动不了。原来,芯片可测性设计部分有逻辑错误,同样问题也在同期其他芯片出现。这一失误,给龙芯带来重大打击。
科研团队重新梳理流程,一再改版,调试顺利了,又出现压力测试下死机现象,之后又是死锁问题。经过一年多反复修改,芯片才达到稳定状态。
胡伟武说,龙芯的研制过程如此坎坷,除了研发流程需要完善外,根本原因在于团队坚持自己开发核心模块,挑战的是难中之难的问题。
“这些问题,如果是‘攒’芯片,一般不会碰到,与他人合作更不会遇到,我们这样做,是因为用别人的东西时吃过亏。”胡伟武说,“我国信息产业企业成千上万,不掌握核心技术,就成了卖盒子,打开里面都一样。”
历经三轮的迭代试错,龙芯不断进化。目前,基于28纳米工艺,龙芯3号新一代产品3A4000的研制工作已经展开,预计比上一代产品性能提高一倍,有望达到国际主流中高端芯片水平。
“CPU必须让人用起来,否则获再多的奖也没用”
龙芯18年研制,主要分为两个阶段。2001年—2010年,中科院计算所课题组所做的努力是技术积累阶段;2010年,成立龙芯中科技术有限公司(以下简称龙芯中科),从研发走向产业化。胡伟武的身份转变为龙芯中科总裁。
“CPU必须让人用起来,否则获再多的奖,拿再多的荣誉也没用。”胡伟武说。
可组织上转型容易,思想上转型却很艰难。龙芯研发为此就栽了跟头。
2009年研制的3A1000是我国首个四核CPU芯片。龙芯团队由此掌握了多核CPU研发的一系列关键技术,按理说下一款产品应该致力于优化产品性能。然而,当时团队还偏重于追随国际学术界热点,过度追求多核以及浮点峰值性能的单一指标,忽视了芯片的通用处理能力。
谈及彼时情形,胡伟武反思,龙芯中科定方向时就出现了巨大偏差。龙芯虽然在学术上取得了成功,应用上却与主流产品差距越拉越大。
从课题组转型为公司的头三年,龙芯中科差点连工资都发不出。
痛定思痛。2013年5月,龙芯中科结合市场需求,及时调整芯片研发路线:龙芯3号系列多核CPU不追求核的个数,而是大幅度提高单核性能;龙芯2号系列芯片不再追求“大而全”,而是根据用户需求定义芯片;龙芯1号系列结合航空航天、石油等行业特点研制专用芯片,快速打开市场。
中国观察
国际金融