僅僅4個(gè)月!五位本科生“造芯”畢業(yè)
“一生一芯”計(jì)劃負(fù)責(zé)人包雲(yún)崗展示芯片受訪者供圖
芯片設(shè)計(jì)類似於畫一張大樓的施工圖紙。隻不過,呈現(xiàn)這張圖紙,用的不是線條,而是一種叫做Chisel的硬件語言。
“如何評(píng)價(jià)中國科學(xué)院大學(xué)(以下簡稱國科大)‘一生一芯’計(jì)劃?”在某問答網(wǎng)站上,這個(gè)問題獲得了超千萬的關(guān)注熱度。
五位本科生,主導(dǎo)完成了一款64位RISC-V處理器SoC芯片設(shè)計(jì)並實(shí)現(xiàn)流片。這款芯片,被稱作他們的 “最硬核畢業(yè)証書”。
和芯片有關(guān)的新聞,總能牽動(dòng)國人的心。而當(dāng)主角成為幾個(gè)“帶芯畢業(yè)”二十出頭的年輕人,就更加引人好奇。網(wǎng)上的聲音多種多樣,有人鼓掌,有人唱衰,有人將它和中國芯片產(chǎn)業(yè)聯(lián)系起來,寫了洋洋灑灑長篇分析。
如今,五位學(xué)生已經(jīng)開始了新的工作。他們正在深圳,參與新的更高性能芯片的設(shè)計(jì)。
8月中旬,他們還多了個(gè)新身份——第二期“一生一芯”計(jì)劃的助教。
“一生一芯”:本科生做芯片不是天方夜譚
芯片是今年五月底快遞到王華強(qiáng)家的。
它大概一元硬幣大小,上面刻著 “COOSCA-01”和“一生一芯”的字樣,還有國科大的Logo。
COOSCA是一個(gè)內(nèi)部代號(hào),是國科大計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院的三門課程——計(jì)算機(jī)組成原理、操作系統(tǒng)和計(jì)算機(jī)架構(gòu)的縮寫。“一生一芯”則是計(jì)劃的名字,意思是讓每位本科生帶著自己設(shè)計(jì)的處理器芯片畢業(yè)。
受新冠肺炎疫情影響,今年國科大的本科畢業(yè)答辯在線上進(jìn)行。王華強(qiáng)代表“一生一芯”團(tuán)隊(duì),向答辯委員會(huì)的老師遠(yuǎn)程展示了芯片。他把芯片裝上測(cè)試板,用串口線將測(cè)試板與電腦連接,打開電腦上的終端軟件,按下測(cè)試板上的復(fù)位鍵,運(yùn)行了幾個(gè)簡單的程序——Linux系統(tǒng)跑起來了。
然而,去年夏天,“一生一芯”計(jì)劃參與者張紫飛第一次聽到該計(jì)劃時(shí)的第一反應(yīng)卻是“天方夜譚吧”。讓幾個(gè)本科生用幾個(gè)月時(shí)間,設(shè)計(jì)出一枚能夠運(yùn)行Linux這樣復(fù)雜操作系統(tǒng)的芯片,可能嗎?
“一生一芯”計(jì)劃負(fù)責(zé)人、國科大計(jì)算機(jī)學(xué)院教授、中國科學(xué)院計(jì)算所先進(jìn)計(jì)算機(jī)系統(tǒng)研究中心主任包雲(yún)崗則覺得,在開源時(shí)代,將芯片設(shè)計(jì)的門檻降下來,是可能的。
包雲(yún)崗對(duì)2008年至2017年計(jì)算機(jī)體系結(jié)構(gòu)國際頂級(jí)會(huì)議論文第一作者做過分析,隻有4%來自中國的高校和科研院所。中國的處理器芯片設(shè)計(jì)界,缺人。
開放指令集RISC-V與芯片敏捷開發(fā)語言Chisel,能使開發(fā)效率數(shù)量級(jí)提升。RISC-V,正是包雲(yún)崗近幾年的研究重心。這一指令集可以自由地用於任何目的,允許任何人設(shè)計(jì)、制造和銷售RISC-V芯片和軟件。
2018年時(shí),包雲(yún)崗就隱約意識(shí)到,RISC-V對(duì)人才培養(yǎng)會(huì)有幫助。2019年5月,華為被美國商務(wù)部列入實(shí)體名單,人才危局必須盡快找到出路。包雲(yún)崗迅速將他模糊的想法細(xì)化:讓學(xué)生學(xué)習(xí)並實(shí)踐芯片敏捷設(shè)計(jì)方法,參與芯片設(shè)計(jì)實(shí)現(xiàn),通過大學(xué)流片計(jì)劃完成芯片制造。
如果學(xué)生能帶著他們自己設(shè)計(jì)的芯片實(shí)物畢業(yè),這會(huì)是最特別的畢業(yè)紀(jì)念。
2019年8月,“一生一芯”計(jì)劃正式啟動(dòng)。包雲(yún)崗將之稱為一次教學(xué)實(shí)踐。國科大校領(lǐng)導(dǎo)認(rèn)為,它會(huì)掀起本科教學(xué)改革的新篇章。
五位參與的學(xué)生是金越、王華強(qiáng)、王凱帆、張林雋和張紫飛,他們都是國科大計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院2016級(jí)本科生,那時(shí)也都已通過了中國科學(xué)院計(jì)算技術(shù)研究所的保研夏令營,成為首批吃螃蟹的人。
在王華強(qiáng)看來,如果能用自己做的芯片運(yùn)行自己寫的操作系統(tǒng),“很浪漫”。
計(jì)算機(jī)體系結(jié)構(gòu)是一個(gè)古老但依然生機(jī)勃勃的領(lǐng)域?!拔覀儸F(xiàn)在用的很多東西都是很多年前的成果。隨著科技的發(fā)展和國內(nèi)外形勢(shì)的變化,我個(gè)人認(rèn)為,在體系結(jié)構(gòu)上應(yīng)該還有廣闊的探索空間。”王華強(qiáng)喜歡動(dòng)手實(shí)操。就算做出來的只是個(gè)玩具,自己親手打磨的東西,還是不一樣。
在熱鬧的計(jì)算機(jī)行業(yè)中,這些偏好體系結(jié)構(gòu)的學(xué)生,想找到那些更堅(jiān)固的東西,抓住,並且堅(jiān)持下去。
踩坑、挖坑,再從坑裡爬出來
其實(shí),在學(xué)生們面前的,是一條未有人走過的路。
難度究竟如何,耗時(shí)需要多久,可能會(huì)有什麼坑……通通都是未知數(shù)。沒有導(dǎo)航,他們需要自己打怪升級(jí),自己試錯(cuò)嘗試。
當(dāng)然,他們也並非是在白紙上作畫。
教師團(tuán)隊(duì)已經(jīng)制定了總體方案,確定了技術(shù)路線,選擇好了基礎(chǔ)平臺(tái),搭建了開發(fā)環(huán)境,也選定了流片工藝和班車。五位學(xué)生真正動(dòng)手之前,一支實(shí)力強(qiáng)大的教師團(tuán)隊(duì),為學(xué)生的乘風(fēng)破浪,做好了保駕護(hù)航的準(zhǔn)備。
做芯片,其實(shí)分為前端和后端。前端主要是做設(shè)計(jì),用數(shù)字電路的方式實(shí)現(xiàn)處理器的功能﹔后端則是用物理元件來實(shí)現(xiàn)這些設(shè)計(jì)。
“要說芯片都是我們做的,並不準(zhǔn)確。其實(shí)我們只是做了前端的邏輯設(shè)計(jì)部分?!蓖鮿P帆強(qiáng)調(diào)。
他嘗試用最通俗的語言向科技日?qǐng)?bào)記者解釋設(shè)計(jì)芯片是怎麼一回事——類似於畫一張大樓的施工圖紙。隻不過,呈現(xiàn)這張圖紙,用的不是線條,而是一種叫做Chisel的硬件語言。
此前,包雲(yún)崗團(tuán)隊(duì)中的博士生余子濠為南京大學(xué)開發(fā)了一款教學(xué)用RISC-V處理器,“一生一芯”計(jì)劃的學(xué)生要在此基礎(chǔ)上進(jìn)行改進(jìn),把師兄搭建的房子,改建得更舒服、更亮堂。
包雲(yún)崗說,在實(shí)際產(chǎn)品研發(fā)和科研工作中,也往往不是從頭開始,更多是在已有基礎(chǔ)上,增加新功能,提高性能?!斑@培養(yǎng)的是學(xué)生‘理解—消化—?jiǎng)?chuàng)新’的能力。”
大家採用了當(dāng)下流行的“敏捷開發(fā)”模式:每人負(fù)責(zé)一個(gè)或幾個(gè)模塊,齊頭並進(jìn),多線推進(jìn),然后合龍。
“一生一芯”計(jì)劃的目標(biāo)很明確:在芯片上運(yùn)行Linux系統(tǒng),支持基本的輸入輸出設(shè)備。
先解決“能不能”“對(duì)不對(duì)”的問題,再來看“快不快”“好不好”。
對(duì)新手施工設(shè)計(jì)團(tuán)隊(duì)來說,他們蓋的第一棟房子,要保証的是屹立不倒。“要是哪面牆放錯(cuò)了地方,或者牆體本身設(shè)計(jì)的承重強(qiáng)度不夠,整棟樓也就塌了。”王凱帆說。
從2019年8月正式動(dòng)手設(shè)計(jì),到12月中旬交付設(shè)計(jì)圖紙,五人組踩過坑,給別人挖過坑,也掙扎著從坑裡爬出來過﹔他們?cè)疽购筒恢阍谀难e的錯(cuò)誤死磕,還要對(duì)抗可能拖延隊(duì)友進(jìn)度的焦慮。
團(tuán)隊(duì)成員金越負(fù)責(zé)的是片上系統(tǒng)。除了中央處理器,在系統(tǒng)內(nèi)還有五個(gè)控制器來實(shí)現(xiàn)具體功能?!熬拖翊竽X需要控制四肢讓人體運(yùn)動(dòng)一樣?!苯鹪秸f。
這些控制器的代碼是由開源社區(qū)提供的,但團(tuán)隊(duì)並不清楚這些控制器是否適合他們?cè)O(shè)計(jì)的這款芯片。金越需要編寫驅(qū)動(dòng)軟件,測(cè)試外設(shè)控制器是否設(shè)置正確,能否正常工作。
“要是出現(xiàn)問題就很麻煩了。到底是我的軟件寫錯(cuò)了,還是外設(shè)控制器本身有問題?如果是外設(shè)控制器有問題,到底是哪個(gè)有問題?”變量太多,排列組合下來,測(cè)試復(fù)雜得讓人頭疼。
“做驗(yàn)証的那幾天,幾乎沒怎麼睡過覺?!苯鹪桨胍箤?duì)著電腦,查手冊(cè),查代碼,查波形,懷著點(diǎn)“我就不信邪”的不忿:“我一定要把這個(gè)東西弄出來?!?/p>
導(dǎo)師團(tuán)隊(duì)可以為迷茫的學(xué)生指出大概的方向,但這個(gè)方向上會(huì)碰到什麼,要上山還是要過河,還是得靠學(xué)生自己嘗試。
尋找問題究竟出在哪,是幾乎每個(gè)計(jì)劃參與者都會(huì)提到的“痛苦”經(jīng)歷。王華強(qiáng)說,這就是一個(gè)“按下葫蘆起了瓢”的過程。
作為團(tuán)隊(duì)唯一的女將,張林雋負(fù)責(zé)的部分是預(yù)取器。你進(jìn)入了一間圖書館,想找到一本書??磕阕罱臅埽芊诺臅钌侃r而更深處的書架,放的書更多,但你走過去的耗時(shí)也長。預(yù)取器好比那位了解你喜好的圖書管理員,他提前將他認(rèn)為你會(huì)拿的書放在離你最近的書架,節(jié)省你的查找時(shí)間。
“在實(shí)現(xiàn)這個(gè)功能的時(shí)候,我想當(dāng)然地認(rèn)為,預(yù)取器應(yīng)該放在L1 Cache也就是一級(jí)緩存內(nèi)?!币患?jí)緩存,相當(dāng)於那個(gè)離你更近的但是容量更少的書架。但奇怪的是,加入預(yù)取器后,芯片的性能反而受到了影響,芯片的信息處理速度變慢了。
她花了一個(gè)月的時(shí)間來找問題,一個(gè)一個(gè)排查、修改和調(diào)試。后來,張林雋被提醒說,可能是預(yù)取器放置的位置不對(duì)?!鞍?,很崩潰,之前寫的東西就沒用了,又要重來?!睂㈩A(yù)取器挪到二級(jí)緩存后,困擾她一個(gè)月的問題終於消失了。
在真正動(dòng)手之前,沒人想過,問題竟然會(huì)在這等著他們。
學(xué)生們?cè)诳偨Y(jié)時(shí)寫道,課程作業(yè)就像直接給人採摘的果園,“一生一芯”計(jì)劃卻是給一片荒地和幾棵樹苗,從開墾種植到施肥都要自己動(dòng)手,並且還不知道這樣能不能結(jié)出果實(shí)?!安恢獮楹?,從0開始種出的果實(shí)好像要更甜一些。”他們說。
“我們只是知道了從山底到半山腰的路怎麼走”
2019年12月,這款芯片的設(shè)計(jì)版圖正式提交,基於中芯國際110nm工藝完成投片。
對(duì)五位學(xué)生來說,他們的工作也暫時(shí)告一段落。接下來的重心,是完成以芯片為基礎(chǔ)的畢業(yè)設(shè)計(jì)。
正式流片之前,團(tuán)隊(duì)已經(jīng)在模擬機(jī)上反復(fù)測(cè)試過多次。但仍然沒人能打包票,芯片就一定能實(shí)現(xiàn)預(yù)期的功能。
平時(shí)上課或者比賽,學(xué)生也需要從零開始完成一次芯片設(shè)計(jì)。但在課堂實(shí)踐中,並不需要測(cè)試得太完備,隻要設(shè)計(jì)出的芯片能通過老師給的幾個(gè)測(cè)試點(diǎn),就算成功。在“一生一芯”計(jì)劃中,沒有這些被預(yù)先設(shè)計(jì)好的“測(cè)試點(diǎn)”。你必須考慮全面,細(xì)心謹(jǐn)慎。
“即使測(cè)試了這麼多次,你也不能說這個(gè)系統(tǒng)一定沒有bug(缺陷),總有一些邊邊角角沒有測(cè)試到的地方,總會(huì)有意想不到的問題?!睆堊巷w說。畢竟,在此前四個(gè)月的開發(fā)中,他們已經(jīng)見識(shí)過各種稀奇古怪的情況。
無可否認(rèn)的是,壓力更大。
此前的芯片設(shè)計(jì),更像是“紙上談兵”,成功了固然好,失敗了好像也無所謂。但是這次,投入真金白銀去流片,能不能用,幾個(gè)月的努力會(huì)不會(huì)打水漂,流片后就能見分曉。
這是第一期“一生一芯”計(jì)劃,大家都希望能開個(gè)好頭。等待的日子,他們忐忑又興奮。
2020年4月23日,學(xué)生們從微信群裡得知,他們親手設(shè)計(jì)的處理器芯片返回了。
但這並不是終點(diǎn),還需要進(jìn)行測(cè)試驗(yàn)証。
“從底層PCB版圖、內(nèi)存顆粒到中間處理器設(shè)計(jì)、再到上層操作系統(tǒng)、應(yīng)用軟件,每個(gè)層次都可能出問題。哪怕一個(gè)小問題,都會(huì)造成芯片無法正常工作?!卑?yún)崗說。
這段測(cè)試經(jīng)歷,同樣也是一波三折,甚至有點(diǎn)戲劇性。
芯片回來后,團(tuán)隊(duì)裡的老師們上手測(cè)試了幾顆,結(jié)果芯片真的就是塊“磚”,沒有任何輸出。一陣忙亂后他們才發(fā)現(xiàn),原來是主板上的一根電源線接錯(cuò)了,芯片“出師未捷身先死”,被燒壞了。
后來,又因?yàn)橐粋€(gè)串口時(shí)鐘頻率設(shè)置問題,芯片性能始終不正常。折騰了一段時(shí)間,芯片才被調(diào)整到最佳狀態(tài)。
6月2日,在畢業(yè)答辯現(xiàn)場(chǎng),王華強(qiáng)展示了芯片的工作流程。后來,王凱帆還將國科大操作系統(tǒng)課程上同學(xué)們自己編寫的UCAS-Core移植到了COOSCA核上,完成了用自己寫的CPU運(yùn)行自己寫的操作系統(tǒng)這件“浪漫”的事。
其實(shí),除了王華強(qiáng)外,其他四位同學(xué)是暑期到深圳參與新項(xiàng)目后,才看到自己設(shè)計(jì)的芯片的。張紫飛說:“第一次看到時(shí)就覺得,這芯片比我們想象得小啊,好像還有點(diǎn)簡陋?!贝蠹叶夹α?,他又立刻補(bǔ)充,“但是母不嫌兒丑嘛”。
國科大的學(xué)生將自己的母校簡稱為“果殼”,所以,果殼(nutshell)也就成了“一生一芯”計(jì)劃首款芯片的正式名字。9月3日,王華強(qiáng)將代表團(tuán)隊(duì)向全球同行介紹“果殼”的設(shè)計(jì),這也將是“果殼”首次在國際舞臺(tái)上亮相。
“國科大學(xué)生硬核畢業(yè)証書”一度成為網(wǎng)上的熱議話題,但被當(dāng)成“大神”膜拜的幾位學(xué)生,無意將這一項(xiàng)目做過多拔高。
“我們現(xiàn)在看英特爾芯片,就像剛上學(xué)時(shí)看‘一生一芯’芯片一樣。畢竟這些公司積累了幾十年的經(jīng)驗(yàn),我們現(xiàn)在隻學(xué)到了皮毛,完全沒法比?!睆埩蛛h說得坦誠。金越則打了個(gè)比方:“現(xiàn)在,我們只是知道了從山底到半山腰的路有多難走,還不知道從半山腰到山頂?shù)穆酚卸嚯y走?!?/p>
也正是因?yàn)榕蔬^山、爬過坡,學(xué)生們知道自己都是新兵,經(jīng)驗(yàn)和能力上都有欠缺,還需淬煉。
他們的平均年齡,隻有21.8歲。包雲(yún)崗說,等他們30歲時(shí),就可以說已經(jīng)是處理器芯片和計(jì)算機(jī)系統(tǒng)設(shè)計(jì)領(lǐng)域的“老兵”了。無論他們是進(jìn)入業(yè)界還是學(xué)界,創(chuàng)造力會(huì)得到更大的發(fā)揮和展現(xiàn)。“我對(duì)這批年輕人的未來充滿期待?!?/p>
“一生一芯”計(jì)劃瞄準(zhǔn)的也正是未來。
國科大計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院院長、中國科學(xué)院計(jì)算技術(shù)研究所所長孫凝暉指出,這個(gè)計(jì)劃想幫助更多高校形成從處理器芯片設(shè)計(jì)到流片並運(yùn)行操作系統(tǒng)的實(shí)踐課程,提高我國處理器芯片設(shè)計(jì)人才培養(yǎng)規(guī)模,縮短人才從培養(yǎng)階段到投入科研與產(chǎn)業(yè)一線的周期。
據(jù)包雲(yún)崗介紹,參與“一生一芯”計(jì)劃二期的學(xué)生增加到13位,除了國科大外,還有來自浙江大學(xué)、南京大學(xué)、西北工業(yè)大學(xué)、哈爾濱工業(yè)大學(xué)(深圳)和美國密歇根州立大學(xué)等五所高校的同學(xué)。
分享讓更多人看到