包云崗:基于開源模式的產(chǎn)學(xué)研協(xié)同新機(jī)制探索與實(shí)踐
中國網(wǎng)/中國發(fā)展門戶網(wǎng)訊 2025年1月20日,杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(以下簡稱“DeepSeek公司”)正式發(fā)布DeepSeek-R1模型,并同步開源模型權(quán)重,引起全世界轟動(dòng)及一系列連鎖反應(yīng):英偉達(dá)市值單日暴跌近6 000億美元,降幅高達(dá)17%;DeepSeek APP在全球140個(gè)國家的移動(dòng)應(yīng)用下載量排行榜上位居榜首,僅用7天時(shí)間便實(shí)現(xiàn)新增1億用戶;在全球最大開源平臺(tái)Huggingface上,DeepSeek-R1在1個(gè)月內(nèi)就實(shí)現(xiàn)下載量超過1 000萬次,在全球150萬模型中位列第1,成為Huggingface平臺(tái)最受歡迎的開源大模型;OpenAI、百度也宣布將會(huì)開源各自大模型;各行各業(yè)、各地政府都積極開展本地部署DeepSeek……
DeepSeek大模型取得了舉世矚目的成就,引起國內(nèi)各界諸多思考。例如,李國杰院士通過7個(gè)問題深入剖析了DeepSeek背后所蘊(yùn)含的人工智能(AI)發(fā)展路徑,包括規(guī)模法則(Scaling Law)局限性、通用人工智能(AGI)實(shí)現(xiàn)道路、中國如何實(shí)現(xiàn)AI自立自強(qiáng)等。筆者認(rèn)為,DeepSeek能在全球引起如此巨大轟動(dòng)效應(yīng),至少有2個(gè)關(guān)鍵原因:在達(dá)到全球最頂尖大模型水平下實(shí)現(xiàn)數(shù)量級(jí)級(jí)別的成本降低,展現(xiàn)了技術(shù)先進(jìn)性;通過開源模式在全球大規(guī)??焖贁U(kuò)散,同時(shí)打破國內(nèi)“百模大戰(zhàn)”的局面,成為國內(nèi)大模型“事實(shí)標(biāo)準(zhǔn)”。本文將探討開源模式對于推動(dòng)科技發(fā)展的作用,尤其在促進(jìn)產(chǎn)學(xué)研協(xié)同機(jī)制方面的作用。
以開源凝共識(shí)
DeepSeek公司創(chuàng)始人梁文峰曾在一次采訪中指出,創(chuàng)新需要能組織高密度的人才。筆者對此觀點(diǎn)高度認(rèn)可。如何能組織高密度人才,凝聚共識(shí)至關(guān)重要——思想決定行動(dòng),只有在思想上形成共識(shí),一個(gè)組織的成員才能自發(fā)地朝著共同的目標(biāo)行動(dòng)。然而,不管是要讓成長經(jīng)歷各不相同的個(gè)體形成共識(shí),還是要讓業(yè)務(wù)、管理、文化千差萬別的組織機(jī)構(gòu)達(dá)成共識(shí),都是極具挑戰(zhàn)的任務(wù)。
共識(shí)的形成,需要有各方都認(rèn)同的底層邏輯來支撐。古往今來,人們都是通過探尋客觀規(guī)律來獲得信心乃至信念。如果存在一種揭示世界萬物運(yùn)行的客觀規(guī)律(如牛頓三大定律),那么不同背景的人們就會(huì)相信客觀規(guī)律,從而產(chǎn)生一種信念——只要按照客觀規(guī)律辦事,就會(huì)得到規(guī)律所預(yù)測的結(jié)果——這也便自然形成了共識(shí)。因此,共識(shí)的形成,需要有各方都認(rèn)同的客觀規(guī)律作為底層邏輯來支撐,而非僅靠灌輸主觀意愿所能達(dá)成。
開源是凝聚共識(shí)的一種有效方式,因?yàn)殚_源背后存在客觀規(guī)律的支撐,包括開源符合打破知識(shí)壟斷、促進(jìn)知識(shí)傳播的社會(huì)學(xué)規(guī)律,開源符合“交易成本”“杰文斯效應(yīng)”等經(jīng)濟(jì)學(xué)規(guī)律,等等。這些規(guī)律揭示了開源必將會(huì)作為一種人類社會(huì)所崇尚的活動(dòng)而長期存在,并會(huì)不斷擴(kuò)展到越來越多領(lǐng)域。因此通過開源,能在高密度人才中形成號(hào)召力。
開源打破知識(shí)壟斷,促進(jìn)知識(shí)傳播
眾所周知,在人類文明發(fā)展歷程中,知識(shí)傳播發(fā)揮了決定性作用。相反,知識(shí)若被壟斷則會(huì)影響人類文明的發(fā)展。以中世紀(jì)的歐洲為例,長達(dá)1 000年處于黑暗的文明停滯狀態(tài),正是因?yàn)橹R(shí)被極少數(shù)人壟斷。中世紀(jì)歐洲的知識(shí)傳播載體是羊皮書,成本極貴,導(dǎo)致歐洲在中世紀(jì)書籍十分稀少。普通民眾根本沒有機(jī)會(huì)接觸書籍,于是知識(shí)被教會(huì)和貴族牢牢壟斷。到15世紀(jì),歐洲突然出現(xiàn)了文藝復(fù)興,主要原因又正是造紙術(shù)和印刷術(shù)傳入歐洲,知識(shí)獲取成本驟降百倍,從而對歐洲文明發(fā)展產(chǎn)生了革命性影響。1454—1500年的46年間,歐洲印制的書籍超過1 200萬冊,超過此前1 000年制作的所有書籍?dāng)?shù)量。造紙術(shù)和印刷術(shù)打破了知識(shí)壟斷,賦予了普通人獲得知識(shí)的權(quán)利。
縱觀人類歷史,不同時(shí)代的新知識(shí)呈現(xiàn)出不同的形式,相應(yīng)的載體也隨之變遷(圖1):2 000多年前因?yàn)檩d體的稀缺,只有極少數(shù)人(如中國的諸子百家、古希臘哲學(xué)家等)提出的新思想、新理論才能被記錄在書籍予以傳播,代表那個(gè)時(shí)代人類的創(chuàng)新知識(shí);歐洲的文藝復(fù)興時(shí)代,以伽利略為代表的一批科學(xué)家崇尚用新方法開展實(shí)證科學(xué)研究,得益于印刷術(shù)與造紙術(shù),這些新方法能通過大量學(xué)術(shù)論文的形式記錄、發(fā)表與傳播,大大促進(jìn)了歐洲科學(xué)進(jìn)步;18世紀(jì)第一次工業(yè)革命以來,人類開始熱衷于制造各種復(fù)雜的機(jī)械裝置和精密儀器,尤其是20世紀(jì)中葉進(jìn)入信息時(shí)代,各種復(fù)雜軟件系統(tǒng)呈指數(shù)級(jí)增長。信息時(shí)代以來,人類絕大多數(shù)創(chuàng)新知識(shí)是針對這些復(fù)雜系統(tǒng)的局部優(yōu)化技術(shù),這些新技術(shù)無法孤立地存在,需要集成到系統(tǒng)中才能展現(xiàn)出效果,于是開源系統(tǒng)便成為一種記錄和傳播新方法、新技術(shù)的高效形式,更有利于傳播創(chuàng)新知識(shí)。

通過以上分析可知,新思想、新理論一般通過圖文(著書、論文)形式來記錄和傳播。但是對于新方法、新技術(shù),如果只是用圖文方式來記錄,那么其他人并不容易復(fù)現(xiàn),不利于創(chuàng)新知識(shí)的傳播。因此,開源項(xiàng)目就是一種記錄和傳播“創(chuàng)新知識(shí)”的出色載體,如Linux開源項(xiàng)目的源代碼包含了諸多新方法、新技術(shù),也成為孕育“創(chuàng)新”的沃土。
開源契合市場規(guī)律,加速技術(shù)推廣
開源孕育形成于軟件領(lǐng)域,并不斷拓展到硬件芯片等領(lǐng)域,目前已成為數(shù)字經(jīng)濟(jì)不可或缺的要素。開源模式被業(yè)界廣泛接受,有其經(jīng)濟(jì)學(xué)原理支撐。
第一個(gè)經(jīng)濟(jì)學(xué)原理是交易成本(transaction cost)理論。1991年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主科斯發(fā)現(xiàn),雖然社會(huì)分工可以提升生產(chǎn)效率,但同時(shí)也會(huì)引入“交易成本”。基于“交易成本”理論,若兩種技術(shù)收益相近,那么企業(yè)會(huì)傾向于選擇交易成本更低的技術(shù)。開源能顯著降低交易成本。以DeepSeek為例,各行各業(yè)都在積極接入DeepSeek,正是因?yàn)殚_源省去了交易環(huán)節(jié)與交易成本。因此,一旦存在高質(zhì)量的開源技術(shù),必然會(huì)得到企業(yè)的關(guān)注和應(yīng)用。
第二個(gè)經(jīng)濟(jì)學(xué)理論是杰文斯效應(yīng)(Jevons Effect)。技術(shù)成本降低,將提升技術(shù)的普及度,從而擴(kuò)大市場規(guī)模,這是英國經(jīng)濟(jì)學(xué)家杰文斯在第一次工業(yè)革命中發(fā)現(xiàn)的規(guī)律。他發(fā)現(xiàn)大幅提升蒸汽機(jī)的效率,每臺(tái)蒸汽機(jī)的用煤量減少,但煤總需求量大幅增加,這是因?yàn)檎羝麢C(jī)因使用成本降低而被廣泛應(yīng)用。同樣地,開源模式降低成本,更有利于技術(shù)推廣,促進(jìn)產(chǎn)業(yè)發(fā)展。
綜上所述,開源自身符合市場經(jīng)濟(jì)規(guī)律,可用市場行為來進(jìn)行分析。過去中國經(jīng)常被責(zé)怪是國際開源社區(qū)的“拿來主義者”,核心原因在于還未意識(shí)到開源本身也是一個(gè)市場,需要積極投入推出有競爭力的開源技術(shù),才能贏得開源市場份額。
以開源促合作
如何建立“產(chǎn)—學(xué)—研”高效協(xié)同機(jī)制是我國科技事業(yè)長期以來亟待解決的體制機(jī)制難題。建立高效協(xié)同機(jī)制,關(guān)鍵是要形成一條可持續(xù)運(yùn)轉(zhuǎn)的創(chuàng)新鏈,即“技術(shù)創(chuàng)新→原型驗(yàn)證→樣品研制→產(chǎn)品定型→商品推廣”創(chuàng)新鏈。在該創(chuàng)新鏈中,學(xué)術(shù)界的定位主要是“技術(shù)創(chuàng)新→原型驗(yàn)證”環(huán)節(jié),而產(chǎn)業(yè)界的定位則是“樣品研制→產(chǎn)品定型→商品推廣”。
我國學(xué)術(shù)界與產(chǎn)業(yè)界之間的協(xié)同并未有效打通,往往都卡在“原型驗(yàn)證→樣品研制”環(huán)節(jié),開源可以有效地解決這個(gè)環(huán)節(jié)薄弱的難題。如前所述,開源系統(tǒng)是一種記錄和傳播新知識(shí)的高效形式,因此學(xué)術(shù)界可將創(chuàng)新技術(shù)通過開源系統(tǒng)進(jìn)行呈現(xiàn)。具體可有兩種呈現(xiàn)方式,一種是將創(chuàng)新技術(shù)集成到已有的開源項(xiàng)目中,另一種是直接發(fā)起開源項(xiàng)目來展現(xiàn)創(chuàng)新技術(shù)。高質(zhì)量的開源項(xiàng)目能吸引產(chǎn)業(yè)界參與和投入,于是創(chuàng)新技術(shù)通過開源項(xiàng)目在產(chǎn)業(yè)界得到應(yīng)用,并可獲得產(chǎn)業(yè)界的反饋,從而開展進(jìn)一步的深入研究。如此,一種基于開源模式的產(chǎn)學(xué)研高效協(xié)同機(jī)制便建立起來了。
基于開源模式的創(chuàng)新聯(lián)合體
上述機(jī)制在筆者團(tuán)隊(duì)參與構(gòu)建開源指令集RISC-V生態(tài)的過程中得到了實(shí)踐檢驗(yàn),并取得了積極效果。筆者團(tuán)隊(duì)在中國科學(xué)院戰(zhàn)略性先導(dǎo)科技專項(xiàng)支持下,于2019年發(fā)起高性能RISC-V處理器核“香山”開源項(xiàng)目,吸引了全球眾多頂尖科研院校基于香山開展科研和教學(xué)。目前,“香山”已成為國際開源社區(qū)性能最強(qiáng)、最活躍的處理器核。根據(jù)全球最大開源項(xiàng)目托管平臺(tái)GitHub統(tǒng)計(jì)數(shù)據(jù),“香山”開源項(xiàng)目的星標(biāo)數(shù)高達(dá)6 000余分(表明社區(qū)關(guān)注度與活躍度),遙遙領(lǐng)先其他開源芯片項(xiàng)目,分支數(shù)也超過700。國內(nèi)幾十所高?;蜓芯克凇跋闵健遍_展創(chuàng)新,諸多成果發(fā)表在頂尖會(huì)議與期刊上。
以“香山”開源項(xiàng)目為底座,團(tuán)隊(duì)進(jìn)一步構(gòu)建了“科研院所+新型研發(fā)機(jī)構(gòu)+企業(yè)”開源芯片創(chuàng)新聯(lián)合體(圖2),通過開源模式聯(lián)合企業(yè)開發(fā)共性技術(shù),縮短企業(yè)二次開發(fā)周期,打通產(chǎn)研環(huán)節(jié),形成一條有效運(yùn)轉(zhuǎn)的創(chuàng)新鏈,加速“香山”落地應(yīng)用。其中,中國科學(xué)院計(jì)算技術(shù)研究所等科研院所聚焦“技術(shù)創(chuàng)新→原型驗(yàn)證”環(huán)節(jié),新型研發(fā)機(jī)構(gòu)北京開源芯片研究院(簡稱“開芯院”)聚焦“原型驗(yàn)證→樣品研制”環(huán)節(jié),眾多企業(yè)則聚焦“樣品研制→產(chǎn)品定型→商品推廣”環(huán)節(jié)。這種創(chuàng)新聯(lián)合體機(jī)制實(shí)現(xiàn)了創(chuàng)新鏈不同環(huán)節(jié)的分工與協(xié)作,發(fā)揮各自的優(yōu)勢,并相互補(bǔ)位。

目前,該機(jī)制已開始有效運(yùn)轉(zhuǎn),聯(lián)合企業(yè)形成一支全球規(guī)模最大(超過500人)的RISC-V開源芯片研發(fā)團(tuán)隊(duì),僅2024年企業(yè)聯(lián)合開發(fā)技術(shù)研討即超過100次,大幅加速了核心技術(shù)的研發(fā)和應(yīng)用進(jìn)程,相關(guān)成果量產(chǎn)節(jié)點(diǎn)預(yù)計(jì)提前2年以上。
基于開源模式的科教融合
開源有助于“教育、科技、人才”三位一體的貫徹實(shí)施。基于開源模式,筆者團(tuán)隊(duì)于2019年啟動(dòng)了“一生一芯”計(jì)劃,探索基于開源模式、貫通課程的實(shí)踐型大規(guī)模人才培養(yǎng)計(jì)劃?!耙簧恍尽庇?jì)劃的核心理念是“用開源技術(shù)、做開源芯片、育芯片人才”,即基于開源軟硬件生態(tài)形成處理器芯片人才培養(yǎng)體系,探索“硅上做教學(xué)”。
“一生一芯”計(jì)劃的開源模式體現(xiàn)在3個(gè)方面: 面向全國開放,不論地域、高校、專業(yè)和年級(jí),皆可免費(fèi)參與——線上報(bào)名后,先以線上學(xué)習(xí)為主,再擇優(yōu)到線下基地高強(qiáng)度訓(xùn)練;所有學(xué)習(xí)資料開源開放,任何人都可免費(fèi)獲取,包括42萬字講義、1 000頁幻燈片與50小時(shí)的教學(xué)視頻;學(xué)習(xí)過程采用開源芯片與開源軟件技術(shù)體系,包括開源指令集RISC-V、開源操作系統(tǒng)、開源編譯器、開源電子設(shè)計(jì)自動(dòng)化(EDA)工具鏈等。
“一生一芯”計(jì)劃的開源模式產(chǎn)生了4個(gè)方面積極影響:極大地降低了學(xué)生獲取芯片教學(xué)資源的門檻。開展5年來,“一生一芯”計(jì)劃累計(jì)報(bào)名超10 000人,覆蓋800余所高校,培養(yǎng)處理器芯片實(shí)踐型人才超1 500人(圖3)。促進(jìn)開源芯片生態(tài)的發(fā)展。“一生一芯”學(xué)員們在學(xué)習(xí)芯片設(shè)計(jì)過程中,大量使用開源EDA工具鏈、開源IP等開源技術(shù)并及時(shí)反饋問題,這促進(jìn)了開源技術(shù)的迭代演進(jìn)。為開源領(lǐng)域積聚人才。許多學(xué)生通過參加“一生一芯”計(jì)劃接觸到開源芯片并高度認(rèn)同開源理念,從而在后續(xù)的科研與工作中更愿意從事開源相關(guān)的工作。通過開源教育推動(dòng)國際合作。如今越來越多的國家出現(xiàn)芯片人才培養(yǎng)需求,中國通過開源方式可以為這些國家提供相關(guān)國際公共品,促進(jìn)國際交流合作。

DeepSeek讓各界看到開源的價(jià)值與意義,通過開源實(shí)現(xiàn)在全球快速擴(kuò)散。DeepSeek的案例展示了開源作為一種商業(yè)模式、一種生態(tài)構(gòu)建方式的威力。但開源的價(jià)值與意義不只是局限于商業(yè),它還是一種凝聚共識(shí)、促進(jìn)合作的有效方式。正如孫凝暉院士表示,開源模式蘊(yùn)含著一種精神——一種共享共治的精神,一種打破壟斷、開放創(chuàng)新的精神,一種鼓勵(lì)奉獻(xiàn)的精神。
(作者:包云崗,中國科學(xué)院計(jì)算技術(shù)研究所 中國科學(xué)院大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院?!吨袊茖W(xué)院院刊》供稿)







