色播视频在线观看,亚洲色一色噜一噜噜噜v,国产婬乱a一级毛片多女,狂喷潮视频在线观看mp4

分享到:
鏈接已復(fù)制

LANGUAGES

新聞

新聞直播 要聞 國(guó)際 軍事 政協(xié) 政務(wù) 圖片 視頻

財(cái)經(jīng)

財(cái)經(jīng) 金融 證券 汽車(chē) 科技 消費(fèi) 能源 地產(chǎn) 農(nóng)業(yè)

觀點(diǎn)

觀點(diǎn) 理論 智庫(kù) 中國(guó)3分鐘 中國(guó)訪談 中國(guó)網(wǎng)評(píng) 中國(guó)關(guān)鍵詞

文化

文化 文創(chuàng) 藝術(shù) 時(shí)尚 旅游 鐵路 悅讀 民藏 中醫(yī) 中國(guó)瓷

國(guó)情

國(guó)情 助殘 一帶一路 海洋 草原 灣區(qū) 聯(lián)盟 心理 老年

首頁(yè)> 中國(guó)發(fā)展門(mén)戶(hù)網(wǎng)> 本網(wǎng)獨(dú)家>

推動(dòng)我國(guó)大模型開(kāi)源創(chuàng)新生態(tài)建設(shè)的挑戰(zhàn)與建議

2024-10-04 15:10

來(lái)源:中國(guó)網(wǎng)·中國(guó)發(fā)展門(mén)戶(hù)網(wǎng)

分享到:
鏈接已復(fù)制
字體:

中國(guó)網(wǎng)/中國(guó)發(fā)展門(mén)戶(hù)網(wǎng)訊 大模型的涌現(xiàn)和同質(zhì)化能力不僅將大幅提升人類(lèi)的認(rèn)知效率,還將引發(fā)經(jīng)濟(jì)、社會(huì)、文化等領(lǐng)域的變革與重塑。世界主要國(guó)家爭(zhēng)相加快推進(jìn)大模型發(fā)展,探索大模型發(fā)展的有效路徑成為當(dāng)前關(guān)注的焦點(diǎn)。美國(guó)大模型開(kāi)源創(chuàng)新生態(tài)的繁榮是其技術(shù)和產(chǎn)業(yè)發(fā)展始終走在前列的重要原因。一方面,大量開(kāi)源的基礎(chǔ)大模型層出不窮,不斷推動(dòng)底層技術(shù)性能的進(jìn)步。例如,以開(kāi)放式大語(yǔ)言預(yù)訓(xùn)練模型OPT、GPT-NeoX-20B等為代表的早期開(kāi)源大模型的推出促進(jìn)了開(kāi)源社區(qū)對(duì)大模型的研究,美國(guó)OpenAI公司推出的GPT大模型的早期版本也完全開(kāi)源。開(kāi)源情況下,研發(fā)者能直接接觸具有前沿性能的大模型,通過(guò)對(duì)已有開(kāi)源大模型進(jìn)行微調(diào)或者采用更大、更高質(zhì)量數(shù)據(jù)集及更大規(guī)模模型參數(shù)創(chuàng)建性能更優(yōu)的基礎(chǔ)大模型,推動(dòng)開(kāi)源大模型技術(shù)性能快速進(jìn)步。另一方面,以開(kāi)源大模型為基礎(chǔ)的開(kāi)源應(yīng)用不斷出現(xiàn),推動(dòng)大模型產(chǎn)業(yè)的壯大。以AI(人工智能)繪畫(huà)生成工具Stable Diffusion為代表的開(kāi)源大模型形成了廣泛的用戶(hù)社區(qū),衍生出極具多樣性的應(yīng)用場(chǎng)景,打開(kāi)了大模型產(chǎn)業(yè)應(yīng)用的想象空間。

與之相比,盡管我國(guó)部分大模型性能突出,但大模型上下游產(chǎn)業(yè)鏈各個(gè)環(huán)節(jié)缺乏協(xié)同,存在競(jìng)爭(zhēng)無(wú)序和資源浪費(fèi)現(xiàn)象。一方面,存在大量未開(kāi)源的低質(zhì)量大模型,導(dǎo)致低水平重復(fù)建設(shè),難以真正推動(dòng)我國(guó)大模型的發(fā)展;另一方面,大模型上游涉及的數(shù)據(jù)、算力,以及下游涉及的應(yīng)用,均未能建立起真正的開(kāi)源開(kāi)放生態(tài),阻礙了我國(guó)大模型產(chǎn)業(yè)的發(fā)展。這一狀態(tài)將影響我國(guó)大模型產(chǎn)業(yè)的可持續(xù)發(fā)展,難以保障我國(guó)科技安全和產(chǎn)業(yè)鏈安全。

經(jīng)驗(yàn)表明,開(kāi)源創(chuàng)新生態(tài)能幫助匯聚全球開(kāi)發(fā)者智慧以推動(dòng)大模型技術(shù)進(jìn)步,并激發(fā)社會(huì)創(chuàng)新活力加快大模型應(yīng)用落地,能夠憑借開(kāi)源開(kāi)放這一全球公認(rèn)的突破科技?jí)艛嗷蛑萍s的有力手段推動(dòng)我國(guó)大模型及相關(guān)產(chǎn)業(yè)發(fā)展。然而,現(xiàn)有研究缺乏對(duì)大模型開(kāi)源創(chuàng)新生態(tài)的關(guān)注。本文從上游供應(yīng)生態(tài)、下游應(yīng)用生態(tài)和治理協(xié)調(diào)生態(tài)3個(gè)維度回顧開(kāi)源創(chuàng)新生態(tài)構(gòu)建的相關(guān)經(jīng)驗(yàn);從關(guān)系到大模型性能的底層算法、數(shù)據(jù)和算力維度,大模型下游產(chǎn)業(yè)生態(tài)搭建現(xiàn)狀,大模型開(kāi)源治理體系,以及政府系統(tǒng)協(xié)同政策推動(dòng)方面,分析目前我國(guó)大模型開(kāi)源創(chuàng)新生態(tài)構(gòu)建存在的問(wèn)題;在此基礎(chǔ)上,提出構(gòu)建開(kāi)源創(chuàng)新生態(tài)推動(dòng)大模型產(chǎn)業(yè)發(fā)展的相關(guān)對(duì)策建議。

開(kāi)源創(chuàng)新生態(tài)對(duì)發(fā)展我國(guó)大模型的重要意義

大模型是指包含超大規(guī)模參數(shù)(通常在10億個(gè)以上)的深度學(xué)習(xí)或機(jī)器學(xué)習(xí)模型,具有基礎(chǔ)資源門(mén)檻高、產(chǎn)業(yè)集群效應(yīng)強(qiáng)和潛在壟斷性大等特點(diǎn),后發(fā)企業(yè)難以快速形成行業(yè)積累實(shí)現(xiàn)追趕。開(kāi)發(fā)貢獻(xiàn)者、行業(yè)開(kāi)源者、開(kāi)源使用者等多元?jiǎng)?chuàng)新主體基于開(kāi)放、協(xié)作和共享理念,圍繞數(shù)字基礎(chǔ)設(shè)施構(gòu)建協(xié)同創(chuàng)新和價(jià)值共創(chuàng)的開(kāi)源創(chuàng)新生態(tài),有助于整合資源降低大模型研發(fā)成本,匯聚眾智促進(jìn)大模型技術(shù)迭代演進(jìn),形成相對(duì)競(jìng)爭(zhēng)優(yōu)勢(shì),從而有效推動(dòng)大模型的發(fā)展與趕超。

整合底層基礎(chǔ)資源,降低行業(yè)研發(fā)成本

大模型往往需要大量的訓(xùn)練數(shù)據(jù)、多種不同的學(xué)習(xí)任務(wù)及強(qiáng)大的計(jì)算資源支撐,致使訓(xùn)練成本巨大(例如,GPT-3的訓(xùn)練據(jù)估計(jì)花費(fèi)超過(guò)4 600萬(wàn)美元)。開(kāi)源創(chuàng)新生態(tài)一方面能夠促進(jìn)基礎(chǔ)數(shù)據(jù)資源的自由流動(dòng)和高速聚集整合,從頂層設(shè)計(jì)上擴(kuò)大數(shù)據(jù)規(guī)模、提高數(shù)據(jù)質(zhì)量和多樣性,加強(qiáng)中文數(shù)據(jù)的標(biāo)準(zhǔn)化集成和持續(xù)積累優(yōu)化,為大模型算法和技術(shù)研發(fā)提供數(shù)據(jù)保障;另一方面可以提供基礎(chǔ)的大模型算法技術(shù)并促進(jìn)算力基礎(chǔ)設(shè)施的共建共用,以低成本的開(kāi)放協(xié)作模式推動(dòng)開(kāi)發(fā)者充分探索參數(shù)、數(shù)據(jù)和算力組合情況下的性能表現(xiàn),推動(dòng)大模型整體的改進(jìn)創(chuàng)新。由此,開(kāi)源創(chuàng)新生態(tài)能夠通過(guò)數(shù)據(jù)共享、算法開(kāi)源、算力基礎(chǔ)設(shè)施共建共用等方式,解決大模型研發(fā)和應(yīng)用中單一機(jī)構(gòu)難以完全滿(mǎn)足數(shù)據(jù)、算法和算力資源要求的問(wèn)題,從而降低企業(yè)乃至全社會(huì)商業(yè)化大模型的成本??梢?jiàn),開(kāi)源創(chuàng)新生態(tài)有助于打破壟斷、降低大模型技術(shù)研發(fā)和優(yōu)化的競(jìng)爭(zhēng)壁壘,提高大模型數(shù)據(jù)和算力等基礎(chǔ)設(shè)施的使用效率,加速推動(dòng)我國(guó)大模型技術(shù)的創(chuàng)新發(fā)展及快速應(yīng)用。

推動(dòng)技術(shù)透明可信,促進(jìn)技術(shù)迭代創(chuàng)新

大模型高昂的研發(fā)成本限制了學(xué)術(shù)界、非營(yíng)利組織和較小規(guī)模工業(yè)實(shí)驗(yàn)室研究人員對(duì)大模型的研究和訪問(wèn);不僅如此,閉源的大模型研發(fā)過(guò)程大幅降低了技術(shù)透明度和可信度,難以匯聚社會(huì)多方力量深化對(duì)大模型技術(shù)相關(guān)道德倫理風(fēng)險(xiǎn)的認(rèn)知,進(jìn)而阻礙大模型技術(shù)在各行業(yè)中的落地應(yīng)用。大模型開(kāi)源創(chuàng)新生態(tài)能降低各方潛在參與者參與大模型研究的難度,使得研究者更好理解大模型工作原理,提升社會(huì)對(duì)大模型應(yīng)用接受度。同時(shí),大模型的發(fā)展具有較強(qiáng)的產(chǎn)業(yè)集群效應(yīng)(圖1),開(kāi)源創(chuàng)新生態(tài)有助于數(shù)據(jù)、算法和算力全方位協(xié)同,供應(yīng)商、從業(yè)人員、平臺(tái)、服務(wù)、數(shù)據(jù)和生產(chǎn)有效結(jié)合,加快大模型在各個(gè)產(chǎn)業(yè)中的應(yīng)用,促進(jìn)從模型層、中間層到應(yīng)用層的多元主體價(jià)值共創(chuàng)。開(kāi)源開(kāi)放有助于建立社會(huì)對(duì)大模型技術(shù)的信任,推動(dòng)不同級(jí)別大模型在各個(gè)行業(yè)的應(yīng)用,而通過(guò)廣泛應(yīng)用場(chǎng)景積累的技術(shù)需求和技術(shù)問(wèn)題將反哺大模型技術(shù)本身,推動(dòng)大模型技術(shù)迭代發(fā)展。

以非對(duì)稱(chēng)競(jìng)爭(zhēng)優(yōu)勢(shì),打破潛在行業(yè)壟斷

開(kāi)源開(kāi)放是全球公認(rèn)的突破科技?jí)艛嗷蛑萍s的有力手段,推動(dòng)大模型開(kāi)源創(chuàng)新生態(tài)建設(shè)不僅將為我國(guó)大模型技術(shù)提供新的發(fā)展機(jī)遇,還有望推動(dòng)我國(guó)大模型產(chǎn)業(yè)出海,打破潛在行業(yè)壟斷,化被動(dòng)為主動(dòng)?!拔④沇indows+OpenAI大模型+英偉達(dá)GPU”通過(guò)強(qiáng)強(qiáng)聯(lián)合綁定形成新的壟斷生態(tài),阻礙我國(guó)信創(chuàng)產(chǎn)業(yè)發(fā)展、威脅我國(guó)信創(chuàng)產(chǎn)業(yè)的科技安全和產(chǎn)業(yè)鏈安全。大模型開(kāi)源創(chuàng)新生態(tài)能充分發(fā)揮我國(guó)在開(kāi)源芯片等領(lǐng)域的技術(shù)優(yōu)勢(shì),并通過(guò)集中攻關(guān)開(kāi)辟新賽道形成非對(duì)稱(chēng)競(jìng)爭(zhēng)優(yōu)勢(shì)。同時(shí),推動(dòng)我國(guó)大模型開(kāi)源創(chuàng)新生態(tài)在全球大模型生態(tài)中占據(jù)一席之地,可為我國(guó)大模型技術(shù)在其他國(guó)家的應(yīng)用提供良好契機(jī)。這能夠打破國(guó)外大模型的潛在壟斷生態(tài),擺脫對(duì)歐美科技基于封閉知識(shí)產(chǎn)權(quán)的“非對(duì)稱(chēng)依賴(lài)”。既往發(fā)展經(jīng)驗(yàn)表明,構(gòu)建開(kāi)源創(chuàng)新生態(tài)不僅能推動(dòng)上下游相關(guān)產(chǎn)業(yè)健康有序協(xié)同發(fā)展,還能掌握一定技術(shù)發(fā)展路線話語(yǔ)權(quán)和主導(dǎo)權(quán),使我國(guó)軟件產(chǎn)業(yè)牢牢嵌套在國(guó)際整體生態(tài)之中,打破制約壟斷。

構(gòu)建開(kāi)源創(chuàng)新生態(tài)的國(guó)際經(jīng)驗(yàn)

開(kāi)源運(yùn)動(dòng)從軟件代碼的公開(kāi)協(xié)作開(kāi)始,其開(kāi)放共享的理念逐步擴(kuò)散到計(jì)算機(jī)及相關(guān)產(chǎn)業(yè)的方方面面。越來(lái)越多來(lái)自全球的個(gè)人開(kāi)發(fā)者和組織積極投身到開(kāi)源運(yùn)動(dòng)中,數(shù)十年間國(guó)際上圍繞開(kāi)源逐步構(gòu)建起穩(wěn)固完善的上游供應(yīng)生態(tài)、豐富多元的下游應(yīng)用生態(tài)和公開(kāi)有效的治理協(xié)調(diào)生態(tài),其發(fā)展經(jīng)驗(yàn)值得借鑒以構(gòu)建我國(guó)大模型開(kāi)源創(chuàng)新生態(tài)。

構(gòu)建穩(wěn)固完善的開(kāi)源上游供應(yīng)生態(tài)

上游供應(yīng)生態(tài)的發(fā)展為開(kāi)源項(xiàng)目的技術(shù)進(jìn)步和持續(xù)創(chuàng)新奠定了基礎(chǔ)。

支持開(kāi)發(fā)者的開(kāi)發(fā)工具和資源是上游供應(yīng)生態(tài)的關(guān)鍵組成部分。開(kāi)源項(xiàng)目可以為開(kāi)發(fā)者提供友好的協(xié)作工具、文檔和教育資源,以幫助他們理解和使用項(xiàng)目,提高開(kāi)發(fā)效率并確保代碼質(zhì)量。在國(guó)際大模型開(kāi)源過(guò)程中,這些開(kāi)發(fā)工具和資源也被大量采用。例如,開(kāi)源分布式版本控制系統(tǒng)Git為開(kāi)發(fā)者提供了管理代碼版本、協(xié)作開(kāi)發(fā)和代碼審查等功能,其廣泛應(yīng)用使得開(kāi)發(fā)者能夠更好地管理和追蹤代碼的變更,同時(shí)也有助于團(tuán)隊(duì)間的協(xié)作和合作。集成開(kāi)發(fā)環(huán)境(IDE)和編程語(yǔ)言工具鏈等開(kāi)發(fā)工具為開(kāi)發(fā)者提供了高效的編寫(xiě)環(huán)境,Visual Studio Code、Eclipse、PyCharm等開(kāi)放的集成開(kāi)發(fā)環(huán)境提供了豐富的功能和插件生態(tài)系統(tǒng),使得開(kāi)發(fā)者能夠高效地編寫(xiě)、測(cè)試和調(diào)試代碼。

支持開(kāi)發(fā)者的數(shù)據(jù)是上游供應(yīng)生態(tài)的關(guān)鍵一環(huán)。作為軟件開(kāi)發(fā)的重要底座,數(shù)據(jù)對(duì)應(yīng)用性能訓(xùn)練的提升至關(guān)重要。開(kāi)放的數(shù)據(jù)集不僅有利于構(gòu)建公開(kāi)透明的協(xié)作環(huán)境,同時(shí)能大幅降低技術(shù)開(kāi)發(fā)前期成本及開(kāi)發(fā)門(mén)檻,推動(dòng)技術(shù)進(jìn)步。目標(biāo)檢測(cè)、自動(dòng)駕駛、人臉識(shí)別、自然語(yǔ)言處理、文本監(jiān)測(cè)、醫(yī)療等方向均有大量經(jīng)典開(kāi)源數(shù)據(jù)集,例如人臉識(shí)別領(lǐng)域的YouTube Face Database包含1595個(gè)不同人的3425個(gè)視頻,總計(jì)671.41 GB數(shù)據(jù),能夠幫助訓(xùn)練優(yōu)化人臉識(shí)別算法,減少開(kāi)發(fā)人員在技術(shù)早期開(kāi)發(fā)過(guò)程中遇到的困難。這些經(jīng)典開(kāi)源數(shù)據(jù)集也是大模型產(chǎn)生之初可靠的數(shù)據(jù)來(lái)源。

打造豐富多元的開(kāi)源下游應(yīng)用生態(tài)

下游應(yīng)用生態(tài)包括開(kāi)源軟件的應(yīng)用和集成,以及相關(guān)的商業(yè)生態(tài)系統(tǒng)。豐富多元的下游應(yīng)用生態(tài)能吸引更多開(kāi)發(fā)者和企業(yè)使用、擴(kuò)展和創(chuàng)造基于開(kāi)源項(xiàng)目的應(yīng)用,促進(jìn)相關(guān)產(chǎn)業(yè)的繁榮發(fā)展。以往的開(kāi)源下游應(yīng)用生態(tài)構(gòu)建經(jīng)驗(yàn)值得我國(guó)在打造大模型開(kāi)源下游應(yīng)用生態(tài)過(guò)程中學(xué)習(xí)。

廣泛的用戶(hù)和開(kāi)發(fā)者參與,從不同的角度和需求出發(fā)為軟件貢獻(xiàn)代碼、提供反饋并解決問(wèn)題,從而推動(dòng)軟件本身的發(fā)展和改進(jìn)。例如,Android移動(dòng)操作系統(tǒng)的成功很大程度上得益于其擁有豐富多樣的下游應(yīng)用。開(kāi)發(fā)者可以通過(guò)使用Android開(kāi)發(fā)工具包(SDK)創(chuàng)建應(yīng)用程序,并通過(guò)Google Play商店這一應(yīng)用市場(chǎng)將大量涵蓋各種領(lǐng)域和需求的應(yīng)用程序分發(fā)給用戶(hù)。由此,Android打造的多元下游應(yīng)用生態(tài)為用戶(hù)提供了廣泛的選擇,這種繁榮的應(yīng)用生態(tài)系統(tǒng)吸引了全球范圍內(nèi)的開(kāi)發(fā)者和企業(yè),推動(dòng)了Android平臺(tái)的發(fā)展和創(chuàng)新,促進(jìn)Android系統(tǒng)產(chǎn)業(yè)整體的發(fā)展。又如,OpenAI也開(kāi)放其大模型應(yīng)用程序接口(API),鼓勵(lì)其他開(kāi)發(fā)者將其大模型服務(wù)集成進(jìn)其應(yīng)用產(chǎn)品中,充分開(kāi)發(fā)下游應(yīng)用生態(tài)。

通過(guò)專(zhuān)門(mén)的支持機(jī)構(gòu)或社區(qū)來(lái)提供技術(shù)支持、文檔、培訓(xùn)和社區(qū)管理等服務(wù)。這可以幫助用戶(hù)和開(kāi)發(fā)者更好地理解和使用開(kāi)源軟件,并解決在實(shí)際應(yīng)用中遇到的問(wèn)題。例如,開(kāi)源機(jī)器學(xué)習(xí)框架TensorFlow和PyTorch都有龐大的社區(qū)支持和專(zhuān)門(mén)的支持機(jī)構(gòu)。這些支持機(jī)構(gòu)提供了官方文檔、教程、示例代碼等資源,幫助用戶(hù)和開(kāi)發(fā)者學(xué)習(xí)和使用這些框架。同時(shí),還通過(guò)舉辦培訓(xùn)課程、開(kāi)發(fā)者大會(huì)等活動(dòng),促進(jìn)用戶(hù)和開(kāi)發(fā)者之間的交流和合作。

發(fā)展基于開(kāi)源軟件的下游商業(yè)生態(tài)系統(tǒng)。開(kāi)源軟件商業(yè)生態(tài)系統(tǒng)的核心在于開(kāi)源軟件的產(chǎn)品和服務(wù)提供商,他們?cè)陂_(kāi)源軟件的基礎(chǔ)上通過(guò)提供定制化的解決方案、額外高級(jí)功能、代碼托管或整合、搭建并運(yùn)營(yíng)插件市場(chǎng)、提供培訓(xùn)和咨詢(xún)等運(yùn)維服務(wù)等模式(表1)來(lái)謀求商業(yè)回報(bào)。經(jīng)驗(yàn)表明,開(kāi)源商業(yè)化有助于開(kāi)源產(chǎn)出成果發(fā)揮價(jià)值,幫助其實(shí)現(xiàn)“價(jià)值創(chuàng)造—價(jià)值實(shí)現(xiàn)—價(jià)值分配”的合理閉環(huán)。形成有效商業(yè)模式的下游開(kāi)源商業(yè)生態(tài)系統(tǒng)不僅對(duì)開(kāi)源項(xiàng)目本身的健康可持續(xù)發(fā)展具有重要作用,還能促進(jìn)同類(lèi)技術(shù)的持續(xù)創(chuàng)新和市場(chǎng)競(jìng)爭(zhēng)。美國(guó)大模型領(lǐng)域也積極探索開(kāi)源商業(yè)化模式,意圖構(gòu)建起繁榮可持續(xù)的開(kāi)源大模型下游商業(yè)生態(tài)。例如,美國(guó)Stability AI公司通過(guò)開(kāi)發(fā)開(kāi)源大模型Stable Diffusion的商用版本,為客戶(hù)提供定制拓展服務(wù)來(lái)促進(jìn)大模型的應(yīng)用。

培育公開(kāi)有效的開(kāi)源治理協(xié)調(diào)生態(tài)

開(kāi)源治理協(xié)調(diào)生態(tài)涉及開(kāi)源項(xiàng)目的決策、管理和社區(qū)參與等方面,開(kāi)源治理協(xié)調(diào)生態(tài)的健康發(fā)展對(duì)于項(xiàng)目的長(zhǎng)期穩(wěn)定和社區(qū)的繁榮至關(guān)重要。主要包括以下3個(gè)方面。

公開(kāi)透明的決策流程和溝通機(jī)制能使所有人了解技術(shù)路線決策細(xì)節(jié),從而對(duì)項(xiàng)目建立長(zhǎng)期的信任,促進(jìn)參與和合作。例如,在美國(guó)發(fā)布的Linux內(nèi)核社區(qū)采用郵件列表作為主要溝通方式,由此使得項(xiàng)目成員能隨時(shí)了解項(xiàng)目發(fā)展方向和最新動(dòng)態(tài);通過(guò)一系列公開(kāi)的解釋文檔詳細(xì)說(shuō)明了技術(shù)開(kāi)發(fā)相關(guān)的決策執(zhí)行機(jī)制和協(xié)作模式。所有決策流程和相關(guān)信息公開(kāi)可追溯增強(qiáng)了社區(qū)的信任感,鼓勵(lì)更多人參與到開(kāi)源項(xiàng)目貢獻(xiàn)中,從而促進(jìn)了項(xiàng)目的健康長(zhǎng)久發(fā)展。

建立有效的沖突解決機(jī)制也是構(gòu)建成功開(kāi)源治理協(xié)調(diào)生態(tài)中的關(guān)鍵一環(huán)。例如,位于美國(guó)的云原生計(jì)算基金會(huì)(CNCF)下設(shè)技術(shù)監(jiān)督委員會(huì)來(lái)協(xié)調(diào)組件之間兼容性沖突,其技術(shù)監(jiān)督委員會(huì)成員通過(guò)選舉產(chǎn)生,其成員來(lái)自供應(yīng)商、最終用戶(hù)等多個(gè)方面,能充分代表開(kāi)源社區(qū)內(nèi)各方的利益,有助于維護(hù)社區(qū)的和諧與穩(wěn)定,并推動(dòng)項(xiàng)目的進(jìn)展。

良好有效的開(kāi)源制度設(shè)計(jì)對(duì)開(kāi)源參與者長(zhǎng)期可持續(xù)參與到開(kāi)源項(xiàng)目貢獻(xiàn)之中非常重要。其中,開(kāi)源許可證是開(kāi)源制度設(shè)計(jì)中的關(guān)鍵,它決定了如何使用、修改和分發(fā)開(kāi)源軟件。選擇符合項(xiàng)目目標(biāo)和社區(qū)需求的開(kāi)源許可證能保護(hù)貢獻(xiàn)者的權(quán)益、推動(dòng)創(chuàng)新和知識(shí)共享。常見(jiàn)的開(kāi)源許可證包括MIT許可證、Apache許可證和GNU通用公共許可證等。阿聯(lián)酋開(kāi)發(fā)的Falcon大模型就采用Apache-2.0許可證,其成為第一個(gè)可以免費(fèi)商用的開(kāi)源大模型,這將促進(jìn)其模型在科研及商業(yè)化中的應(yīng)用。

我國(guó)大模型開(kāi)源創(chuàng)新生態(tài)建設(shè)面臨的挑戰(zhàn)

我國(guó)開(kāi)源創(chuàng)新生態(tài)尚處于初步探索階段,社會(huì)對(duì)開(kāi)源認(rèn)知不夠,且缺乏建設(shè)開(kāi)源創(chuàng)新生態(tài)的經(jīng)驗(yàn)及配套完善的體制機(jī)制。大模型作為新興技術(shù)和產(chǎn)業(yè),其開(kāi)源創(chuàng)新生態(tài)的建設(shè)將面臨更大的挑戰(zhàn)。一方面,我國(guó)大模型底層基礎(chǔ)研究能力相對(duì)薄弱,數(shù)據(jù)和算力基礎(chǔ)制約大模型性能提升;另一方面,大模型產(chǎn)業(yè)內(nèi)各類(lèi)創(chuàng)新主體間未形成有效協(xié)同,產(chǎn)業(yè)內(nèi)無(wú)序競(jìng)爭(zhēng)引發(fā)亂象叢生。這些挑戰(zhàn)不僅限制了我國(guó)大模型進(jìn)一步的發(fā)展應(yīng)用,更阻礙了我國(guó)大模型參與國(guó)際競(jìng)爭(zhēng),在全球范圍內(nèi)影響力的輻射擴(kuò)散。

系統(tǒng)協(xié)同政策架構(gòu)設(shè)計(jì)缺失

盡管我國(guó)在國(guó)家層面(表2)及各省級(jí)地方政府層面(表3)均高度重視大模型發(fā)展,從算力支持、場(chǎng)景開(kāi)放、技術(shù)突破、產(chǎn)品生態(tài)等多方面積極出臺(tái)大模型產(chǎn)業(yè)發(fā)展措施,鼓勵(lì)大模型應(yīng)用落地。然而,我國(guó)現(xiàn)有政策系統(tǒng)性不足,主要集中在大模型本身,對(duì)大模型產(chǎn)業(yè)鏈條的其他環(huán)節(jié)關(guān)注不夠,尤其是數(shù)字公共產(chǎn)品制度、開(kāi)源商業(yè)化制度等適應(yīng)開(kāi)源創(chuàng)新生態(tài)的體制機(jī)制建設(shè)尚不健全,導(dǎo)致產(chǎn)業(yè)鏈上下游協(xié)同不足,難以滿(mǎn)足建設(shè)大模型開(kāi)源創(chuàng)新生態(tài)需求。同時(shí),各部門(mén)間缺乏有效信息互通、各地政府間技術(shù)要素不流動(dòng),政策趨同致使無(wú)法形成合力推動(dòng)人工智能大模型產(chǎn)業(yè)整體發(fā)展,未充分發(fā)揮出對(duì)實(shí)體經(jīng)濟(jì)的賦能作用。多個(gè)部門(mén)同時(shí)負(fù)有促進(jìn)大模型應(yīng)用落地、產(chǎn)業(yè)繁榮的職責(zé),部門(mén)職能存在重疊導(dǎo)致政策間的協(xié)調(diào)不足,無(wú)法充分發(fā)揮政策指導(dǎo)促進(jìn)的作用。


技術(shù)能力制約生態(tài)形成

我國(guó)大模型整體技術(shù)實(shí)力與國(guó)外頭部企業(yè)差距明顯,在算法、人才和科研投入方面與國(guó)外頭部企業(yè)差距較大,同時(shí)部分關(guān)鍵核心技術(shù)尚未突破,尚未形成促進(jìn)國(guó)產(chǎn)大模型發(fā)展的支撐基礎(chǔ)。根據(jù)權(quán)威測(cè)評(píng)榜單Super CLUE的評(píng)測(cè),截至2023年10月,GPT-4、Claude2和GPT-3.5在基礎(chǔ)模型領(lǐng)域綜合排名前3位(圖2),我國(guó)基礎(chǔ)模型在計(jì)算、代碼、生成與創(chuàng)作、上下文對(duì)話、角色扮演、工具使用方面得分與GPT-4的相應(yīng)指標(biāo)相差10分以上,部分指標(biāo)接近GPT-3.5,僅在中文知識(shí)題目方面明顯優(yōu)于國(guó)際模型。大模型廠商技術(shù)上的基本同源導(dǎo)致現(xiàn)階段較為相似的模型性能,尚未形成顯著技術(shù)性能優(yōu)勢(shì),同質(zhì)化嚴(yán)重影響了下游應(yīng)用生態(tài)的構(gòu)建。同時(shí),我國(guó)基礎(chǔ)模型缺乏原創(chuàng)性,版本迭代和技術(shù)演進(jìn)高度依賴(lài)國(guó)外進(jìn)展。特別是我國(guó)目前廣泛應(yīng)用的主流模型大多基于Transformer架構(gòu),而非我國(guó)自主研發(fā)的架構(gòu),在一定程度上制約了我國(guó)國(guó)產(chǎn)大模型自主創(chuàng)新生態(tài)的形成。


數(shù)據(jù)算力顯著限制技術(shù)發(fā)展

OpenAI、Google人工智能研究團(tuán)隊(duì)相繼證明,人工智能模型的性能隨著模型規(guī)模的指數(shù)級(jí)上升而線性增長(zhǎng),并在模型規(guī)模達(dá)到某個(gè)閾值時(shí)對(duì)某些問(wèn)題的處理性能突增,具備涌現(xiàn)能力。這一現(xiàn)象凸顯數(shù)據(jù)和算力在提升大模型性能中的重要意義。在數(shù)據(jù)方面,盡管我國(guó)已有部分中文開(kāi)源數(shù)據(jù)集,但從數(shù)據(jù)規(guī)模和語(yǔ)料質(zhì)量上均與海外有較大差距,且部分內(nèi)容較為陳舊,高質(zhì)量全面完整可信的開(kāi)放中文數(shù)據(jù)集匱乏。同時(shí),我國(guó)尚未建立有效的數(shù)據(jù)流通規(guī)則和數(shù)據(jù)供需對(duì)接機(jī)制,企業(yè)獲取數(shù)據(jù)資源的成本極高。數(shù)據(jù)產(chǎn)品供應(yīng)鏈尚不完善嚴(yán)重制約了我國(guó)大模型的訓(xùn)練表現(xiàn)。在算力方面,中國(guó)、美國(guó)在全球算力規(guī)模中的份額分別為33%、34%,其中以圖形處理器(GPU)和神經(jīng)網(wǎng)絡(luò)處理器(NPU)為主的智能算力規(guī)模方面中國(guó)高于美國(guó),分別為39%、31%,具備發(fā)展大模型產(chǎn)業(yè)的有利基礎(chǔ)。然而,現(xiàn)階段國(guó)產(chǎn)GPU性能難以滿(mǎn)足大模型訓(xùn)練要求,與國(guó)際主要采用的英偉達(dá)A100芯片存在顯著差距。例如,國(guó)產(chǎn)算力最高的昇騰910芯片計(jì)算速度(320 TFLOPS)僅與英偉達(dá)A100 PCle版本持平,與英偉達(dá)H100 NVL版本相差10倍以上(表4)。另外,國(guó)產(chǎn)人工智能智算芯片配套的編程環(huán)境尚不成熟。與英偉達(dá)的并行計(jì)算平臺(tái)和編程模型(CUDA)工具包相比,我國(guó)相應(yīng)軟件生態(tài)建設(shè)仍需加強(qiáng),這是一個(gè)投入巨大并且漫長(zhǎng)的過(guò)程。


創(chuàng)新主體無(wú)序競(jìng)爭(zhēng)制約整體發(fā)展速度

包括:“百模大戰(zhàn)”引發(fā)無(wú)序競(jìng)爭(zhēng),由于數(shù)據(jù)“孤島”、賽道重疊、市場(chǎng)競(jìng)爭(zhēng)等原因企業(yè)各自為戰(zhàn),造成資源投入分散、共創(chuàng)共建開(kāi)源意愿不足等問(wèn)題。數(shù)據(jù)顯示,截至2023年10月,我國(guó)有互聯(lián)網(wǎng)企業(yè)(百度、字節(jié)跳動(dòng)、阿里巴巴等)、新興創(chuàng)業(yè)公司(百川智能、MiniMax、月之暗面等)、傳統(tǒng)AI企業(yè)(科大訊飛、商湯科技等),以及高??蒲性核?54家單位開(kāi)展了通用大模型研發(fā),導(dǎo)致資源碎片化投入,重復(fù)低水平建設(shè),計(jì)算資源競(jìng)爭(zhēng)加劇。國(guó)產(chǎn)大模型應(yīng)用軟硬件適配與協(xié)同優(yōu)化尚顯不足,軟硬件生態(tài)有待進(jìn)一步豐富。對(duì)比國(guó)內(nèi)外大模型產(chǎn)品應(yīng)用流量來(lái)源,國(guó)外大模型來(lái)自移動(dòng)端的用戶(hù)流量遠(yuǎn)高于國(guó)產(chǎn)大模型,且國(guó)產(chǎn)大模型產(chǎn)品應(yīng)用在電子郵件、社交應(yīng)用程序、自然搜索等外接應(yīng)用流量上也遠(yuǎn)低于ChatGPT(表5)?,F(xiàn)有國(guó)產(chǎn)大模型尚未探索出合適的大模型開(kāi)源商業(yè)模式。我國(guó)在開(kāi)源商業(yè)化方面的實(shí)踐經(jīng)驗(yàn)不足,采取的開(kāi)源商業(yè)策略單一,企業(yè)多面臨“技術(shù)業(yè)務(wù)兩張皮”的困境,尚未實(shí)現(xiàn)諸如微軟Office365 Copilot、ChatGPT企業(yè)版等對(duì)企產(chǎn)品的商業(yè)化落地,難以搭建起可持續(xù)的大模型下游開(kāi)源商業(yè)生態(tài)。目前,按照交易量收取費(fèi)用、定制開(kāi)發(fā)收取費(fèi)用是國(guó)產(chǎn)大模型產(chǎn)品主要收費(fèi)模式,這些商業(yè)模式難以覆蓋大模型開(kāi)發(fā)所需的巨大算力及人力成本,且多為一次性付費(fèi),致使與軟硬件生態(tài)之間的開(kāi)源協(xié)作受阻。


開(kāi)源支持體系建設(shè)水平較低

目前,我國(guó)從大模型開(kāi)發(fā)、訓(xùn)練到應(yīng)用的全鏈條開(kāi)源支持體系水平較低,不利于集中優(yōu)勢(shì)力量,阻礙了技術(shù)突破的步伐。在開(kāi)源開(kāi)發(fā)平臺(tái)方面,我國(guó)Gitee、GitLink、AtomGit等開(kāi)源代碼托管平臺(tái)發(fā)展尚不完善。例如,國(guó)內(nèi)Gitee等代碼托管平臺(tái)因網(wǎng)絡(luò)及設(shè)備故障而導(dǎo)致用戶(hù)存儲(chǔ)代碼丟失的大型故障時(shí)有發(fā)生,且維護(hù)不透明,運(yùn)營(yíng)穩(wěn)定性較差,因此難以維持用戶(hù)使用黏性;而國(guó)外的美國(guó)Github專(zhuān)門(mén)有網(wǎng)站記錄所有故障及修復(fù)時(shí)間,穩(wěn)定的運(yùn)營(yíng)機(jī)制極大增強(qiáng)了用戶(hù)信任度,從而促進(jìn)了用戶(hù)的使用量。這一差距充分反映在訪問(wèn)統(tǒng)計(jì)數(shù)據(jù)上,我國(guó)開(kāi)源代碼托管平臺(tái)Gitee的每月訪問(wèn)量為800萬(wàn)次,美國(guó)Github平臺(tái)則高達(dá)4.32億次。在開(kāi)源測(cè)試和訓(xùn)練平臺(tái)方面,國(guó)際流行的人工智能開(kāi)源模型庫(kù)和社區(qū)平臺(tái)Hugging Face發(fā)展至今已集成了超過(guò)50萬(wàn)具備圖像識(shí)別、語(yǔ)音生成、文本生成等多種功能的開(kāi)源大模型和超過(guò)11萬(wàn)包含多種數(shù)據(jù)類(lèi)型的高質(zhì)量開(kāi)源數(shù)據(jù)集,有全球超過(guò)5萬(wàn)家組織使用該平臺(tái),形成了較為成熟的大模型開(kāi)源工具平臺(tái)生態(tài)。然而,我國(guó)類(lèi)似的開(kāi)源平臺(tái)發(fā)展仍處于初級(jí)階段,ModelScope魔搭開(kāi)源平臺(tái)不僅公布的數(shù)據(jù)集、模型質(zhì)量參差不齊,部分有較多漏洞,難以進(jìn)一步開(kāi)發(fā)優(yōu)化或直接應(yīng)用,而且開(kāi)源共建水平較低,如ModelScope魔搭社區(qū)開(kāi)源的2 158個(gè)模型中接近60%的模型由排名前10位的貢獻(xiàn)者捐出,超1/3模型由阿里巴巴達(dá)摩院一家貢獻(xiàn)。大模型開(kāi)源代碼托管、訓(xùn)練、測(cè)試平臺(tái)的低水平致使國(guó)產(chǎn)大模型往往托管在國(guó)外平臺(tái)上,造成我國(guó)大模型的訓(xùn)練環(huán)境和應(yīng)用場(chǎng)景流失在國(guó)外,難以保留在國(guó)內(nèi),不利于自主發(fā)展。在開(kāi)源治理協(xié)調(diào)平臺(tái)方面,我國(guó)相關(guān)治理機(jī)構(gòu)缺乏與業(yè)界的及時(shí)深度交流,導(dǎo)致對(duì)開(kāi)源大模型中涉及的“開(kāi)源”認(rèn)定、版權(quán)歸屬界定等關(guān)鍵問(wèn)題認(rèn)知不足,難以在負(fù)責(zé)任開(kāi)源大模型生態(tài)建設(shè)過(guò)程中發(fā)揮引導(dǎo)和平衡作用。同時(shí),開(kāi)源基金會(huì)等開(kāi)源促進(jìn)組織發(fā)展尚處于初級(jí)階段,開(kāi)源項(xiàng)目運(yùn)營(yíng)經(jīng)驗(yàn)不足,運(yùn)營(yíng)能力欠缺,難以有效支持大模型開(kāi)源項(xiàng)目的持續(xù)發(fā)展。

我國(guó)構(gòu)建大模型開(kāi)源創(chuàng)新生態(tài)的建議

我國(guó)應(yīng)充分吸收開(kāi)源創(chuàng)新生態(tài)構(gòu)建經(jīng)驗(yàn),秉持開(kāi)源開(kāi)放的理念構(gòu)建大模型開(kāi)源創(chuàng)新生態(tài),推動(dòng)大模型全產(chǎn)業(yè)鏈的繁榮有序發(fā)展。一方面,政府要處理好打造大模型開(kāi)源生態(tài)過(guò)程中政府和市場(chǎng)之間的關(guān)系,相關(guān)部委要明確職責(zé),形成政策合力。另一方面,社會(huì)要建立起對(duì)開(kāi)源的合理認(rèn)知,通過(guò)數(shù)字公共品制度等探索構(gòu)建符合大模型產(chǎn)業(yè)特性的開(kāi)源治理體系,推動(dòng)形成涵蓋大模型上下游全產(chǎn)業(yè)鏈的健康開(kāi)源創(chuàng)新生態(tài),促進(jìn)大模型產(chǎn)業(yè)創(chuàng)新與可持續(xù)發(fā)展。具體包括以下4個(gè)方面。

加強(qiáng)頂層設(shè)計(jì),明確各個(gè)部門(mén)職責(zé)

建議效仿中央科技委員會(huì)統(tǒng)籌全國(guó)科技發(fā)展總體部署的機(jī)制,國(guó)家層面建立統(tǒng)籌大模型發(fā)展的組織或機(jī)制。明確中央網(wǎng)絡(luò)安全和信息化委員會(huì)辦公室、國(guó)家發(fā)展和改革委員會(huì)、工業(yè)和信息化部、科學(xué)技術(shù)部、教育部、國(guó)家數(shù)據(jù)局等相關(guān)部委在大模型及上下游產(chǎn)業(yè)鏈各環(huán)節(jié)發(fā)展中的具體職責(zé),并進(jìn)行有效統(tǒng)籌。持續(xù)關(guān)注大模型產(chǎn)業(yè)及上下游發(fā)展需求,為打造可持續(xù)的大模型開(kāi)源創(chuàng)新生態(tài)提供協(xié)同有差異的政策支持與資源保障,形成合力促進(jìn)大模型產(chǎn)業(yè)發(fā)展。

以數(shù)據(jù)、算力和算法為抓手補(bǔ)短板、固底板,推動(dòng)產(chǎn)學(xué)研持續(xù)投入大模型開(kāi)源技術(shù)研發(fā)。建議由中央網(wǎng)絡(luò)安全和信息化委員會(huì)辦公室、工業(yè)和信息化部負(fù)責(zé)大模型產(chǎn)業(yè)培育引導(dǎo),科學(xué)技術(shù)部、中國(guó)科學(xué)院、教育部等合作推動(dòng)大模型底層技術(shù)及原理研究,培養(yǎng)產(chǎn)業(yè)發(fā)展所需的人工智能架構(gòu)設(shè)計(jì)方面人才,國(guó)家發(fā)展和改革委員會(huì)牽頭地方政府做好算力中心、跨區(qū)域算力網(wǎng)絡(luò)的建設(shè)及運(yùn)營(yíng);數(shù)據(jù)局厘清數(shù)據(jù)產(chǎn)權(quán)、數(shù)據(jù)資產(chǎn)評(píng)估等相關(guān)阻礙數(shù)據(jù)產(chǎn)業(yè)鏈發(fā)展的相關(guān)問(wèn)題,推動(dòng)上游數(shù)據(jù)產(chǎn)業(yè)鏈繁榮有序健康發(fā)展。

打造共享的大模型研發(fā)基礎(chǔ)體系

建設(shè)開(kāi)放國(guó)家算力平臺(tái)支持大模型訓(xùn)練。解決跨數(shù)據(jù)中心算力協(xié)同面臨的相關(guān)體制機(jī)制挑戰(zhàn),提高各地已有智算中心的利用率和使用效率。推動(dòng)國(guó)家實(shí)驗(yàn)室算力平臺(tái)向社會(huì)開(kāi)放,支持組建算力聯(lián)盟引導(dǎo)算力開(kāi)放,集中高檔GPU算力資源,降低各類(lèi)大模型研發(fā)訓(xùn)練成本。設(shè)立國(guó)家級(jí)開(kāi)源項(xiàng)目推動(dòng)頭部科技企業(yè)搭建公共大模型基礎(chǔ)平臺(tái)、構(gòu)建低代碼開(kāi)發(fā)工具,促進(jìn)上、中、下游企業(yè)間的協(xié)同創(chuàng)新。加快落實(shí)《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)計(jì)劃》,發(fā)揮算力對(duì)大模型發(fā)展的驅(qū)動(dòng)作用。

推動(dòng)建立國(guó)產(chǎn)智算芯片開(kāi)源編譯生態(tài)。統(tǒng)一各國(guó)產(chǎn)智算芯片編譯環(huán)境接口,構(gòu)建類(lèi)CUDA平臺(tái)打通硬件和AI訓(xùn)練之間的中間軟件層,加大對(duì)適應(yīng)人工智能計(jì)算所具有的計(jì)算密度高、需要大量低精度計(jì)算等特點(diǎn)的軟硬件協(xié)同設(shè)計(jì)研發(fā)。這能夠降低采用不同GPU進(jìn)行大模型訓(xùn)練時(shí)額外的學(xué)習(xí)成本,有利于大模型發(fā)展。同時(shí)開(kāi)源所匯聚的合力能降低芯片廠家的開(kāi)發(fā)成本,促進(jìn)算力領(lǐng)域技術(shù)研發(fā),加快國(guó)產(chǎn)GPU芯片發(fā)展。注重與國(guó)內(nèi)硬件生態(tài)連接,形成軟硬件有效協(xié)同,提升產(chǎn)業(yè)創(chuàng)新體系整體效能。通過(guò)設(shè)立大模型開(kāi)源大基金等方式,推動(dòng)國(guó)產(chǎn)大模型開(kāi)源軟硬件生態(tài)發(fā)展,形成基礎(chǔ)軟硬件與大模型有效協(xié)同。

促進(jìn)開(kāi)放數(shù)據(jù)體系建設(shè)。發(fā)揮國(guó)家數(shù)據(jù)局的統(tǒng)一協(xié)調(diào)作用構(gòu)建高質(zhì)量數(shù)據(jù)集,擴(kuò)大政府開(kāi)放數(shù)據(jù)范圍并通過(guò)建立多層次數(shù)據(jù)開(kāi)放體系加強(qiáng)數(shù)據(jù)交換共享,形成大模型發(fā)展的開(kāi)放數(shù)據(jù)支撐。加快構(gòu)建有利于促進(jìn)大模型產(chǎn)業(yè)發(fā)展的數(shù)據(jù)版權(quán)制度,借鑒國(guó)外大模型訓(xùn)練版權(quán)責(zé)任豁免機(jī)制,探索實(shí)現(xiàn)更為邏輯周密和利益平衡的數(shù)據(jù)版權(quán)規(guī)則設(shè)計(jì)。

強(qiáng)化全產(chǎn)業(yè)鏈開(kāi)源開(kāi)放體系建設(shè)

加強(qiáng)大模型相關(guān)全產(chǎn)業(yè)鏈生態(tài)布局,推動(dòng)大模型開(kāi)發(fā)、訓(xùn)練、應(yīng)用全鏈條支撐平臺(tái)有組織地建設(shè),由中立的組織機(jī)構(gòu)主導(dǎo)、科技企業(yè)參與大模型產(chǎn)業(yè)創(chuàng)新生態(tài)基礎(chǔ)層和模型層的開(kāi)源,由科技企業(yè)主導(dǎo)大模型產(chǎn)業(yè)創(chuàng)新生態(tài)中間層和應(yīng)用層的開(kāi)源。

從產(chǎn)業(yè)生態(tài)的角度引導(dǎo)推動(dòng)大模型產(chǎn)業(yè)應(yīng)用落地。全面調(diào)研和布局大模型相關(guān)的產(chǎn)業(yè)鏈,促進(jìn)開(kāi)源大模型在行業(yè)核心應(yīng)用場(chǎng)景如生物醫(yī)藥、智能化教育教學(xué)、智能制造等領(lǐng)域進(jìn)行應(yīng)用示范,推動(dòng)開(kāi)發(fā)各類(lèi)新型應(yīng)用場(chǎng)景,支持AI創(chuàng)新企業(yè)采用公共算力開(kāi)發(fā)行業(yè)智能應(yīng)用,引導(dǎo)行業(yè)用戶(hù)與大模型廠商合作,推動(dòng)各行業(yè)智能化升級(jí)。

加強(qiáng)面向開(kāi)源代碼的計(jì)算和訓(xùn)練型大模型平臺(tái)的設(shè)計(jì)開(kāi)發(fā)和推廣。對(duì)標(biāo)GitHub和Hugging Face等建設(shè)利于大模型開(kāi)發(fā)、測(cè)試和訓(xùn)練的開(kāi)源平臺(tái),開(kāi)展我國(guó)開(kāi)源平臺(tái)建設(shè)工作,助力大模型的利用和推廣。發(fā)揮開(kāi)源基金會(huì)或新型研發(fā)機(jī)構(gòu)作用,引導(dǎo)企業(yè)依托國(guó)內(nèi)代碼托管平臺(tái)開(kāi)源一批具有行業(yè)影響力的軟件項(xiàng)目,積極培育我國(guó)開(kāi)源生態(tài)環(huán)境。

探索新型大模型商業(yè)開(kāi)源運(yùn)營(yíng)機(jī)制。借鑒OpenAI的“非營(yíng)利性機(jī)構(gòu)+有限入股營(yíng)利回報(bào)”模式,加強(qiáng)市場(chǎng)主導(dǎo)和產(chǎn)業(yè)政策支撐共同推進(jìn)基礎(chǔ)大模型市場(chǎng)建設(shè),構(gòu)建可持續(xù)的開(kāi)源創(chuàng)新成果商業(yè)模式。

鼓勵(lì)社會(huì)資本參與開(kāi)源大模型技術(shù)的產(chǎn)業(yè)投資。推動(dòng)社會(huì)資本參與大模型產(chǎn)業(yè)的風(fēng)險(xiǎn)投資和產(chǎn)業(yè)投資,探索建立線下孵化器空間,聯(lián)合開(kāi)源社區(qū)及代碼托管平臺(tái)共同打造線上線下融合、極具活力的開(kāi)發(fā)者社區(qū),促進(jìn)開(kāi)源大模型下游商業(yè)生態(tài)繁榮發(fā)展。

完善開(kāi)源創(chuàng)新治理體系鼓勵(lì)發(fā)展

推動(dòng)商業(yè)開(kāi)源政策研究。研究制定有利于開(kāi)源商業(yè)化實(shí)施的相關(guān)政策,推動(dòng)建成公眾貢獻(xiàn)數(shù)據(jù)和使用數(shù)據(jù)行業(yè)規(guī)范等數(shù)字公共產(chǎn)品制度,強(qiáng)化開(kāi)源許可證的法律效力,有力保護(hù)開(kāi)源成果知識(shí)產(chǎn)權(quán),將“開(kāi)源不等于免費(fèi)”的開(kāi)源理念貫徹到大模型產(chǎn)學(xué)研用全過(guò)程。研究制定實(shí)驗(yàn)室開(kāi)源大模型開(kāi)源許可機(jī)制,針對(duì)開(kāi)源社區(qū)上不同類(lèi)型下游開(kāi)發(fā)者和用戶(hù),打造不同開(kāi)源層級(jí)的許可協(xié)議,授權(quán)開(kāi)源使用。推動(dòng)開(kāi)源產(chǎn)業(yè)發(fā)展,以稅收優(yōu)惠等方式鼓勵(lì)企業(yè)積極探索開(kāi)源,參與開(kāi)源生態(tài)建設(shè),深入了解開(kāi)源回饋方式,尋找有效的基于開(kāi)源的商業(yè)反饋模式。

推動(dòng)開(kāi)源社區(qū)治理水平提升。持續(xù)支持國(guó)內(nèi)開(kāi)源基金會(huì)、開(kāi)源社區(qū)等開(kāi)源力量發(fā)展,推動(dòng)開(kāi)源文化理念在社會(huì)的廣泛傳播。提高開(kāi)源社區(qū)運(yùn)營(yíng)水平,運(yùn)用大數(shù)據(jù)分析手段精確評(píng)估社區(qū)內(nèi)參與合作者的貢獻(xiàn)情況,精準(zhǔn)識(shí)別社區(qū)內(nèi)核心開(kāi)源貢獻(xiàn)者并予以獎(jiǎng)勵(lì),形成良好的“貢獻(xiàn)-承認(rèn)”正向反饋循環(huán)。完善大模型開(kāi)源評(píng)價(jià)、安全評(píng)估框架等監(jiān)測(cè)機(jī)制,以推動(dòng)大模型產(chǎn)業(yè)良性健康發(fā)展。

推動(dòng)大模型開(kāi)源國(guó)際交流合作。打造具有國(guó)際先進(jìn)技術(shù)水平的大模型開(kāi)源開(kāi)放平臺(tái),并加強(qiáng)與國(guó)際溝通大模型倫理治理,參與探討制定國(guó)際標(biāo)準(zhǔn)。鼓勵(lì)企業(yè)融入國(guó)際頂尖開(kāi)源社區(qū)、參與開(kāi)源規(guī)則制定等,通過(guò)開(kāi)源爭(zhēng)取全球智慧。依托開(kāi)源社區(qū),加強(qiáng)大模型技術(shù)人才自主培養(yǎng)和國(guó)際交流,推動(dòng)高校、科研院所與企業(yè)培育更多有熱情做開(kāi)源貢獻(xiàn)的人才。

(作者:溫馨、馮澤,中國(guó)科學(xué)院科技戰(zhàn)略咨詢(xún)研究院;張超,上海交通大學(xué)國(guó)家戰(zhàn)略研究院;郭銳、陳凱華,中國(guó)科學(xué)院大學(xué)公共政策與管理學(xué)院;朱其罡,上海開(kāi)源信息技術(shù)協(xié)會(huì) 對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué)?!吨袊?guó)科學(xué)院院刊》供稿)

【責(zé)任編輯:殷曉霞】
返回頂部