人工智能時代的開源與閉源技術(shù)模式探討
中國網(wǎng)/中國發(fā)展門戶網(wǎng)訊 近年來,人工智能技術(shù)正以前所未有的速度發(fā)展,技術(shù)模式的選擇對行業(yè)發(fā)展具有深遠影響。大模型(如GPT系列、BERT、Llama、DeepSeek等)成為推動人工智能技術(shù)應用創(chuàng)新的關鍵力量。而大模型通常分為開源與閉源大模型兩種技術(shù)模式,其在不同的條件和環(huán)境下各具優(yōu)勢。本文將重點闡述開源與閉源的差異性,并探討兩種技術(shù)模式對人工智能生態(tài)系統(tǒng)發(fā)展的重要影響。
開源與閉源之爭:談古論今
開源指開放源代碼,允許用戶修改、使用、分發(fā);而閉源指代碼封閉,用戶不能修改和查看。開源與閉源的競爭貫穿了計算機和軟件技術(shù)發(fā)展的整個歷史,每一次技術(shù)的變革都伴隨著兩者激烈的較量。開源與閉源不僅是技術(shù)理念的碰撞,更關乎商業(yè)模式、創(chuàng)新速度和市場主導權(quán)的爭奪。
軟件技術(shù)的開源與閉源:1.0階段
在計算機的早期階段,開源占據(jù)優(yōu)勢。隨著計算機產(chǎn)業(yè)化的發(fā)展,企業(yè)開始意識到軟件本身的商業(yè)價值,閉源開始逐漸占據(jù)優(yōu)勢。20世紀80年代,操作系統(tǒng)成為開源與閉源競爭的焦點。美國微軟公司的Windows以閉源的形式迅速占領了個人計算機市場,與此同時,理查德·斯托曼等試圖建立開源的Linux操作系統(tǒng)對抗微軟的閉源操作系統(tǒng),其在服務器市場表現(xiàn)出極強的生命力。
20世紀90年代,互聯(lián)網(wǎng)的興起讓軟件生態(tài)發(fā)生了重大變化。美國微軟公司的Internet Explorer(IE)瀏覽器憑借與Windows操作系統(tǒng)的深度綁定,迅速擊敗了網(wǎng)景(Netscape Navigator)瀏覽器;而網(wǎng)景在失敗后選擇將其代碼開源,成為對抗IE的重要力量。2008年,美國Google公司推出了基于開源Chromium引擎的Chrome瀏覽器,展現(xiàn)了強大的市場競爭力,使得微軟在2019年被迫采用開源的Chromium引擎,即在開源的潮流中選擇了改變。
由開源與閉源的競爭歷史可以看出二者并非絕對對立,而是不斷演變的動態(tài)關系。微軟曾經(jīng)反對代碼開源,如今卻成為全球最大的開源社區(qū)GitHub的擁有者,并開源了.NET框架;Google公司和Meta公司在人工智能領域利用開源推動技術(shù)發(fā)展,但仍在核心產(chǎn)品上保持一定的封閉性。開源與閉源各具優(yōu)勢:開源的創(chuàng)新能力和社區(qū)協(xié)作精神可以推動技術(shù)的進步,而閉源的商業(yè)模式則提供了較好的資金和資源支持。
大模型技術(shù)的開源與閉源:2.0階段
開源與閉源的競爭從1.0階段的操作系統(tǒng)和應用軟件延伸到了當前的大模型,本文稱之為2.0階段。相比于1.0階段開源軟件的完全公開,2.0階段的大模型技術(shù)模式早期階段多采取閉源的模式,如美國OpenAI公司的ChatGPT聊天機器人和百度的文心一言人工智能助手等。隨著大模型技術(shù)的發(fā)展和演進,越來越多的團隊采取開源模式。
在開源大模型中,又分為完全開源和部分開源等。例如:① 完全開源(代碼+訓練數(shù)據(jù)+預訓練權(quán)重開源),如Stable Diffusion(CompVis許可證)、BERT(Apache 2.0 許可證);② 部分開源(代碼+權(quán)重開源,數(shù)據(jù)閉源),如Llama 2和3(Meta 許可證)、Mistral 7B(Apache 2.0 許可證)。DeepSeek是開源大模型中的典型代表,其最初為部分開源,后來逐漸放開剩余代碼。目前,DeepSeek已在全球引起了廣泛影響和關注,如2025年1月30日的Nature文章認為“DeepSeek以其獨特的架構(gòu)和出色的性能震驚了世界”。
開源模式的技術(shù)擴散機制與產(chǎn)業(yè)賦能效應
當前,全球科技飛速發(fā)展,開源模式不僅成為推動技術(shù)創(chuàng)新與生態(tài)構(gòu)建的重要引擎,也催生了全新的商業(yè)模式;與此同時,其也面臨數(shù)據(jù)安全、隱私風險、商業(yè)化困境和倫理監(jiān)管等多重挑戰(zhàn)。
開放協(xié)作重構(gòu)技術(shù)研發(fā)范式
開源模式打破了地域、機構(gòu)和技術(shù)壁壘,使全球開發(fā)者、研究者及企業(yè)能夠共同參與前沿技術(shù)的研發(fā)與優(yōu)化。例如,Meta公司的Llama系列大模型和DeepSeek系列大模型的開源實踐,使得從初創(chuàng)團隊到國際知名高校的研究者均能基于相同的基礎模型開展垂直領域創(chuàng)新,涵蓋法律文書、醫(yī)學診斷、蛋白質(zhì)結(jié)構(gòu)預測等專業(yè)場景。這種跨界合作不僅加速了技術(shù)進步,也為不同領域帶來了創(chuàng)新靈感。2025年1月29日Nature刊發(fā)的文章認為“優(yōu)秀的開源模型會吸引越來越多的頂尖人才”。開源大模型因其源代碼、參數(shù)及訓練過程的透明性,使得社區(qū)能迅速發(fā)現(xiàn)并修復漏洞。正如Linux基金會報告中提到,開源模型的漏洞平均修復時間遠低于閉源系統(tǒng)。此外,透明研發(fā)有助于獨立機構(gòu)進行安全性和準確性審計,增強模型公信力。
創(chuàng)新模式的“三層金字塔”結(jié)構(gòu)
“三層金字塔”結(jié)構(gòu):基礎層——服務支持與生態(tài)構(gòu)建。類似RedHat模式,即通過對開源模型提供企業(yè)級服務和支持來實現(xiàn)盈利。例如,智能繪圖工具Stability AI借助Stable Diffusion文生圖模型,向企業(yè)客戶提供SLA服務等級保障,其年營收突破上億美元。開源框架和完善的文檔支持,構(gòu)建起強大的技術(shù)基石,使企業(yè)能夠穩(wěn)定地采用和部署模型。中間層——模型迭代與平臺支持。開源模型推動了模型共享平臺的形成。例如:被廣泛使用的模型Hugging Face Transformer在開源社區(qū)Github平臺上已經(jīng)獲得了超過42 000個收藏,每月被安裝超100萬次,有800人為Hugging Face Transformers貢獻了代碼,有效彌補了科學與生產(chǎn)之間的鴻溝。應用層——生態(tài)綁定與增值服務。開源策略不僅能夠增強產(chǎn)品自身的競爭力,而且能夠帶動周邊生態(tài)系統(tǒng)的發(fā)展。例如,阿里云將開源學習框架FederatedScope與云服務深度整合,使人工智能計算效率大幅提升;華為公司的MindSpore框架開源后,更推動了昇騰芯片出貨量的激增。這種生態(tài)效應形成了從基礎服務到應用增值的閉環(huán)商業(yè)模式。
技術(shù)民主化與開放生態(tài)構(gòu)建
開源推動知識共享與技術(shù)民主化,開創(chuàng)了“微調(diào)即服務”等新業(yè)態(tài),降低技術(shù)門檻,讓各國和各層次用戶均能共享最新的算法與工具。正如Meta公司首席人工智能科學家Yann LeCun所言,開放大模型使技術(shù)民主化提前數(shù)年,其為小型企業(yè)和初創(chuàng)者提供了利用70 B參數(shù)模型開發(fā)創(chuàng)新工具的機會。開放標準和協(xié)議的采用防止了技術(shù)鎖定,增強了不同系統(tǒng)之間的互聯(lián)互通,不僅降低了開發(fā)成本,還促進了跨平臺應用,為大模型在各個行業(yè)的廣泛部署提供了靈活性和適應性,DeepSeek大模型即是其中的受益者。2025年1月23日Nature刊發(fā)的文章指出,“DeepSeek這一廉價的開源模型為小型企業(yè)和高校提供了更加廣闊的空間和創(chuàng)新的可能性,為更加開放民主的科研生態(tài)作出重大貢獻”。
開源大模型面臨的風險與挑戰(zhàn)
開源模式在帶來技術(shù)民主化與產(chǎn)業(yè)賦能的同時,也面臨著數(shù)據(jù)安全、倫理風險和商業(yè)盈利等多重挑戰(zhàn)。數(shù)據(jù)安全與倫理風險。開源模式由于訓練數(shù)據(jù)和模型參數(shù)的公開,可能會被惡意用戶利用,從中提取敏感信息或濫用于生成虛假信息,可能對社會與公共安全產(chǎn)生不利影響。此外,模型生成的內(nèi)容有時會反映出訓練數(shù)據(jù)中的偏見,如性別、文化、地域或政治偏見,這不僅會影響用戶體驗,更可能引發(fā)倫理風險。商業(yè)化與盈利模式困境。雖然開源模式極大降低了研發(fā)成本,但同時也可能使商業(yè)價值稀釋。企業(yè)如何在免費共享代碼的同時實現(xiàn)盈利,成為一個重大挑戰(zhàn)。部分公司通過提供增值服務、企業(yè)級支持和專有功能來彌補這一缺口,但如何平衡開放性與商業(yè)利益,仍需不斷探索。技術(shù)對齊與安全漏洞。開源模式在追求開放透明的同時,也需要解決對齊問題,即確保模型行為與人類期望一致。當前,許多大模型存在“幻覺”現(xiàn)象和不可預測的行為,這可能在高風險場景中帶來嚴重后果。此外,開源代碼容易被攻擊者檢視和利用,如何確保模型在開放環(huán)境下的魯棒性和安全性,是亟待解決的問題。
閉源模式的技術(shù)壁壘構(gòu)建與企業(yè)級協(xié)同
閉源模式通過控制核心技術(shù)、數(shù)據(jù)和軟硬件體系,構(gòu)建技術(shù)壁壘,實現(xiàn)從研發(fā)到商業(yè)落地的全鏈條優(yōu)勢與企業(yè)級協(xié)同,保障企業(yè)和機構(gòu)的商業(yè)利益。然而,這種模式同時也存在著技術(shù)壟斷和創(chuàng)新受限等風險。
數(shù)據(jù)飛輪效應優(yōu)勢
閉源模式擁有海量與高質(zhì)量的數(shù)據(jù)積累優(yōu)勢,允許企業(yè)對數(shù)據(jù)來源、標注標準和反饋機制進行全流程控制,不斷優(yōu)化模型性能,形成數(shù)據(jù)飛輪效應優(yōu)勢。例如,OpenAI公司的GPT-4模型訓練數(shù)據(jù)池已突破13萬億詞元(Tokens)的規(guī)模,涵蓋了專業(yè)期刊、專利文獻等高質(zhì)量語料,使得GPT-4模型在專業(yè)應用中具備了較強的競爭力。
軟硬協(xié)同的效能突破
閉源模式通過在硬件、軟件和數(shù)據(jù)層面實現(xiàn)緊密協(xié)同,可在同樣的資源下獲得更高的性能和更低的能耗,不僅降低了運行成本,還為企業(yè)級應用提供了穩(wěn)定高效的解決方案。例如,谷歌公司依托自研TPU v5芯片構(gòu)建了完整的閉源訓練體系,實現(xiàn)了硬件級的效率優(yōu)化,Gemini Ultra模型在同等參數(shù)下的訓練能耗比開源方案降低38%,TPU芯片集群流水線優(yōu)化方案使大規(guī)模并行訓練任務延遲大幅降低。
定制化服務的可靠保障
閉源模式能夠?qū)崿F(xiàn)嚴格的版本控制和安全檢測,企業(yè)可根據(jù)自身需求對閉源模型進行專門微調(diào)和功能擴展,從而獲得完全符合業(yè)務場景的定制化產(chǎn)品,同時表現(xiàn)出較好的穩(wěn)定性和安全性。例如,微軟公司與OpenAI公司的深度合作使得GPT-4模型的應用程序編程接口(API)能夠穩(wěn)定集成到各類企業(yè)應用中,通過對核心技術(shù)和數(shù)據(jù)的保密,OpenAI公司不僅在ChatGPT應用上吸引了數(shù)億用戶,還通過云服務、API接口等方式實現(xiàn)了商業(yè)推廣,獲得較好的市場認可。
閉源模式面臨的風險與挑戰(zhàn)
閉源模式雖具備上述優(yōu)勢,但與此同時,也存在技術(shù)壟斷、透明性不足等風險。如何在確保商業(yè)利益與技術(shù)創(chuàng)新的同時,實現(xiàn)適度開放、增強透明度,并平衡各方利益,是亟待探索并解決的關鍵問題。技術(shù)壟斷與封閉風險。閉源模式固然能保護企業(yè)商業(yè)利益,但也容易形成技術(shù)壟斷,限制市場公平競爭。由于核心技術(shù)和數(shù)據(jù)不對外開放,學術(shù)界和中小企業(yè)難以參與,這可能導致整個行業(yè)技術(shù)發(fā)展受限,并增加對單一供應商的依賴風險。透明性與信任危機。由于內(nèi)部機制高度封閉,閉源大模型往往缺乏外部專家和開發(fā)者的參與,限制了集體智慧的碰撞和多元化創(chuàng)新。缺少內(nèi)部細節(jié)認知,使得外界難以評估閉源模型的真實性能和潛在風險。例如,GPT-4的詳細架構(gòu)和訓練數(shù)據(jù)未公開,令研究人員對其內(nèi)部機制及可能存在的偏見、安全漏洞產(chǎn)生疑慮。持續(xù)創(chuàng)新的動力不足。研究結(jié)果表明,選擇閉源模式的企業(yè),技術(shù)壁壘一旦形成,其創(chuàng)新動力和技術(shù)迭代速度通常會呈現(xiàn)減緩的趨勢,行業(yè)整體的技術(shù)進步速度也會受之影響。這個階段,往往會激發(fā)開源社區(qū)的反彈熱情,對閉源廠商造成壓力,迫使其不得不開源部分技術(shù),以獲得市場認可。
前沿爭議與破局思考
開源與閉源大模型的困境
從數(shù)據(jù)版權(quán)角度來看,美國斯坦福大學人工智能研究所(HAI)2024年研究報告顯示,90%的開源模型存在“數(shù)據(jù)套娃”現(xiàn)象,這極有可能引發(fā)嚴重的版權(quán)爭議。法學專家勞東燕教授警告,如果不對數(shù)據(jù)來源進行溯源審計,整個人工智能產(chǎn)業(yè)將面臨系統(tǒng)性法律風險。這反映出在尊重開源文化的背景下,開源模型的數(shù)據(jù)使用缺乏規(guī)范和約束,沒有充分考慮到數(shù)據(jù)產(chǎn)權(quán)的歸屬和保護,違背了開源文化中對知識和數(shù)據(jù)合理使用的原則。
在模型評估方面,現(xiàn)有的主流基準測試存在嚴重偏頗。以2024年發(fā)布的MMLU-Pro基準測試數(shù)據(jù)集為例,其存在系統(tǒng)性偏袒閉源模型的現(xiàn)象,不同模型使用的提示詞差異顯著,答案提取規(guī)則也不一致,開源模型僅僅因格式偏差就會隨機扣分。這導致開源模型的真實性能難以得到公正的評估。
當前,人工智能領域正處于技術(shù)革新與產(chǎn)業(yè)變革的關鍵時期,開源與閉源大模型在推動技術(shù)創(chuàng)新和構(gòu)建生態(tài)系統(tǒng)方面各有優(yōu)勢。需要理性、客觀對待企業(yè)和機構(gòu)的開源與閉源模式選擇,大模型“熱”發(fā)展的同時也需要“冷”思考,是采取“快一步”的策略還是“慢半拍”的戰(zhàn)略,不能一概而論。
破局之道
尊重開閉源文化并推動科技民主化。在解決數(shù)據(jù)版權(quán)爭議問題方面,DeepMind公司提出的“數(shù)據(jù)護照”機制值得關注。該機制通過區(qū)塊鏈記錄訓練數(shù)據(jù)產(chǎn)權(quán),在模型推理時自動分配收益。這一機制不僅尊重了開源文化中數(shù)據(jù)共享的精神,也充分考慮到了數(shù)據(jù)提供者的權(quán)益,通過技術(shù)手段確保數(shù)據(jù)的來源可追溯、產(chǎn)權(quán)可界定,為開源模型的數(shù)據(jù)使用提供了一種可行的解決方案,使開源文化在合理的框架內(nèi)得以發(fā)展。當前,許多高校、科研院所與企業(yè)正在改進現(xiàn)有的測試標準或方法,其目的是使測試對于開源模型和閉源模型更公平。這體現(xiàn)了科技民主化的要求,通過建立公平的評估體系,讓開源和閉源模型在同一起跑線上競爭,能夠充分發(fā)揮各自的優(yōu)勢,促進人工智能技術(shù)的整體進步。只有在公平的環(huán)境下,才能讓更多的創(chuàng)新力量參與到人工智能的發(fā)展中來,實現(xiàn)科技的廣泛共享和共同進步。
有為政府與有效市場的協(xié)同作用。針對開源與閉源兩種技術(shù)模式的不同特點,政府、高校、科研機構(gòu)與企業(yè)需探尋協(xié)同破局之道。政府可以通過制定合理的激勵政策和監(jiān)管框架,尊重技術(shù)創(chuàng)新和市場基本規(guī)律,開拓創(chuàng)新空間的同時兜住風險底線,破解“一管就死、一放就亂”的困局,引導人工智能技術(shù)的健康發(fā)展。大模型等人工智能新技術(shù)和新應用,往往具有一定的復雜性和不可預見性,是典型的復雜系統(tǒng),要運用復雜性科學和系統(tǒng)觀念的“涌現(xiàn)”思想合理應對。科技政策制定的過程中,要盡量遵循“有所為、有所不為”的原則,營造適當寬松的創(chuàng)新生態(tài)環(huán)境,保持一定的定力、耐心和信心,緩解科研人員和機構(gòu)的焦慮和壓力,建立合理的創(chuàng)新容錯機制,真正激活科研創(chuàng)新者的主動性、積極性和內(nèi)驅(qū)力。通過建立科學的篩選機制,發(fā)現(xiàn)有潛力的創(chuàng)新性技術(shù)或團隊,并制定合理的技術(shù)轉(zhuǎn)化或推廣機制,調(diào)動高校、科研院所和企業(yè)等積極性,根據(jù)國家和市場需求以及創(chuàng)新者的自身利益,系統(tǒng)調(diào)整發(fā)展策略,實現(xiàn)政府和市場資源的有效配置。通過尊重創(chuàng)新機構(gòu)自身選擇的開源與閉源模式、踐行科技民主化和發(fā)揮有為政府與有效市場的協(xié)同作用,平衡技術(shù)創(chuàng)新、商業(yè)利益與社會責任,有望找到解決開源與閉源大模型爭議的破局之道,推動人工智能技術(shù)與產(chǎn)業(yè)的健康可持續(xù)發(fā)展。
(作者:鄭曉龍,中國科學院自動化研究所中國科學院大學前沿交叉科學學院;李家彤,中國科學院大學前沿交叉科學學院。《中國科學院院刊》供稿)







