基于內(nèi)生復(fù)雜性的類腦脈沖大模型“瞬悉1.0”問(wèn)世

2025-09-08 13:32

來(lái)源：中國(guó)網(wǎng)·中國(guó)發(fā)展門戶網(wǎng)

分享到：

鏈接已復(fù)制

字體：小大

中國(guó)網(wǎng)/中國(guó)發(fā)展門戶網(wǎng)訊近日，中國(guó)科學(xué)院自動(dòng)化研究所李國(guó)齊、徐波團(tuán)隊(duì)與沐曦MetaX合作，成功研發(fā)出類腦脈沖大模型“瞬悉1.0”（SpikingBrain-1.0）。該模型基于“內(nèi)生復(fù)雜性”理論構(gòu)建，在國(guó)產(chǎn)GPU平臺(tái)上完成了全流程訓(xùn)練與推理，顯著提升了大模型高效處理極長(zhǎng)文本或數(shù)據(jù)序列的效率和速度，展示了構(gòu)建國(guó)產(chǎn)自主可控的新型（非Transformer）大模型架構(gòu)生態(tài)的可行性。

與前主流大模型架構(gòu)（Transformer架構(gòu)）不同，“瞬悉1.0”借鑒大腦神經(jīng)元內(nèi)部工作機(jī)制，清晰地展示了一條不斷提升模型復(fù)雜度和性能的新型可行路徑。該模型僅需約主流模型2%的數(shù)據(jù)量，就能在多項(xiàng)語(yǔ)言理解和推理任務(wù)中達(dá)到媲美眾多主流模型的性能。

據(jù)悉，這是我國(guó)首次提出大規(guī)模類腦線性基礎(chǔ)模型架構(gòu)，并首次在國(guó)產(chǎn)GPU算力集群上構(gòu)建類腦脈沖大模型的訓(xùn)練和推理框架。其超長(zhǎng)序列處理能力在法律/醫(yī)學(xué)文檔分析、復(fù)雜多智能體模擬、高能粒子物理實(shí)驗(yàn)、DNA序列分析、分子動(dòng)力學(xué)軌跡等超長(zhǎng)序列任務(wù)建模場(chǎng)景中具有顯著的潛在效率優(yōu)勢(shì)。本次發(fā)布的大模型為新一代人工智能發(fā)展提供了非Transformer架構(gòu)的新技術(shù)路線，并將啟迪更低功耗的下一代神經(jīng)形態(tài)計(jì)算理論和芯片設(shè)計(jì)。

【責(zé)任編輯：王虔】