色播视频在线观看,亚洲色一色噜一噜噜噜v,国产婬乱a一级毛片多女,狂喷潮视频在线观看mp4

分享到:
鏈接已復(fù)制

LANGUAGES

新聞

新聞直播 要聞 國際 軍事 政協(xié) 政務(wù) 圖片 視頻

財經(jīng)

財經(jīng) 金融 證券 汽車 科技 消費 能源 地產(chǎn) 農(nóng)業(yè)

觀點

觀點 理論 智庫 中國3分鐘 中國訪談 中國網(wǎng)評 外媒觀察 中國關(guān)鍵詞

文化

文化 文創(chuàng) 藝術(shù) 時尚 旅游 鐵路 悅讀 民藏 中醫(yī) 中國瓷

國情

國情 助殘 一帶一路 海洋 草原 灣區(qū) 聯(lián)盟 心理 老年

首頁> 中國發(fā)展門戶網(wǎng)> 本網(wǎng)獨家>

中國科學(xué)院自動化研究所推出新一代科學(xué)文獻解析工具

2025-11-03 08:54

來源:中國網(wǎng)·中國發(fā)展門戶網(wǎng)

分享到:
鏈接已復(fù)制
字體:

中國網(wǎng)/中國發(fā)展門戶網(wǎng)訊 近日,中國科學(xué)院自動化研究所“AI+科學(xué)”研究團隊正式推出新一代科學(xué)文獻解析工具——磐石?科學(xué)文獻解析器(S1-Parser)。該工具從底層算法出發(fā),通過構(gòu)建面向科學(xué)語義理解的多模態(tài)訓(xùn)練體系與強化學(xué)習(xí)機制,在公式、文本、圖表等多元素協(xié)同解析上實現(xiàn)質(zhì)的飛躍,為全球科研工作者提供真正“懂科學(xué)”的智能解析引擎。

傳統(tǒng)光學(xué)字符識別(OCR)技術(shù)雖在通用文本場景中表現(xiàn)成熟,但在面對科學(xué)文獻——尤其是包含復(fù)雜公式符號、專業(yè)圖表、多模態(tài)排版與跨學(xué)科術(shù)語的學(xué)術(shù)論文時,存在識別錯誤、結(jié)構(gòu)邏輯丟失、輸出格式單一等問題,難以支持科研自動化、知識圖譜構(gòu)建、智能問答等下游任務(wù)的發(fā)展。科學(xué)文獻的識別不僅是字符的還原,更是語義結(jié)構(gòu)的重建。為此,團隊摒棄了僅依賴通用視覺語言大模型的思路,轉(zhuǎn)而構(gòu)建一套專為科學(xué)文獻場景量身定制的算法訓(xùn)練范式。其核心在于三大技術(shù)支柱:全場景覆蓋的科學(xué)數(shù)據(jù)構(gòu)建、多模態(tài)監(jiān)督微調(diào)策略,以及面向科學(xué)文獻語義的強化學(xué)習(xí)優(yōu)化機制。

image.png

模型篇章級文獻解析能力評測結(jié)果

在數(shù)據(jù)層面,團隊系統(tǒng)性地采集并構(gòu)建了覆蓋三大典型科學(xué)書寫形態(tài)的訓(xùn)練語料:手寫體、數(shù)字排版體與紙質(zhì)掃描體。手寫體數(shù)據(jù)涵蓋不同學(xué)者的筆跡風(fēng)格、連筆習(xí)慣與輕微涂改等真實場景;數(shù)字排版體數(shù)據(jù)橫跨數(shù)學(xué)、物理、天文、工程、生物、計算機等多個學(xué)科,包含大量嵌套公式、特殊符號與復(fù)雜排版;紙質(zhì)掃描體數(shù)據(jù)則兼顧高清與低質(zhì)量樣本,模擬實際掃描或拍照中可能出現(xiàn)的模糊、傾斜、低分辨率等情況。所有數(shù)據(jù)均經(jīng)過嚴(yán)格去噪、標(biāo)準(zhǔn)化標(biāo)注與格式對齊,并通過均衡采樣策略確保模型在多樣場景下的泛化能力。這一“全形態(tài)、多學(xué)科、高質(zhì)量”的數(shù)據(jù)基礎(chǔ),為模型理解科學(xué)表達的復(fù)雜性提供了堅實支撐。

image.png

模型對于科學(xué)公式解析能力評測結(jié)果

在模型訓(xùn)練階段,團隊采用兩階段優(yōu)化策略。首先,通過多模態(tài)有監(jiān)督微調(diào),使模型初步掌握文本、公式、表格、插圖等異構(gòu)元素的聯(lián)合表征能力。在此基礎(chǔ)上,引入一種面向科學(xué)文獻語義的梯度強化學(xué)習(xí)策略優(yōu)化框架。不同于傳統(tǒng)以字符準(zhǔn)確率為導(dǎo)向的訓(xùn)練目標(biāo),該強化學(xué)習(xí)策略優(yōu)化框架專門設(shè)計了三重科學(xué)導(dǎo)向的獎勵信號:公式語法正確性、符號完整性與結(jié)構(gòu)合理性。通過強化學(xué)習(xí)優(yōu)化算法持續(xù)優(yōu)化這些獎勵信號,模型不僅“看得清”,更能“理解對”,生成的公式在語義層面高度可靠,可直接用于符號計算、定理驗證等高階任務(wù)。

據(jù)悉,研發(fā)團隊在多個科學(xué)文獻數(shù)據(jù)集上開展了系統(tǒng)評測,磐石?科學(xué)文獻解析器在篇章級解析、公式專項識別等任務(wù)中均展現(xiàn)出了國際領(lǐng)先水平。為了更好滿足科研需求,磐石?科學(xué)文獻解析器的輸出不僅包含高精度的文本與公式識別結(jié)果,還支持 JSON、Markdown 等結(jié)構(gòu)化格式輸出,可無縫對接知識抽取、文獻重排版、智能問答等下游應(yīng)用。目前,磐石?科學(xué)文獻解析器(V1.0)已正式開源,并作為核心組件集成于“磐石?科學(xué)基礎(chǔ)大模型”(ScienceOne),服務(wù)全球科研社區(qū)。下一步,研究團隊將持續(xù)拓展其對多模態(tài)科學(xué)內(nèi)容的解析能力,并推動構(gòu)建開放、協(xié)作的科學(xué)智能生態(tài)。


【責(zé)任編輯:王虔】
返回頂部