色播视频在线观看,亚洲色一色噜一噜噜噜v,国产婬乱a一级毛片多女,狂喷潮视频在线观看mp4

分享到:
鏈接已復(fù)制

LANGUAGES

新聞

新聞直播 要聞 國際 軍事 政協(xié) 政務(wù) 圖片 視頻

財經(jīng)

財經(jīng) 金融 證券 汽車 科技 消費(fèi) 能源 地產(chǎn) 農(nóng)業(yè)

觀點(diǎn)

觀點(diǎn) 理論 智庫 中國3分鐘 中國訪談 中國網(wǎng)評 中國關(guān)鍵詞

文化

文化 文創(chuàng) 藝術(shù) 時尚 旅游 鐵路 悅讀 民藏 中醫(yī) 中國瓷

國情

國情 助殘 一帶一路 海洋 草原 灣區(qū) 聯(lián)盟 心理 老年

首頁> 中國發(fā)展門戶網(wǎng)> 本網(wǎng)獨(dú)家>

具身智能安全治理與未來展望

2025-04-22 11:19

來源:中國網(wǎng)·中國發(fā)展門戶網(wǎng)

分享到:
鏈接已復(fù)制
字體:

中國網(wǎng)/中國發(fā)展門戶網(wǎng)訊 1950年,計算機(jī)科學(xué)先驅(qū)圖靈(Alan Turing)在其開創(chuàng)性論文Computing Machinery and Intelligence中描繪了具身智能(EAI)的愿景——機(jī)器能夠像人類一樣感知環(huán)境、推理決策并付諸行動,這代表了人工智能發(fā)展的終極形態(tài)。此后,具身智能大致經(jīng)歷了3個發(fā)展階段(圖1)。在硬件發(fā)展階段(20世紀(jì)70年代起),具身智能的傳感器、處理器和執(zhí)行器等硬件取得了進(jìn)展,如微機(jī)電系統(tǒng)(MEMS)技術(shù)推動了傳感器件的小型化與集成化進(jìn)程,為構(gòu)建具備多模態(tài)感知能力的機(jī)器人奠定了硬件基礎(chǔ);在算法提升階段(21世紀(jì)10年代起),深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等算法開始廣泛應(yīng)用于具身智能,提升其感知和控制能力;在通用智能階段(21世紀(jì)20年代起),大語言模型(LLM)(如Chat-GPT、DeepSeek)和視覺-語言-動作模型(VLA)(如OpenVLA)的涌現(xiàn),為具身智能帶來認(rèn)知架構(gòu)的范式革新,使其具有強(qiáng)大的感知、推理、決策和執(zhí)行能力,標(biāo)志著通用具身智能成為主流趨勢。

具身智能是指一種基于物理實(shí)體進(jìn)行感知和行動的人工智能系統(tǒng),通過與環(huán)境的交互獲取信息、理解問題、做出決策并實(shí)現(xiàn)行動,從而產(chǎn)生智能行為和適應(yīng)性。如圖2所示,類似生物體,具身智能主要包括2個核心部分:“大腦”,指具身智能的模型與算法部分,模擬人類的思維與決策過程,負(fù)責(zé)高級推理、決策與規(guī)劃,并支持通過自然語言與環(huán)境進(jìn)行交互。 “肉身”,指具身智能系統(tǒng)的各類硬件設(shè)施和物理實(shí)體部分,包括傳感器、處理器、執(zhí)行器、網(wǎng)絡(luò)通信、電源等硬件設(shè)備?!叭馍怼笔蔷呱碇悄荏w的環(huán)境感知、動作執(zhí)行乃至基本生存能力的硬件基礎(chǔ)。

具身智能的“肉身載體”呈現(xiàn)多種形態(tài),目前主要為機(jī)器人和自動駕駛汽車。機(jī)器人由于其結(jié)構(gòu)上的仿生特性,是天然的具身載體,包括人形機(jī)器人,以及機(jī)械臂。2024年,世界機(jī)器人大會上就展現(xiàn)了27款人形機(jī)器人。Mordor Intelligence的機(jī)器人行業(yè)增長趨勢和預(yù)測報告顯示,2024年機(jī)器人市場規(guī)模預(yù)計為458.5億美元,到2029年預(yù)計將達(dá)到959.3億美元。自動駕駛汽車雖然形態(tài)上和生物體不一樣,但由于其兼?zhèn)渲悄苄院妥灾餍缘饶芰Γ彩侵匾木呱磔d體。上述智能機(jī)器人和自動駕駛汽車的發(fā)展趨勢表明,具身智能領(lǐng)域正處在蓬勃發(fā)展的黃金時期。

具身智能為“人、機(jī)、物”三元世界引入高等級的“智能”、“關(guān)聯(lián)”和“交互”能力,將人類社會、信息世界和物理世界“對齊”在統(tǒng)一的平臺上,成為構(gòu)建統(tǒng)一人類智能、機(jī)器智能和物理智能“巴別塔”的基石。它們不再只是概念和實(shí)驗室中的產(chǎn)物,而是逐漸成為改變我們生活和生產(chǎn)方式的現(xiàn)實(shí)力量。未來,具身智能必將在更多的領(lǐng)域展現(xiàn)出巨大潛力,引領(lǐng)人類走向更加智能化的時代。

具身智能安全背景

具身智能體在實(shí)際應(yīng)用中暴露出一系列嚴(yán)峻安全隱患,對個人生命財產(chǎn)安全乃至國家安全構(gòu)成威脅。近年來多起事故便是明證:2022年7月,一臺象棋機(jī)器人在國際公開賽上誤傷了一名7歲男童的手指;2023年11月,韓國一名工人因被工業(yè)機(jī)械臂誤識別為貨物而致命;在自動駕駛領(lǐng)域,僅2022年一年,全球范圍內(nèi)就發(fā)生近400起自動駕駛交通事故。這些具身智能安全事故的根源在于其“大腦”和“肉身”均存在脆弱性,具體表現(xiàn)為具身智能系統(tǒng)的感知失誤、決策錯誤、執(zhí)行失控等都會釀成事故,尤其是具身智能與物理環(huán)境的跨域交互特性進(jìn)一步引入了新的安全風(fēng)險維度。隨著具身智能系統(tǒng)在關(guān)鍵基礎(chǔ)設(shè)施中廣泛部署,這些安全漏洞可能被惡意利用,不僅威脅個人生命安全、破壞社會秩序,更可能危及國家科技自主權(quán)、社會穩(wěn)定性與戰(zhàn)略利益等根本安全。

針對日益嚴(yán)峻的具身智能安全問題,各國政府在積極探索有效的防護(hù)方法和治理模式。目前,針對機(jī)器人和自動駕駛等典型具身智能應(yīng)用范式,國際標(biāo)準(zhǔn)化組織(ISO)已經(jīng)立項標(biāo)準(zhǔn)ISO/CD 13482:2023(Robotics—Safety requirements for service robots),針對個人、專業(yè)、商業(yè)應(yīng)用服務(wù)機(jī)器人,明確安全需求并界定涉及的機(jī)器人與危險程度,按照人機(jī)物理接觸條件給出功能安全附加信息。2024年7月,Communications of the ACM期刊發(fā)表文章Establishing standards for embodied AI呼吁從部件級和系統(tǒng)級盡早建立具身智能標(biāo)準(zhǔn),確保具身智能安全性、可靠性、可用性。與此同時,我國也在具身智能相關(guān)領(lǐng)域開始布局,相繼發(fā)布了《具身智能發(fā)展報告》《2024具身智能全景圖1.0》《人形機(jī)器人分類分級應(yīng)用指南》等重要政策文件和研究報告。

然而,當(dāng)前國際社會在具身智能領(lǐng)域仍缺乏統(tǒng)一的規(guī)范化標(biāo)準(zhǔn),安全治理體系存在明顯空白。隨著具身智能技術(shù)的快速迭代與廣泛應(yīng)用,各國急需加強(qiáng)在具身智能安全基礎(chǔ)研究方面的政策支持與資源投入,構(gòu)建統(tǒng)一的通用化規(guī)范準(zhǔn)則。建立多維度、系統(tǒng)性的安全治理方案,不僅是保障具身智能健康發(fā)展的必要條件,更是推動該領(lǐng)域持續(xù)創(chuàng)新的重要基礎(chǔ)。

針對具身智能安全治理問題,本文首先定義了具身智能安全內(nèi)涵和安全體系,包括具身智能本體安全、交互安全及應(yīng)用安全3個方面。進(jìn)而針對如何有效防范具身智能的安全風(fēng)險,本文提出了具身智能綜合評測及防護(hù)框架,并展望其安全治理原則,以期為具身智能安全治理提供指導(dǎo)。

具身智能安全內(nèi)涵與體系

與具身智能發(fā)展相伴而生的是復(fù)雜的安全威脅。具身智能安全需要同時考慮其“肉身”和“大腦”安全,同時也要考慮兩者融合之后的新型安全問題,如兩者的相互影響和制約導(dǎo)致的安全問題。具身智能強(qiáng)調(diào)與環(huán)境的交互性,因此安全內(nèi)涵包括人、機(jī)、物三者多元共生系統(tǒng)安全,構(gòu)建具身智能與人類自然語言交互、與物體精確熟練互動,以及與其他具身智能體共同協(xié)作的場景。如圖3所示,本文認(rèn)為具身智能安全的內(nèi)涵包括三大類:

本體安全——根據(jù)具身智能體的“大腦”和“肉身”構(gòu)成,其本體安全問題包括具身智能算法安全、感控安全及數(shù)據(jù)安全等。

交互安全——具身智能體在與外部環(huán)境交互過程中的安全,根據(jù)交互對象劃分,包括人—機(jī)交互安全、機(jī)—物交互安全和機(jī)—機(jī)交互安全。

應(yīng)用安全——具身智能體所承載的任務(wù)目標(biāo)對外部環(huán)境、人員乃至社會產(chǎn)生作用和影響,根據(jù)作用域劃分,可以分為信息域安全、物理域安全、社會域安全。

具身智能本體安全

具身智能算法安全

具身智能算法安全關(guān)注智能體對環(huán)境和指令的準(zhǔn)確理解,及其做出安全可靠規(guī)劃和決策的能力。以具身大模型為核心算法的具身智能,不僅繼承了傳統(tǒng)AI中的安全威脅,如對抗樣本、數(shù)據(jù)毒化和逆向工程攻擊,還面臨提示注入攻擊、越獄攻擊和偏見攻擊等大模型安全風(fēng)險,尤其面臨大模型與“肉身”結(jié)合之后特有的安全風(fēng)險,如具身智能行為安全對齊問題。研究表明,在視覺輸入中加入對抗樣本貼圖,會導(dǎo)致具身智能生成的動作軌跡偏離正確路徑;在路標(biāo)上加入物理對抗樣本能夠使得自動駕駛汽車目標(biāo)檢測錯誤;在人機(jī)交互中,通過在用戶指令后添加對抗性后綴,能夠操縱具身大模型的決策過程;通過精心構(gòu)造具身智能大模型的輸入,可以繞過其安全對齊機(jī)制,從而觸發(fā)具身智能的惡意行為,如拿刀殺人;此外,在具身大模型的上下文中植入后門,可能引發(fā)有害決策或未經(jīng)授權(quán)的隱私信息訪問,最終導(dǎo)致具身智能體失控或用戶隱私泄露。這些新型安全威脅對具身智能的安全性提出了更高要求。

因此,具身智能算法安全的核心目標(biāo)是確保計算流程和結(jié)果的可信度與可解釋性。通過模塊化設(shè)計,可以在問題發(fā)生時逐步定位具體的故障模塊;或者采用思維鏈方法,進(jìn)一步細(xì)化推理過程,從而提升算法的可解釋性。在應(yīng)對小概率異常場景、提示注入攻擊,以及惡意擾動的對抗樣本輸入時,可通過前檢測和后檢測過濾器進(jìn)行防御,有效降低提示注入攻擊對具身智能系統(tǒng)的威脅。這些方法可以為提升具身智能算法的安全性提供重要保障。

具身智能感控安全

具身智能感控安全指的是在具身智能體與物理環(huán)境交互過程中,確保其感知與執(zhí)行過程的安全性與可靠性。具身智能的物理交互涉及2次跨域:以感知為核心的物理域到信息域的跨域;以執(zhí)行為核心的信息域到物理域的跨域。在這2個過程中,具身智能體需要準(zhǔn)確感知環(huán)境信息并正確執(zhí)行決策模塊的動作,這些能力依賴于其“肉身”,包括傳感器和執(zhí)行器。

傳感器安全:具身智能系統(tǒng)通過各類傳感器(如麥克風(fēng)、相機(jī)和雷達(dá))獲取環(huán)境信息,經(jīng)識別處理后,輔助決策模型進(jìn)行決策。然而,傳感器存在機(jī)械共振、電磁共耦、器件非線性、信號無鑒權(quán)等脆弱性,容易被環(huán)境信號(如聲音、激光、可見光、電磁等)無意干擾或惡意攻擊,從而影響感知正確性和系統(tǒng)安全性。因此,確保傳感器信息的真實(shí)性與準(zhǔn)確性并增強(qiáng)其抗干擾能力,是實(shí)現(xiàn)安全決策的關(guān)鍵。研究表明,聲波信號可利用攝像頭中的慣性傳感器機(jī)械共振脆弱性,使成像畫面出現(xiàn)抖動模糊,從而導(dǎo)致目標(biāo)識別出錯;還可以利用麥克風(fēng)的非線性脆弱性,構(gòu)造超聲波信號注入無聲惡意的語音指令;激光信號可以利用激光雷達(dá)的回波信號無鑒權(quán)脆弱性,消除、篡改或偽造點(diǎn)云。上述各類傳感器攻擊具有隱蔽性和多樣性,難以通過傳統(tǒng)網(wǎng)絡(luò)安全措施進(jìn)行有效檢測和防御。為抵御傳感器安全威脅,需要實(shí)施包括聲學(xué)、光學(xué)、電磁學(xué)等多層次的綜合策略。未來應(yīng)開發(fā)新型具身智能攻擊檢測方案,深入探索具身智能感知安全的邊界,并結(jié)合多領(lǐng)域研究成果,不斷提升具身智能系統(tǒng)的防御能力。

執(zhí)行器安全:具身智能依靠執(zhí)行器(如電機(jī)和揚(yáng)聲器)與環(huán)境交互,從而改變外界物理環(huán)境的狀態(tài)。確保執(zhí)行器的安全是具身智能安全體系的最后一道防線,也是保障整個系統(tǒng)安全運(yùn)行的關(guān)鍵環(huán)節(jié)。然而,執(zhí)行器同樣面臨多種安全威脅,例如電磁干擾攻擊和電源攻擊等。研究表明,電磁干擾攻擊能夠直接影響電機(jī)的運(yùn)行狀態(tài),導(dǎo)致執(zhí)行器動作異常或失控。此外,電源模塊的惡意攻擊利用內(nèi)部線路的天線效應(yīng)和非對稱性,篡改揚(yáng)聲器的輸出信號從而引發(fā)錯誤行為。這些威脅不僅可能破壞具身智能體的正常功能,還可能對周圍環(huán)境和人員造成潛在危害。因此,執(zhí)行器安全是具身智能體在復(fù)雜環(huán)境中實(shí)現(xiàn)安全可靠運(yùn)行的核心保障。確保執(zhí)行器的安全性和可靠性,是實(shí)現(xiàn)具身交互過程中安全操作的前提條件。未來需要針對執(zhí)行器的潛在威脅,開發(fā)多層次防護(hù)機(jī)制,如增強(qiáng)電磁屏蔽、優(yōu)化電源設(shè)計、實(shí)時監(jiān)測執(zhí)行器狀態(tài)等,以全面提升執(zhí)行器的抗干擾能力和安全性能,從而保障具身智能系統(tǒng)整體安全性。

同時,在跨域過程中,具身智能體可能面臨多種安全威脅。例如,攻擊者可能通過惡意物理信號攻擊傳感器或執(zhí)行器,甚至聯(lián)動利用其“肉身”漏洞和算法缺陷實(shí)現(xiàn)精巧攻擊,威脅到智能體自身及周圍環(huán)境人和物的安全。

具身智能數(shù)據(jù)安全

具身智能數(shù)據(jù)安全是指在具身智能系統(tǒng)中,保護(hù)數(shù)據(jù)在采集、傳輸、存儲和處理過程中的安全性與隱私性,防止攻擊者干擾、竊取或破壞數(shù)據(jù),從而確保具身智能體決策的準(zhǔn)確性并保障用戶的數(shù)據(jù)隱私。

訓(xùn)練數(shù)據(jù)安全風(fēng)險:具身智能訓(xùn)練數(shù)據(jù)安全指的是訓(xùn)練數(shù)據(jù)必須具備純凈性、公正性和對齊性,以確保模型訓(xùn)練的可靠性和安全性。如果在訓(xùn)練或微調(diào)具身大模型時使用了中毒數(shù)據(jù),可能導(dǎo)致模型被植入隱蔽后門。一旦后門被觸發(fā),可能引發(fā)嚴(yán)重后果,如車輛加速沖向障礙物等。因此,可以通過建立嚴(yán)格的數(shù)據(jù)來源審查機(jī)制,以確保訓(xùn)練數(shù)據(jù)的純凈性和公正性,從根本上降低中毒數(shù)據(jù)帶來的風(fēng)險。為防止中毒數(shù)據(jù)影響模型訓(xùn)練,可以采用對抗訓(xùn)練、聯(lián)邦學(xué)習(xí)等技術(shù)來緩解。不僅如此,具身智能大模型的輸出不僅需要符合人類規(guī)則與道德準(zhǔn)則,還必須具備物理風(fēng)險感知能力,與物理規(guī)律保持一致,從而規(guī)避潛在危險。因此,在具身智能大模型訓(xùn)練過程中也需要加入安全對齊等措施。

用戶數(shù)據(jù)隱私安全:用戶數(shù)據(jù)隱私安全是指具身智能在采集、使用、傳輸用戶數(shù)據(jù)時不侵犯和泄露用戶的隱私。在數(shù)據(jù)采集階段,具身智能體需要有效采集和處理感知信息并且防止攻擊者從側(cè)信道等方式竊取隱私信息;在數(shù)據(jù)使用階段,存儲于具身智能系統(tǒng)里的數(shù)據(jù)可能被竊取從而泄露用戶隱私;在數(shù)據(jù)通信階段,具身智能采集的用戶數(shù)據(jù)、任務(wù)數(shù)據(jù)和環(huán)境數(shù)據(jù)在傳輸過程中可能泄露,尤其在使用無線網(wǎng)絡(luò)時,未經(jīng)加密的數(shù)據(jù)包易受中間人攻擊。為有效保護(hù)具身智能的用戶數(shù)據(jù)隱私,應(yīng)在傳感器生成數(shù)據(jù)時屏蔽或加密敏感信息,而非事后進(jìn)行隱私保護(hù)。在數(shù)據(jù)存儲與傳輸環(huán)節(jié),通過部署本地計算或邊緣計算,可減少數(shù)據(jù)傳輸和集中存儲,從而降低數(shù)據(jù)暴露風(fēng)險。在數(shù)據(jù)通信階段,應(yīng)采用強(qiáng)加密算法確保數(shù)據(jù)傳輸?shù)陌踩裕乐怪虚g人攻擊和數(shù)據(jù)竊取。

具身智能交互安全

人—機(jī)交互安全

具身智能人—機(jī)交互安全是指在具身智能體與人類交互過程中,確保具身智能不會對人類造成任何傷害,從而實(shí)現(xiàn)人機(jī)可信賴的協(xié)同與和諧發(fā)展。這需要通過限制具身智能的活動區(qū)域、設(shè)計安全規(guī)則等手段,確保其在所有預(yù)期使用場景中的行為對人類無害。例如,設(shè)置碰撞檢測機(jī)制、速度限制和緊急停止功能,以防止意外傷害的發(fā)生。此外,確保人類在交互過程中始終擁有控制權(quán)是關(guān)鍵。用戶應(yīng)能夠隨時終止或調(diào)整具身智能的行為,以避免因失控或誤操作引發(fā)的安全問題。

機(jī)—物交互安全

具身智能機(jī)—物交互安全是指具身智能體在與物理環(huán)境中的對象進(jìn)行交互時,確保交互過程能夠在不破壞無關(guān)物體的情況下實(shí)現(xiàn)預(yù)期目標(biāo)。這涉及具身智能體動作執(zhí)行的可靠性,能夠正確地搬運(yùn)、放置、使用環(huán)境中的目標(biāo)物體,從而避免對環(huán)境中的其他無關(guān)物體造成損壞;同時,也應(yīng)加強(qiáng)其容錯與自適應(yīng)能力,保證具身智能在復(fù)雜或動態(tài)環(huán)境中,能夠處理應(yīng)對意外情況(如物體滑動或障礙物干擾)。

機(jī)—機(jī)交互安全

具身智能機(jī)—機(jī)交互安全是指在多個具身智能體共享同一環(huán)境時,確保交互過程中避免對其他智能體造成損害或安全風(fēng)險,同時維持協(xié)作的高效性和系統(tǒng)的穩(wěn)定性。通過行為規(guī)劃的協(xié)調(diào)和優(yōu)先級規(guī)則的設(shè)定,避免因沖突或競爭導(dǎo)致的不安全情況,從而實(shí)現(xiàn)具身智能體之間的高效協(xié)作。在交互過程中,具身智能體還需防范信息泄露、篡改或誤傳,確保通信數(shù)據(jù)的機(jī)密性、完整性和真實(shí)性,最終構(gòu)建可靠、和諧的多智能體協(xié)作環(huán)境。

具身智能應(yīng)用安全

具身智能信息域安全

具身智能信息域安全主要指在具身智能系統(tǒng)的部署過程中,確保模型、組件、適配器等在網(wǎng)絡(luò)傳輸中的完整性與保密性,以免受外部干擾或惡意操控。隨著具身智能大模型的蓬勃發(fā)展,研究者與開發(fā)者通常依賴開源平臺下載模型、適配器和組件。然而,若惡意攻擊者在上傳的模型或適配器中植入后門、通過插件獲取非必要權(quán)限,甚至在供應(yīng)鏈中注入安全漏洞,則可能導(dǎo)致嚴(yán)重的安全隱患與隱私泄露。

具身智能物理域安全

具身智能物理域安全是指在具身智能系統(tǒng)運(yùn)行過程中,確保其在物理世界中的安全,防止攻擊者對具身智能體或其所在環(huán)境實(shí)施干擾、破壞或劫持等行為。為實(shí)現(xiàn)物理域安全,具身智能系統(tǒng)需要構(gòu)建全面的物理域風(fēng)險檢測與阻斷能力,識別潛在的惡意指令、異常信號甚至惡意實(shí)體,以避免外部攻擊者侵入系統(tǒng)或引發(fā)危險行為。此外,還需要在執(zhí)行任何動作之前對輸出指令進(jìn)行安全審查,確保其符合預(yù)期的操作規(guī)范,避免對具身智能體、周圍環(huán)境或人類用戶造成破壞。

具身智能社會域安全

具身智能社會領(lǐng)域的安全性指在具身智能系統(tǒng)應(yīng)用過程中,確保其符合法律、倫理和道德準(zhǔn)則,與人類價值觀保持一致,避免對社會產(chǎn)生負(fù)面影響。在具身智能體的決策過程中,需要引入倫理考量,以避免侵犯用戶隱私、產(chǎn)生偏見與歧視,以及算法決策的不透明性等問題。具身智能不僅要關(guān)注技術(shù)安全性,還需重視其社會影響,確保技術(shù)應(yīng)用符合法律法規(guī)、道德規(guī)范和社會倫理。

具身智能安全防護(hù)及治理

具身智能安全評測體系

具身智能安全評測體系需要覆蓋評測標(biāo)準(zhǔn)、評測數(shù)據(jù)集、評測技術(shù)和評測工具平臺等,為具身智能安全發(fā)展提供科學(xué)、系統(tǒng)的支持。

建立具身智能安全標(biāo)準(zhǔn)體系。標(biāo)準(zhǔn)的制定應(yīng)統(tǒng)一不同硬件、軟件和算法的差異,充分把握具身智能軟硬件協(xié)同以及“人—機(jī)—物”深度融合的關(guān)鍵特征,既關(guān)注傳統(tǒng)安全問題在具身智能場景下的變化,又著力發(fā)掘具身智能中新的共性安全挑戰(zhàn)。通過綜合人工智能、網(wǎng)絡(luò)安全、控制理論等交叉學(xué)科領(lǐng)域的研究成果,構(gòu)建涵蓋本體安全、交互安全和應(yīng)用安全的完整標(biāo)準(zhǔn)體系。同時,根據(jù)具體的應(yīng)用場景、功能需求和防護(hù)要求,構(gòu)建具身智能系統(tǒng)分類分級標(biāo)準(zhǔn),建立具身智能安全等級保護(hù)標(biāo)準(zhǔn)和評測標(biāo)準(zhǔn),為安全發(fā)展提供科學(xué)規(guī)范的保障。

構(gòu)建安全評測數(shù)據(jù)集并研究評測技術(shù)。具身智能安全測試數(shù)據(jù)集包括各類惡意任務(wù)、指令及物理域中的單模態(tài)/多模態(tài)傳感器信號輸入,可用于具身智能體的模型訓(xùn)練、測試過程評測和硬件、軟件算法模塊級測試及系統(tǒng)級聯(lián)合評測。針對軟件算法,發(fā)展算法黑箱檢測技術(shù),通過紅隊安全測試,側(cè)重具身大模型魯棒性、幻覺、偏見性等評測;針對硬件器部件,需加強(qiáng)對帶內(nèi)脆弱性、帶外脆弱性的檢測分析,降低多物理場惡意信號挾持具身智能決策或致幻的風(fēng)險。尤其是,需要針對具身智能跨域脆弱性風(fēng)險,如跨域致幻、跨域越獄攻擊等新型威脅,綜合物理域、信息域安全性指標(biāo),以及跨域系統(tǒng)性指標(biāo)形成具身智能評測技術(shù)體系。

構(gòu)建規(guī)范化評測工具平臺。針對具身智能本體安全,開發(fā)聲、光、電、磁等多物理場信號驅(qū)動的具身智能硬件帶內(nèi)帶外脆弱性評測平臺,以及具身大模型多維度指標(biāo)評測平臺(圖4)。針對交互安全,建設(shè)虛實(shí)結(jié)合、人機(jī)協(xié)作的評測平臺。為克服在現(xiàn)實(shí)世界中對具身智能整機(jī)評測的成本高、速度慢及風(fēng)險高等瓶頸,應(yīng)同步開發(fā)具身智能仿真評測平臺,實(shí)現(xiàn)大規(guī)模、高并行的具身智能安全評測。同時,為保證人機(jī)協(xié)作過程中的人身安全,應(yīng)注重考慮設(shè)計人在回路的安全評測場景與任務(wù)。最終,保證具身智能體走進(jìn)千家萬戶的時候能夠避免“傷人害己”。

具身智能安全防護(hù)技術(shù)

具身智能安全治理還應(yīng)關(guān)注基礎(chǔ)理論、安全設(shè)計、生產(chǎn)實(shí)現(xiàn)等方面的具體防護(hù)技術(shù)。

突破可信具身智能關(guān)鍵基礎(chǔ)理論與技術(shù)。具身大模型因其具有模型黑箱、涌現(xiàn)機(jī)理不明及策略難以解釋等特征,在大規(guī)模應(yīng)用,尤其是關(guān)鍵基礎(chǔ)設(shè)施和國防軍工領(lǐng)域的應(yīng)用中面臨巨大挑戰(zhàn)。應(yīng)重點(diǎn)發(fā)展價值對齊技術(shù),確保具身智能系統(tǒng)的策略與人類價值觀和社會利益保持一致,從而增強(qiáng)具身智能的內(nèi)生安全性。同時,發(fā)展具身智能策略監(jiān)測與自診斷技術(shù),結(jié)合思維鏈、檢索增強(qiáng)生成等技術(shù),使具身大模型能夠清晰呈現(xiàn)輸出策略的邏輯推理過程,實(shí)現(xiàn)對具身智能系統(tǒng)運(yùn)行內(nèi)在機(jī)理的反向推斷與監(jiān)測,從而全面提升具身智能的可靠性、安全性和透明性。

發(fā)展全鏈路數(shù)據(jù)隱私保護(hù)技術(shù)。該技術(shù)有助于保障“人—機(jī)—物”數(shù)據(jù)安全和交互隱私安全。應(yīng)系統(tǒng)性地考慮數(shù)據(jù)在感知、儲存、傳輸和使用等全生命周期各環(huán)節(jié)中的隱私問題,構(gòu)建完整的隱私保護(hù)體系。在數(shù)據(jù)感知環(huán)節(jié),重點(diǎn)解決傳感器過度感知的問題,通過傳感器內(nèi)部做到數(shù)據(jù)脫敏和匿名化處理,實(shí)現(xiàn)傳感器生成數(shù)據(jù)“自源保護(hù)”,達(dá)到“生而隱私”的理念;在數(shù)據(jù)傳輸環(huán)節(jié),采用數(shù)據(jù)加密和隱私計算技術(shù),確保傳輸信道的安全性。同時,通過研究可驗證的多方安全技術(shù),全方位保障用戶隱私數(shù)據(jù)在整個具身智能體工作鏈路中的機(jī)密性和完整性。

保障具身智能軟硬件供應(yīng)鏈安全。推動具身智能關(guān)鍵軟硬件國產(chǎn)化、自主化,打造更安全更自主可控的產(chǎn)業(yè)體系,保障具身智能產(chǎn)業(yè)安全。在硬件方面,把控硬件設(shè)計、制造、封裝測試和運(yùn)輸各環(huán)節(jié)的安全,提防因硬件后門或漏洞造成具身智能系統(tǒng)失控或是癱瘓等惡意事件。在軟件方面,構(gòu)建自主可控的模型算法全棧技術(shù),包括底層硬件、異構(gòu)計算框架、機(jī)器學(xué)習(xí)框架等;并且,緊密跟蹤軟硬件產(chǎn)品的漏洞披露信息,及時采取修補(bǔ)加固措施。

思考改進(jìn)具身智能系統(tǒng)設(shè)計規(guī)范。結(jié)合不同應(yīng)用場景和安全等級要求,在系統(tǒng)設(shè)計階段就應(yīng)優(yōu)先考慮安全需求與目標(biāo),形成科學(xué)完備的設(shè)計規(guī)范。為防止具身智能系統(tǒng)被濫用,必須審慎界定其權(quán)力與能力邊界。從系統(tǒng)安全角度,重點(diǎn)研究防御嵌入技術(shù)機(jī)制,特別是關(guān)注具身智能面臨的多模態(tài)對抗攻擊風(fēng)險。在“物理域—信息域”和“信息域—物理域”等跨域環(huán)節(jié)中,通過嵌入傳輸數(shù)據(jù)過濾檢查等防御技術(shù),重點(diǎn)防范跨域過程中的安全隱患,全面加固和增強(qiáng)具身智能系統(tǒng)的防御能力,確保系統(tǒng)運(yùn)行的安全性和可靠性。

具身智能安全治理原則

雖然具身智能技術(shù)仍處于發(fā)展的早期階段,尚未出現(xiàn)重大轟動性具身安全事件。但是,仍需盡早開始探索實(shí)踐具身智能治理方案與制度,引導(dǎo)具身智能產(chǎn)業(yè)良性發(fā)展和培育。本文建議具身智能安全治理,需要關(guān)注以下4個方面。

建立全流程具身智能監(jiān)管體系。貫徹我國針對生成式人工智能技術(shù)與應(yīng)用治理的方針路線,秉持促發(fā)展和強(qiáng)監(jiān)管并舉的理念,采取包容審慎、分類分級監(jiān)管的敏捷治理模式,積極牽引“負(fù)責(zé)任的具身智能”落地。加強(qiáng)頂層設(shè)計謀劃,針對性地研究制定相關(guān)的監(jiān)管規(guī)范,推進(jìn)建設(shè)事前備案、事中風(fēng)險評估、事后溯源檢測的全流程監(jiān)管體系,嚴(yán)格把控約束具身智能發(fā)展的紅線。尤其是,可以借鑒目前大模型備案制度,針對具身智能中的“大腦”模型和“小腦”模型應(yīng)從算法數(shù)據(jù)、算法模型、算法策略和應(yīng)用領(lǐng)域等方面做好備案工作。強(qiáng)調(diào)具身智能與物理世界相交互的重要特性,強(qiáng)化對于具身“大腦”模型物理風(fēng)險認(rèn)知能力,以及具身“小腦”模型向客觀物理規(guī)律對齊的評估工作。針對具身實(shí)體,如機(jī)器人、無人車、無人機(jī)等,做好系統(tǒng)性備案工作,記錄硬件型號、廠商、批次等關(guān)鍵信息,形成具身實(shí)體“身份證”。具身智能系統(tǒng)中應(yīng)設(shè)置“黑匣子”來采集運(yùn)行過程中的模型輸出策略和硬件狀態(tài)信息,以便于事后能夠溯源、定位、追責(zé)系統(tǒng)中的問題模塊、使用者和責(zé)任廠商,改進(jìn)提升具身智能系統(tǒng)安全。

重視具身智能社會域倫理問題。除了硬性監(jiān)管防控,具身智能治理還需關(guān)注具身智能所帶來的倫理規(guī)范與社會問題。具身智能深入社會生活生產(chǎn)后,許多傳統(tǒng)繁重、重復(fù)勞動將被取代,為避免失業(yè)潮,應(yīng)積極探索調(diào)整社會就業(yè)結(jié)構(gòu),提供勞動者再培訓(xùn)和技能提升的機(jī)會。具身智能的發(fā)展也將重塑人機(jī)關(guān)系,隨著具身智能在家庭機(jī)器人等領(lǐng)域的應(yīng)用,特別是相較于聊天大模型應(yīng)用,具身智能機(jī)器人還具備擬人化的外觀和物理可接觸屬性,很可能造成人類對于具身智能情感上和勞動技能上過度依賴,引發(fā)新的倫理問題。因此,政府應(yīng)該積極引導(dǎo)公眾對于具身智能形成正確的價值觀念與認(rèn)識,強(qiáng)調(diào)人類的主體性。一旦出現(xiàn)具身智能破壞物品資產(chǎn)和危害人身安全等事故,如何去劃分安全責(zé)任歸屬,也是具身智能治理的關(guān)鍵問題。應(yīng)積極討論細(xì)化風(fēng)險場景和主體,研究制定相應(yīng)的法律法規(guī),明確具身智能下的責(zé)任歸屬問題。

推動完善多主體協(xié)同下的具身智能治理格局。積極發(fā)揮企業(yè)在具身智能產(chǎn)業(yè)中的創(chuàng)新主體地位,提升企業(yè)在具身智能產(chǎn)品研發(fā)和技術(shù)突破過程中的安全關(guān)切和要求,推動形成企業(yè)方具身智能產(chǎn)品安全自評估的制度規(guī)范。加強(qiáng)學(xué)術(shù)界在具身智能安全基礎(chǔ)理論和關(guān)鍵技術(shù)突破中的引領(lǐng)作用,培育高水平、有深厚學(xué)科交叉背景的具身智能安全創(chuàng)新人才和團(tuán)隊。建立政府引導(dǎo)、行業(yè)自律、企業(yè)自治、學(xué)界引領(lǐng)、社會監(jiān)督的多主體協(xié)同下的敏捷治理體系與具身智能治理格局。

發(fā)展形成最低安全管控機(jī)制。為避免具身智能系統(tǒng)在關(guān)鍵應(yīng)用領(lǐng)域失控,從而造成巨大破壞,應(yīng)發(fā)展最低安全管控機(jī)制。在特殊情況下,人類能夠強(qiáng)制介入控制或是關(guān)閉具身智能系統(tǒng),實(shí)現(xiàn)安全托底,保障環(huán)境和用戶安全,加固具身智能安全的最后一道防線。

具身智能安全建議與未來展望

具身智能安全是網(wǎng)絡(luò)空間安全在智能時代下的新形態(tài)、新挑戰(zhàn),也將是各國戰(zhàn)略競爭新的制高點(diǎn)。為推動我國具身智能產(chǎn)業(yè)持續(xù)健康發(fā)展,不使“連接人與神的巴別塔”反成人類“通往地獄的階梯”,本文認(rèn)為,未來應(yīng)重視以下具身智能安全方面的工作。

促進(jìn)學(xué)科交叉發(fā)展,形成具有中國特色的具身智能安全治理方案。具身智能安全是全流程、全生命周期的安全,應(yīng)并重軟硬件協(xié)同安全,同時還需關(guān)注具身智能給社會治理帶來的深遠(yuǎn)影響。這不僅要求不同安全研究方向的科研工作者相互合作,還需要人工智能、控制科學(xué)、法律、社會學(xué)等領(lǐng)域的跨學(xué)科交叉共同合作研究,共同推進(jìn)具身智能安全的整體治理。

突破基礎(chǔ)理論研用,提升我國在具身智能安全領(lǐng)域的國際話語權(quán)。具身智能安全是一個重要新型研究領(lǐng)域,需要突破具身智能安全的基礎(chǔ)理論,構(gòu)建系統(tǒng)化的具身智能安全研究體系,明確研究方向和重點(diǎn),搶占該領(lǐng)域的科研高地。同時,應(yīng)注重科研成果的產(chǎn)研轉(zhuǎn)化,推動理論研究向?qū)嶋H應(yīng)用落地,形成自主可控的技術(shù)體系,為我國在該領(lǐng)域確立國際話語權(quán)和競爭優(yōu)勢提供有力支撐。

加快人才培養(yǎng)培訓(xùn),推動我國具身智能產(chǎn)業(yè)的良性、健康發(fā)展。推動具身智能安全的產(chǎn)、學(xué)、教深度融合,充分促進(jìn)學(xué)術(shù)界與工業(yè)界的優(yōu)勢互補(bǔ),培養(yǎng)一批有深厚學(xué)科交叉背景、具備國際競爭力的復(fù)合型人才。同時,加大對具身智能安全領(lǐng)域的科研團(tuán)隊與青年學(xué)者的科研資源支持力度,鼓勵產(chǎn)出具有原創(chuàng)性、影響力的科研成果。通過人才培養(yǎng)與技術(shù)創(chuàng)新的雙輪驅(qū)動,形成良性互動的發(fā)展格局,助力我國具身智能產(chǎn)業(yè)持續(xù)健康發(fā)展。

(作者:徐文淵、冀曉宇、閆琛、程雨詩,浙江大學(xué)電氣工程學(xué)院?!吨袊茖W(xué)院院刊》供稿)

【責(zé)任編輯:殷曉霞】
返回頂部