具身智能安全治理與未來展望
中國網(wǎng)/中國發(fā)展門戶網(wǎng)訊 1950年,計算機(jī)科學(xué)先驅(qū)圖靈(Alan Turing)在其開創(chuàng)性論文Computing Machinery and Intelligence中描繪了具身智能(EAI)的愿景——機(jī)器能夠像人類一樣感知環(huán)境、推理決策并付諸行動,這代表了人工智能發(fā)展的終極形態(tài)。此后,具身智能大致經(jīng)歷了3個發(fā)展階段(圖1)。在硬件發(fā)展階段(20世紀(jì)70年代起),具身智能的傳感器、處理器和執(zhí)行器等硬件取得了進(jìn)展,如微機(jī)電系統(tǒng)(MEMS)技術(shù)推動了傳感器件的小型化與集成化進(jìn)程,為構(gòu)建具備多模態(tài)感知能力的機(jī)器人奠定了硬件基礎(chǔ);在算法提升階段(21世紀(jì)10年代起),深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等算法開始廣泛應(yīng)用于具身智能,提升其感知和控制能力;在通用智能階段(21世紀(jì)20年代起),大語言模型(LLM)(如Chat-GPT、DeepSeek)和視覺-語言-動作模型(VLA)(如OpenVLA)的涌現(xiàn),為具身智能帶來認(rèn)知架構(gòu)的范式革新,使其具有強(qiáng)大的感知、推理、決策和執(zhí)行能力,標(biāo)志著通用具身智能成為主流趨勢。

具身智能是指一種基于物理實(shí)體進(jìn)行感知和行動的人工智能系統(tǒng),通過與環(huán)境的交互獲取信息、理解問題、做出決策并實(shí)現(xiàn)行動,從而產(chǎn)生智能行為和適應(yīng)性。如圖2所示,類似生物體,具身智能主要包括2個核心部分:“大腦”,指具身智能的模型與算法部分,模擬人類的思維與決策過程,負(fù)責(zé)高級推理、決策與規(guī)劃,并支持通過自然語言與環(huán)境進(jìn)行交互。 “肉身”,指具身智能系統(tǒng)的各類硬件設(shè)施和物理實(shí)體部分,包括傳感器、處理器、執(zhí)行器、網(wǎng)絡(luò)通信、電源等硬件設(shè)備?!叭馍怼笔蔷呱碇悄荏w的環(huán)境感知、動作執(zhí)行乃至基本生存能力的硬件基礎(chǔ)。

具身智能的“肉身載體”呈現(xiàn)多種形態(tài),目前主要為機(jī)器人和自動駕駛汽車。機(jī)器人由于其結(jié)構(gòu)上的仿生特性,是天然的具身載體,包括人形機(jī)器人,以及機(jī)械臂。2024年,世界機(jī)器人大會上就展現(xiàn)了27款人形機(jī)器人。Mordor Intelligence的機(jī)器人行業(yè)增長趨勢和預(yù)測報告顯示,2024年機(jī)器人市場規(guī)模預(yù)計為458.5億美元,到2029年預(yù)計將達(dá)到959.3億美元。自動駕駛汽車雖然形態(tài)上和生物體不一樣,但由于其兼?zhèn)渲悄苄院妥灾餍缘饶芰Γ彩侵匾木呱磔d體。上述智能機(jī)器人和自動駕駛汽車的發(fā)展趨勢表明,具身智能領(lǐng)域正處在蓬勃發(fā)展的黃金時期。
具身智能為“人、機(jī)、物”三元世界引入高等級的“智能”、“關(guān)聯(lián)”和“交互”能力,將人類社會、信息世界和物理世界“對齊”在統(tǒng)一的平臺上,成為構(gòu)建統(tǒng)一人類智能、機(jī)器智能和物理智能“巴別塔”的基石。它們不再只是概念和實(shí)驗室中的產(chǎn)物,而是逐漸成為改變我們生活和生產(chǎn)方式的現(xiàn)實(shí)力量。未來,具身智能必將在更多的領(lǐng)域展現(xiàn)出巨大潛力,引領(lǐng)人類走向更加智能化的時代。
具身智能安全背景
具身智能體在實(shí)際應(yīng)用中暴露出一系列嚴(yán)峻安全隱患,對個人生命財產(chǎn)安全乃至國家安全構(gòu)成威脅。近年來多起事故便是明證:2022年7月,一臺象棋機(jī)器人在國際公開賽上誤傷了一名7歲男童的手指;2023年11月,韓國一名工人因被工業(yè)機(jī)械臂誤識別為貨物而致命;在自動駕駛領(lǐng)域,僅2022年一年,全球范圍內(nèi)就發(fā)生近400起自動駕駛交通事故。這些具身智能安全事故的根源在于其“大腦”和“肉身”均存在脆弱性,具體表現(xiàn)為具身智能系統(tǒng)的感知失誤、決策錯誤、執(zhí)行失控等都會釀成事故,尤其是具身智能與物理環(huán)境的跨域交互特性進(jìn)一步引入了新的安全風(fēng)險維度。隨著具身智能系統(tǒng)在關(guān)鍵基礎(chǔ)設(shè)施中廣泛部署,這些安全漏洞可能被惡意利用,不僅威脅個人生命安全、破壞社會秩序,更可能危及國家科技自主權(quán)、社會穩(wěn)定性與戰(zhàn)略利益等根本安全。
針對日益嚴(yán)峻的具身智能安全問題,各國政府在積極探索有效的防護(hù)方法和治理模式。目前,針對機(jī)器人和自動駕駛等典型具身智能應(yīng)用范式,國際標(biāo)準(zhǔn)化組織(ISO)已經(jīng)立項標(biāo)準(zhǔn)ISO/CD 13482:2023(Robotics—Safety requirements for service robots),針對個人、專業(yè)、商業(yè)應(yīng)用服務(wù)機(jī)器人,明確安全需求并界定涉及的機(jī)器人與危險程度,按照人機(jī)物理接觸條件給出功能安全附加信息。2024年7月,Communications of the ACM期刊發(fā)表文章Establishing standards for embodied AI呼吁從部件級和系統(tǒng)級盡早建立具身智能標(biāo)準(zhǔn),確保具身智能安全性、可靠性、可用性。與此同時,我國也在具身智能相關(guān)領(lǐng)域開始布局,相繼發(fā)布了《具身智能發(fā)展報告》《2024具身智能全景圖1.0》《人形機(jī)器人分類分級應(yīng)用指南》等重要政策文件和研究報告。
然而,當(dāng)前國際社會在具身智能領(lǐng)域仍缺乏統(tǒng)一的規(guī)范化標(biāo)準(zhǔn),安全治理體系存在明顯空白。隨著具身智能技術(shù)的快速迭代與廣泛應(yīng)用,各國急需加強(qiáng)在具身智能安全基礎(chǔ)研究方面的政策支持與資源投入,構(gòu)建統(tǒng)一的通用化規(guī)范準(zhǔn)則。建立多維度、系統(tǒng)性的安全治理方案,不僅是保障具身智能健康發(fā)展的必要條件,更是推動該領(lǐng)域持續(xù)創(chuàng)新的重要基礎(chǔ)。
針對具身智能安全治理問題,本文首先定義了具身智能安全內(nèi)涵和安全體系,包括具身智能本體安全、交互安全及應(yīng)用安全3個方面。進(jìn)而針對如何有效防范具身智能的安全風(fēng)險,本文提出了具身智能綜合評測及防護(hù)框架,并展望其安全治理原則,以期為具身智能安全治理提供指導(dǎo)。
具身智能安全內(nèi)涵與體系
與具身智能發(fā)展相伴而生的是復(fù)雜的安全威脅。具身智能安全需要同時考慮其“肉身”和“大腦”安全,同時也要考慮兩者融合之后的新型安全問題,如兩者的相互影響和制約導(dǎo)致的安全問題。具身智能強(qiáng)調(diào)與環(huán)境的交互性,因此安全內(nèi)涵包括人、機(jī)、物三者多元共生系統(tǒng)安全,構(gòu)建具身智能與人類自然語言交互、與物體精確熟練互動,以及與其他具身智能體共同協(xié)作的場景。如圖3所示,本文認(rèn)為具身智能安全的內(nèi)涵包括三大類:
本體安全——根據(jù)具身智能體的“大腦”和“肉身”構(gòu)成,其本體安全問題包括具身智能算法安全、感控安全及數(shù)據(jù)安全等。
交互安全——具身智能體在與外部環(huán)境交互過程中的安全,根據(jù)交互對象劃分,包括人—機(jī)交互安全、機(jī)—物交互安全和機(jī)—機(jī)交互安全。
應(yīng)用安全——具身智能體所承載的任務(wù)目標(biāo)對外部環(huán)境、人員乃至社會產(chǎn)生作用和影響,根據(jù)作用域劃分,可以分為信息域安全、物理域安全、社會域安全。

具身智能本體安全
具身智能算法安全
具身智能算法安全關(guān)注智能體對環(huán)境和指令的準(zhǔn)確理解,及其做出安全可靠規(guī)劃和決策的能力。以具身大模型為核心算法的具身智能,不僅繼承了傳統(tǒng)AI中的安全威脅,如對抗樣本、數(shù)據(jù)毒化和逆向工程攻擊,還面臨提示注入攻擊、越獄攻擊和偏見攻擊等大模型安全風(fēng)險,尤其面臨大模型與“肉身”結(jié)合之后特有的安全風(fēng)險,如具身智能行為安全對齊問題。研究表明,在視覺輸入中加入對抗樣本貼圖,會導(dǎo)致具身智能生成的動作軌跡偏離正確路徑;在路標(biāo)上加入物理對抗樣本能夠使得自動駕駛汽車目標(biāo)檢測錯誤;在人機(jī)交互中,通過在用戶指令后添加對抗性后綴,能夠操縱具身大模型的決策過程;通過精心構(gòu)造具身智能大模型的輸入,可以繞過其安全對齊機(jī)制,從而觸發(fā)具身智能的惡意行為,如拿刀殺人;此外,在具身大模型的上下文中植入后門,可能引發(fā)有害決策或未經(jīng)授權(quán)的隱私信息訪問,最終導(dǎo)致具身智能體失控或用戶隱私泄露。這些新型安全威脅對具身智能的安全性提出了更高要求。
因此,具身智能算法安全的核心目標(biāo)是確保計算流程和結(jié)果的可信度與可解釋性。通過模塊化設(shè)計,可以在問題發(fā)生時逐步定位具體的故障模塊;或者采用思維鏈方法,進(jìn)一步細(xì)化推理過程,從而提升算法的可解釋性。在應(yīng)對小概率異常場景、提示注入攻擊,以及惡意擾動的對抗樣本輸入時,可通過前檢測和后檢測過濾器進(jìn)行防御,有效降低提示注入攻擊對具身智能系統(tǒng)的威脅。這些方法可以為提升具身智能算法的安全性提供重要保障。
具身智能感控安全
具身智能感控安全指的是在具身智能體與物理環(huán)境交互過程中,確保其感知與執(zhí)行過程的安全性與可靠性。具身智能的物理交互涉及2次跨域:以感知為核心的物理域到信息域的跨域;以執(zhí)行為核心的信息域到物理域的跨域。在這2個過程中,具身智能體需要準(zhǔn)確感知環(huán)境信息并正確執(zhí)行決策模塊的動作,這些能力依賴于其“肉身”,包括傳感器和執(zhí)行器。
傳感器安全:具身智能系統(tǒng)通過各類傳感器(如麥克風(fēng)、相機(jī)和雷達(dá))獲取環(huán)境信息,經(jīng)識別處理后,輔助決策模型進(jìn)行決策。然而,傳感器存在機(jī)械共振、電磁共耦、器件非線性、信號無鑒權(quán)等脆弱性,容易被環(huán)境信號(如聲音、激光、可見光、電磁等)無意干擾或惡意攻擊,從而影響感知正確性和系統(tǒng)安全性。因此,確保傳感器信息的真實(shí)性與準(zhǔn)確性并增強(qiáng)其抗干擾能力,是實(shí)現(xiàn)安全決策的關(guān)鍵。研究表明,聲波信號可利用攝像頭中的慣性傳感器機(jī)械共振脆弱性,使成像畫面出現(xiàn)抖動模糊,從而導(dǎo)致目標(biāo)識別出錯;還可以利用麥克風(fēng)的非線性脆弱性,構(gòu)造超聲波信號注入無聲惡意的語音指令;激光信號可以利用激光雷達(dá)的回波信號無鑒權(quán)脆弱性,消除、篡改或偽造點(diǎn)云。上述各類傳感器攻擊具有隱蔽性和多樣性,難以通過傳統(tǒng)網(wǎng)絡(luò)安全措施進(jìn)行有效檢測和防御。為抵御傳感器安全威脅,需要實(shí)施包括聲學(xué)、光學(xué)、電磁學(xué)等多層次的綜合策略。未來應(yīng)開發(fā)新型具身智能攻擊檢測方案,深入探索具身智能感知安全的邊界,并結(jié)合多領(lǐng)域研究成果,不斷提升具身智能系統(tǒng)的防御能力。
執(zhí)行器安全:具身智能依靠執(zhí)行器(如電機(jī)和揚(yáng)聲器)與環(huán)境交互,從而改變外界物理環(huán)境的狀態(tài)。確保執(zhí)行器的安全是具身智能安全體系的最后一道防線,也是保障整個系統(tǒng)安全運(yùn)行的關(guān)鍵環(huán)節(jié)。然而,執(zhí)行器同樣面臨多種安全威脅,例如電磁干擾攻擊和電源攻擊等。研究表明,電磁干擾攻擊能夠直接影響電機(jī)的運(yùn)行狀態(tài),導(dǎo)致執(zhí)行器動作異常或失控。此外,電源模塊的惡意攻擊利用內(nèi)部線路的天線效應(yīng)和非對稱性,篡改揚(yáng)聲器的輸出信號從而引發(fā)錯誤行為。這些威脅不僅可能破壞具身智能體的正常功能,還可能對周圍環(huán)境和人員造成潛在危害。因此,執(zhí)行器安全是具身智能體在復(fù)雜環(huán)境中實(shí)現(xiàn)安全可靠運(yùn)行的核心保障。確保執(zhí)行器的安全性和可靠性,是實(shí)現(xiàn)具身交互過程中安全操作的前提條件。未來需要針對執(zhí)行器的潛在威脅,開發(fā)多層次防護(hù)機(jī)制,如增強(qiáng)電磁屏蔽、優(yōu)化電源設(shè)計、實(shí)時監(jiān)測執(zhí)行器狀態(tài)等,以全面提升執(zhí)行器的抗干擾能力和安全性能,從而保障具身智能系統(tǒng)整體安全性。
同時,在跨域過程中,具身智能體可能面臨多種安全威脅。例如,攻擊者可能通過惡意物理信號攻擊傳感器或執(zhí)行器,甚至聯(lián)動利用其“肉身”漏洞和算法缺陷實(shí)現(xiàn)精巧攻擊,威脅到智能體自身及周圍環(huán)境人和物的安全。
具身智能數(shù)據(jù)安全
具身智能數(shù)據(jù)安全是指在具身智能系統(tǒng)中,保護(hù)數(shù)據(jù)在采集、傳輸、存儲和處理過程中的安全性與隱私性,防止攻擊者干擾、竊取或破壞數(shù)據(jù),從而確保具身智能體決策的準(zhǔn)確性并保障用戶的數(shù)據(jù)隱私。
訓(xùn)練數(shù)據(jù)安全風(fēng)險:具身智能訓(xùn)練數(shù)據(jù)安全指的是訓(xùn)練數(shù)據(jù)必須具備純凈性、公正性和對齊性,以確保模型訓(xùn)練的可靠性和安全性。如果在訓(xùn)練或微調(diào)具身大模型時使用了中毒數(shù)據(jù),可能導(dǎo)致模型被植入隱蔽后門。一旦后門被觸發(fā),可能引發(fā)嚴(yán)重后果,如車輛加速沖向障礙物等。因此,可以通過建立嚴(yán)格的數(shù)據(jù)來源審查機(jī)制,以確保訓(xùn)練數(shù)據(jù)的純凈性和公正性,從根本上降低中毒數(shù)據(jù)帶來的風(fēng)險。為防止中毒數(shù)據(jù)影響模型訓(xùn)練,可以采用對抗訓(xùn)練、聯(lián)邦學(xué)習(xí)等技術(shù)來緩解。不僅如此,具身智能大模型的輸出不僅需要符合人類規(guī)則與道德準(zhǔn)則,還必須具備物理風(fēng)險感知能力,與物理規(guī)律保持一致,從而規(guī)避潛在危險。因此,在具身智能大模型訓(xùn)練過程中也需要加入安全對齊等措施。
用戶數(shù)據(jù)隱私安全:用戶數(shù)據(jù)隱私安全是指具身智能在采集、使用、傳輸用戶數(shù)據(jù)時不侵犯和泄露用戶的隱私。在數(shù)據(jù)采集階段,具身智能體需要有效采集和處理感知信息并且防止攻擊者從側(cè)信道等方式竊取隱私信息;在數(shù)據(jù)使用階段,存儲于具身智能系統(tǒng)里的數(shù)據(jù)可能被竊取從而泄露用戶隱私;在數(shù)據(jù)通信階段,具身智能采集的用戶數(shù)據(jù)、任務(wù)數(shù)據(jù)和環(huán)境數(shù)據(jù)在傳輸過程中可能泄露,尤其在使用無線網(wǎng)絡(luò)時,未經(jīng)加密的數(shù)據(jù)包易受中間人攻擊。為有效保護(hù)具身智能的用戶數(shù)據(jù)隱私,應(yīng)在傳感器生成數(shù)據(jù)時屏蔽或加密敏感信息,而非事后進(jìn)行隱私保護(hù)。在數(shù)據(jù)存儲與傳輸環(huán)節(jié),通過部署本地計算或邊緣計算,可減少數(shù)據(jù)傳輸和集中存儲,從而降低數(shù)據(jù)暴露風(fēng)險。在數(shù)據(jù)通信階段,應(yīng)采用強(qiáng)加密算法確保數(shù)據(jù)傳輸?shù)陌踩裕乐怪虚g人攻擊和數(shù)據(jù)竊取。
具身智能交互安全
人—機(jī)交互安全
具身智能人—機(jī)交互安全是指在具身智能體與人類交互過程中,確保具身智能不會對人類造成任何傷害,從而實(shí)現(xiàn)人機(jī)可信賴的協(xié)同與和諧發(fā)展。這需要通過限制具身智能的活動區(qū)域、設(shè)計安全規(guī)則等手段,確保其在所有預(yù)期使用場景中的行為對人類無害。例如,設(shè)置碰撞檢測機(jī)制、速度限制和緊急停止功能,以防止意外傷害的發(fā)生。此外,確保人類在交互過程中始終擁有控制權(quán)是關(guān)鍵。用戶應(yīng)能夠隨時終止或調(diào)整具身智能的行為,以避免因失控或誤操作引發(fā)的安全問題。
機(jī)—物交互安全
具身智能機(jī)—物交互安全是指具身智能體在與物理環(huán)境中的對象進(jìn)行交互時,確保交互過程能夠在不破壞無關(guān)物體的情況下實(shí)現(xiàn)預(yù)期目標(biāo)。這涉及具身智能體動作執(zhí)行的可靠性,能夠正確地搬運(yùn)、放置、使用環(huán)境中的目標(biāo)物體,從而避免對環(huán)境中的其他無關(guān)物體造成損壞;同時,也應(yīng)加強(qiáng)其容錯與自適應(yīng)能力,保證具身智能在復(fù)雜或動態(tài)環(huán)境中,能夠處理應(yīng)對意外情況(如物體滑動或障礙物干擾)。
機(jī)—機(jī)交互安全
具身智能機(jī)—機(jī)交互安全是指在多個具身智能體共享同一環(huán)境時,確保交互過程中避免對其他智能體造成損害或安全風(fēng)險,同時維持協(xié)作的高效性和系統(tǒng)的穩(wěn)定性。通過行為規(guī)劃的協(xié)調(diào)和優(yōu)先級規(guī)則的設(shè)定,避免因沖突或競爭導(dǎo)致的不安全情況,從而實(shí)現(xiàn)具身智能體之間的高效協(xié)作。在交互過程中,具身智能體還需防范信息泄露、篡改或誤傳,確保通信數(shù)據(jù)的機(jī)密性、完整性和真實(shí)性,最終構(gòu)建可靠、和諧的多智能體協(xié)作環(huán)境。
具身智能應(yīng)用安全
具身智能信息域安全
具身智能信息域安全主要指在具身智能系統(tǒng)的部署過程中,確保模型、組件、適配器等在網(wǎng)絡(luò)傳輸中的完整性與保密性,以免受外部干擾或惡意操控。隨著具身智能大模型的蓬勃發(fā)展,研究者與開發(fā)者通常依賴開源平臺下載模型、適配器和組件。然而,若惡意攻擊者在上傳的模型或適配器中植入后門、通過插件獲取非必要權(quán)限,甚至在供應(yīng)鏈中注入安全漏洞,則可能導(dǎo)致嚴(yán)重的安全隱患與隱私泄露。
具身智能物理域安全
具身智能物理域安全是指在具身智能系統(tǒng)運(yùn)行過程中,確保其在物理世界中的安全,防止攻擊者對具身智能體或其所在環(huán)境實(shí)施干擾、破壞或劫持等行為。為實(shí)現(xiàn)物理域安全,具身智能系統(tǒng)需要構(gòu)建全面的物理域風(fēng)險檢測與阻斷能力,識別潛在的惡意指令、異常信號甚至惡意實(shí)體,以避免外部攻擊者侵入系統(tǒng)或引發(fā)危險行為。此外,還需要在執(zhí)行任何動作之前對輸出指令進(jìn)行安全審查,確保其符合預(yù)期的操作規(guī)范,避免對具身智能體、周圍環(huán)境或人類用戶造成破壞。
具身智能社會域安全
具身智能社會領(lǐng)域的安全性指在具身智能系統(tǒng)應(yīng)用過程中,確保其符合法律、倫理和道德準(zhǔn)則,與人類價值觀保持一致,避免對社會產(chǎn)生負(fù)面影響。在具身智能體的決策過程中,需要引入倫理考量,以避免侵犯用戶隱私、產(chǎn)生偏見與歧視,以及算法決策的不透明性等問題。具身智能不僅要關(guān)注技術(shù)安全性,還需重視其社會影響,確保技術(shù)應(yīng)用符合法律法規(guī)、道德規(guī)范和社會倫理。
具身智能安全防護(hù)及治理
具身智能安全評測體系
具身智能安全評測體系需要覆蓋評測標(biāo)準(zhǔn)、評測數(shù)據(jù)集、評測技術(shù)和評測工具平臺等,為具身智能安全發(fā)展提供科學(xué)、系統(tǒng)的支持。
建立具身智能安全標(biāo)準(zhǔn)體系。標(biāo)準(zhǔn)的制定應(yīng)統(tǒng)一不同硬件、軟件和算法的差異,充分把握具身智能軟硬件協(xié)同以及“人—機(jī)—物”深度融合的關(guān)鍵特征,既關(guān)注傳統(tǒng)安全問題在具身智能場景下的變化,又著力發(fā)掘具身智能中新的共性安全挑戰(zhàn)。通過綜合人工智能、網(wǎng)絡(luò)安全、控制理論等交叉學(xué)科領(lǐng)域的研究成果,構(gòu)建涵蓋本體安全、交互安全和應(yīng)用安全的完整標(biāo)準(zhǔn)體系。同時,根據(jù)具體的應(yīng)用場景、功能需求和防護(hù)要求,構(gòu)建具身智能系統(tǒng)分類分級標(biāo)準(zhǔn),建立具身智能安全等級保護(hù)標(biāo)準(zhǔn)和評測標(biāo)準(zhǔn),為安全發(fā)展提供科學(xué)規(guī)范的保障。
構(gòu)建安全評測數(shù)據(jù)集并研究評測技術(shù)。具身智能安全測試數(shù)據(jù)集包括各類惡意任務(wù)、指令及物理域中的單模態(tài)/多模態(tài)傳感器信號輸入,可用于具身智能體的模型訓(xùn)練、測試過程評測和硬件、軟件算法模塊級測試及系統(tǒng)級聯(lián)合評測。針對軟件算法,發(fā)展算法黑箱檢測技術(shù),通過紅隊安全測試,側(cè)重具身大模型魯棒性、幻覺、偏見性等評測;針對硬件器部件,需加強(qiáng)對帶內(nèi)脆弱性、帶外脆弱性的檢測分析,降低多物理場惡意信號挾持具身智能決策或致幻的風(fēng)險。尤其是,需要針對具身智能跨域脆弱性風(fēng)險,如跨域致幻、跨域越獄攻擊等新型威脅,綜合物理域、信息域安全性指標(biāo),以及跨域系統(tǒng)性指標(biāo)形成具身智能評測技術(shù)體系。
構(gòu)建規(guī)范化評測工具平臺。針對具身智能本體安全,開發(fā)聲、光、電、磁等多物理場信號驅(qū)動的具身智能硬件帶內(nèi)帶外脆弱性評測平臺,以及具身大模型多維度指標(biāo)評測平臺(圖4)。針對交互安全,建設(shè)虛實(shí)結(jié)合、人機(jī)協(xié)作的評測平臺。為克服在現(xiàn)實(shí)世界中對具身智能整機(jī)評測的成本高、速度慢及風(fēng)險高等瓶頸,應(yīng)同步開發(fā)具身智能仿真評測平臺,實(shí)現(xiàn)大規(guī)模、高并行的具身智能安全評測。同時,為保證人機(jī)協(xié)作過程中的人身安全,應(yīng)注重考慮設(shè)計人在回路的安全評測場景與任務(wù)。最終,保證具身智能體走進(jìn)千家萬戶的時候能夠避免“傷人害己”。

具身智能安全防護(hù)技術(shù)
具身智能安全治理還應(yīng)關(guān)注基礎(chǔ)理論、安全設(shè)計、生產(chǎn)實(shí)現(xiàn)等方面的具體防護(hù)技術(shù)。
突破可信具身智能關(guān)鍵基礎(chǔ)理論與技術(shù)。具身大模型因其具有模型黑箱、涌現(xiàn)機(jī)理不明及策略難以解釋等特征,在大規(guī)模應(yīng)用,尤其是關(guān)鍵基礎(chǔ)設(shè)施和國防軍工領(lǐng)域的應(yīng)用中面臨巨大挑戰(zhàn)。應(yīng)重點(diǎn)發(fā)展價值對齊技術(shù),確保具身智能系統(tǒng)的策略與人類價值觀和社會利益保持一致,從而增強(qiáng)具身智能的內(nèi)生安全性。同時,發(fā)展具身智能策略監(jiān)測與自診斷技術(shù),結(jié)合思維鏈、檢索增強(qiáng)生成等技術(shù),使具身大模型能夠清晰呈現(xiàn)輸出策略的邏輯推理過程,實(shí)現(xiàn)對具身智能系統(tǒng)運(yùn)行內(nèi)在機(jī)理的反向推斷與監(jiān)測,從而全面提升具身智能的可靠性、安全性和透明性。
發(fā)展全鏈路數(shù)據(jù)隱私保護(hù)技術(shù)。該技術(shù)有助于保障“人—機(jī)—物”數(shù)據(jù)安全和交互隱私安全。應(yīng)系統(tǒng)性地考慮數(shù)據(jù)在感知、儲存、傳輸和使用等全生命周期各環(huán)節(jié)中的隱私問題,構(gòu)建完整的隱私保護(hù)體系。在數(shù)據(jù)感知環(huán)節(jié),重點(diǎn)解決傳感器過度感知的問題,通過傳感器內(nèi)部做到數(shù)據(jù)脫敏和匿名化處理,實(shí)現(xiàn)傳感器生成數(shù)據(jù)“自源保護(hù)”,達(dá)到“生而隱私”的理念;在數(shù)據(jù)傳輸環(huán)節(jié),采用數(shù)據(jù)加密和隱私計算技術(shù),確保傳輸信道的安全性。同時,通過研究可驗證的多方安全技術(shù),全方位保障用戶隱私數(shù)據(jù)在整個具身智能體工作鏈路中的機(jī)密性和完整性。
保障具身智能軟硬件供應(yīng)鏈安全。推動具身智能關(guān)鍵軟硬件國產(chǎn)化、自主化,打造更安全更自主可控的產(chǎn)業(yè)體系,保障具身智能產(chǎn)業(yè)安全。在硬件方面,把控硬件設(shè)計、制造、封裝測試和運(yùn)輸各環(huán)節(jié)的安全,提防因硬件后門或漏洞造成具身智能系統(tǒng)失控或是癱瘓等惡意事件。在軟件方面,構(gòu)建自主可控的模型算法全棧技術(shù),包括底層硬件、異構(gòu)計算框架、機(jī)器學(xué)習(xí)框架等;并且,緊密跟蹤軟硬件產(chǎn)品的漏洞披露信息,及時采取修補(bǔ)加固措施。
思考改進(jìn)具身智能系統(tǒng)設(shè)計規(guī)范。結(jié)合不同應(yīng)用場景和安全等級要求,在系統(tǒng)設(shè)計階段就應(yīng)優(yōu)先考慮安全需求與目標(biāo),形成科學(xué)完備的設(shè)計規(guī)范。為防止具身智能系統(tǒng)被濫用,必須審慎界定其權(quán)力與能力邊界。從系統(tǒng)安全角度,重點(diǎn)研究防御嵌入技術(shù)機(jī)制,特別是關(guān)注具身智能面臨的多模態(tài)對抗攻擊風(fēng)險。在“物理域—信息域”和“信息域—物理域”等跨域環(huán)節(jié)中,通過嵌入傳輸數(shù)據(jù)過濾檢查等防御技術(shù),重點(diǎn)防范跨域過程中的安全隱患,全面加固和增強(qiáng)具身智能系統(tǒng)的防御能力,確保系統(tǒng)運(yùn)行的安全性和可靠性。
具身智能安全治理原則
雖然具身智能技術(shù)仍處于發(fā)展的早期階段,尚未出現(xiàn)重大轟動性具身安全事件。但是,仍需盡早開始探索實(shí)踐具身智能治理方案與制度,引導(dǎo)具身智能產(chǎn)業(yè)良性發(fā)展和培育。本文建議具身智能安全治理,需要關(guān)注以下4個方面。
建立全流程具身智能監(jiān)管體系。貫徹我國針對生成式人工智能技術(shù)與應(yīng)用治理的方針路線,秉持促發(fā)展和強(qiáng)監(jiān)管并舉的理念,采取包容審慎、分類分級監(jiān)管的敏捷治理模式,積極牽引“負(fù)責(zé)任的具身智能”落地。加強(qiáng)頂層設(shè)計謀劃,針對性地研究制定相關(guān)的監(jiān)管規(guī)范,推進(jìn)建設(shè)事前備案、事中風(fēng)險評估、事后溯源檢測的全流程監(jiān)管體系,嚴(yán)格把控約束具身智能發(fā)展的紅線。尤其是,可以借鑒目前大模型備案制度,針對具身智能中的“大腦”模型和“小腦”模型應(yīng)從算法數(shù)據(jù)、算法模型、算法策略和應(yīng)用領(lǐng)域等方面做好備案工作。強(qiáng)調(diào)具身智能與物理世界相交互的重要特性,強(qiáng)化對于具身“大腦”模型物理風(fēng)險認(rèn)知能力,以及具身“小腦”模型向客觀物理規(guī)律對齊的評估工作。針對具身實(shí)體,如機(jī)器人、無人車、無人機(jī)等,做好系統(tǒng)性備案工作,記錄硬件型號、廠商、批次等關(guān)鍵信息,形成具身實(shí)體“身份證”。具身智能系統(tǒng)中應(yīng)設(shè)置“黑匣子”來采集運(yùn)行過程中的模型輸出策略和硬件狀態(tài)信息,以便于事后能夠溯源、定位、追責(zé)系統(tǒng)中的問題模塊、使用者和責(zé)任廠商,改進(jìn)提升具身智能系統(tǒng)安全。
重視具身智能社會域倫理問題。除了硬性監(jiān)管防控,具身智能治理還需關(guān)注具身智能所帶來的倫理規(guī)范與社會問題。具身智能深入社會生活生產(chǎn)后,許多傳統(tǒng)繁重、重復(fù)勞動將被取代,為避免失業(yè)潮,應(yīng)積極探索調(diào)整社會就業(yè)結(jié)構(gòu),提供勞動者再培訓(xùn)和技能提升的機(jī)會。具身智能的發(fā)展也將重塑人機(jī)關(guān)系,隨著具身智能在家庭機(jī)器人等領(lǐng)域的應(yīng)用,特別是相較于聊天大模型應(yīng)用,具身智能機(jī)器人還具備擬人化的外觀和物理可接觸屬性,很可能造成人類對于具身智能情感上和勞動技能上過度依賴,引發(fā)新的倫理問題。因此,政府應(yīng)該積極引導(dǎo)公眾對于具身智能形成正確的價值觀念與認(rèn)識,強(qiáng)調(diào)人類的主體性。一旦出現(xiàn)具身智能破壞物品資產(chǎn)和危害人身安全等事故,如何去劃分安全責(zé)任歸屬,也是具身智能治理的關(guān)鍵問題。應(yīng)積極討論細(xì)化風(fēng)險場景和主體,研究制定相應(yīng)的法律法規(guī),明確具身智能下的責(zé)任歸屬問題。
推動完善多主體協(xié)同下的具身智能治理格局。積極發(fā)揮企業(yè)在具身智能產(chǎn)業(yè)中的創(chuàng)新主體地位,提升企業(yè)在具身智能產(chǎn)品研發(fā)和技術(shù)突破過程中的安全關(guān)切和要求,推動形成企業(yè)方具身智能產(chǎn)品安全自評估的制度規(guī)范。加強(qiáng)學(xué)術(shù)界在具身智能安全基礎(chǔ)理論和關(guān)鍵技術(shù)突破中的引領(lǐng)作用,培育高水平、有深厚學(xué)科交叉背景的具身智能安全創(chuàng)新人才和團(tuán)隊。建立政府引導(dǎo)、行業(yè)自律、企業(yè)自治、學(xué)界引領(lǐng)、社會監(jiān)督的多主體協(xié)同下的敏捷治理體系與具身智能治理格局。
發(fā)展形成最低安全管控機(jī)制。為避免具身智能系統(tǒng)在關(guān)鍵應(yīng)用領(lǐng)域失控,從而造成巨大破壞,應(yīng)發(fā)展最低安全管控機(jī)制。在特殊情況下,人類能夠強(qiáng)制介入控制或是關(guān)閉具身智能系統(tǒng),實(shí)現(xiàn)安全托底,保障環(huán)境和用戶安全,加固具身智能安全的最后一道防線。
具身智能安全建議與未來展望
具身智能安全是網(wǎng)絡(luò)空間安全在智能時代下的新形態(tài)、新挑戰(zhàn),也將是各國戰(zhàn)略競爭新的制高點(diǎn)。為推動我國具身智能產(chǎn)業(yè)持續(xù)健康發(fā)展,不使“連接人與神的巴別塔”反成人類“通往地獄的階梯”,本文認(rèn)為,未來應(yīng)重視以下具身智能安全方面的工作。
促進(jìn)學(xué)科交叉發(fā)展,形成具有中國特色的具身智能安全治理方案。具身智能安全是全流程、全生命周期的安全,應(yīng)并重軟硬件協(xié)同安全,同時還需關(guān)注具身智能給社會治理帶來的深遠(yuǎn)影響。這不僅要求不同安全研究方向的科研工作者相互合作,還需要人工智能、控制科學(xué)、法律、社會學(xué)等領(lǐng)域的跨學(xué)科交叉共同合作研究,共同推進(jìn)具身智能安全的整體治理。
突破基礎(chǔ)理論研用,提升我國在具身智能安全領(lǐng)域的國際話語權(quán)。具身智能安全是一個重要新型研究領(lǐng)域,需要突破具身智能安全的基礎(chǔ)理論,構(gòu)建系統(tǒng)化的具身智能安全研究體系,明確研究方向和重點(diǎn),搶占該領(lǐng)域的科研高地。同時,應(yīng)注重科研成果的產(chǎn)研轉(zhuǎn)化,推動理論研究向?qū)嶋H應(yīng)用落地,形成自主可控的技術(shù)體系,為我國在該領(lǐng)域確立國際話語權(quán)和競爭優(yōu)勢提供有力支撐。
加快人才培養(yǎng)培訓(xùn),推動我國具身智能產(chǎn)業(yè)的良性、健康發(fā)展。推動具身智能安全的產(chǎn)、學(xué)、教深度融合,充分促進(jìn)學(xué)術(shù)界與工業(yè)界的優(yōu)勢互補(bǔ),培養(yǎng)一批有深厚學(xué)科交叉背景、具備國際競爭力的復(fù)合型人才。同時,加大對具身智能安全領(lǐng)域的科研團(tuán)隊與青年學(xué)者的科研資源支持力度,鼓勵產(chǎn)出具有原創(chuàng)性、影響力的科研成果。通過人才培養(yǎng)與技術(shù)創(chuàng)新的雙輪驅(qū)動,形成良性互動的發(fā)展格局,助力我國具身智能產(chǎn)業(yè)持續(xù)健康發(fā)展。
(作者:徐文淵、冀曉宇、閆琛、程雨詩,浙江大學(xué)電氣工程學(xué)院?!吨袊茖W(xué)院院刊》供稿)







