刑法如何規制AI“投毒”現象?
2026-05-14 16:44 今日文教周刊 車笑
中國社會科學院大學法學院 車笑
近日,有關AI“投毒”的黑灰產業鏈被曝光,引發了社會的強烈關注。具體來說,AI“投毒”就是通過向生成式人工智能大模型投入大量的虛假信息,使其產生虛假認知,從而將這種認知傳遞給用戶。目前,AI“投毒”主要存在兩種模式:一是“數據投毒”。通過向AI大模型訓練數據中注入偽裝成正常樣本的惡意數據,從而削弱模型的性能、降低其信息來源的準確性;二是“模型投毒”。其主要模式是通過模型微調、插件植入、接口篡改,在模型權重中嵌入觸發式惡意指令:模型日常運行并無異常,但遇到特定關鍵詞、產品類別時會自動輸出預設虛假信息,可定向操控榜單、誤導用戶。此種AI“投毒”亂象不僅嚴重干擾了商業秩序、影響信息傳播,更為嚴重的是,其還會被用于間諜活動,從而對國家政治安全、數據安全、社會安全等造成系統性、長期性危害。因此,一種長期性、根本性、嚴厲性的法治手段勢在必行。在此,刑法即為我們提供了一種有效的規制路徑。
當前,我國現行《刑法》對AI“投毒”現象規制主要涉及以下兩類罪名:一是擾亂社會公共秩序類犯罪中涉及破壞計算機信息系統類的犯罪,諸如“破壞計算機信息系統罪”,另一類是侵犯財產類犯罪中涉及侵犯市場準入秩序與保護經營者正當權益的“非法經營罪”與“破壞生產經營罪”。但實際上,這些罪名對于當前AI“投毒”亂象的規制卻存在難點。一是“破壞計算機信息系統罪”無法精準契合AI投毒的模型。破壞計算機信息系統罪所規制在于“造成計算機信息系統不能正常運行”的行為,而AI“投毒”通常不影響系統功能本身——模型仍在運行,只是輸出結果存在錯誤。所以,AI“投毒”實際上不能與《刑法》中所規定的破壞計算機信息系統行為相等同。如若盲目地適用此罪名對AI“投毒”行為進行規制,則存在違反罪刑法定原則的風險。二是“非法經營罪”與“破壞生產經營罪”也無法對于AI“投毒”行為所造成的傷害精準匹配。非法經營罪的規范目的是“市場準入秩序”,即進入特定市場應獲得相應的經營許可,而AI“投毒”則是對寬泛意義上的市場秩序的破壞,并不構成對市場準入秩序的侵害;破壞生產經營罪所規制的行為在于對“生產資料”的“破壞”,而AI“投毒”行為既不涉及有形的生產資料,也行為模式也并非“破壞”。綜上,現行罪名體系雖然能夠對這一現象進行規制,但卻不夠精準,核心原因即在于,現有刑法對網絡犯罪的規制模式側重于“運行端”與“實體端”,而沒有給予“內容端”與“產出端”以應有的關注。
為了更精準有效地懲治AI“投毒”亂象,有必要進一步完善相應的刑事規制體系。具體而言,可以采取“兩步走”的應對策略。第一,就短期而言,宜采取擴大解釋的進路,在既有罪名框架內對AI“投毒”行為進行涵攝。例如,可將《刑法》第286條第2款中的“數據”進行擴大理解,包含系統外部但卻構成AI知識來源的訓練數據,從而用以規制“數據投毒”亂象;同時,也可以將“干擾”進行擴大解釋,即這種“干擾”不僅是一種使得“計算機信息系統不能正常運行”的行為,其同樣可以是減損了“數據可用性”,使得數據完整性受損的行為。第二,就長遠來看,《刑法》應當加強專門規制,專設罪名,將數據安全從系統安全中獨立出來予以保護。在此,可借鑒域外經驗,設立“破壞數據完整性罪”,以數據類型、規模、違法所得或經濟損失作為入罪門檻。
根治AI“投毒”亂象,刑法規制是治本之策,但絕非唯一途徑。對AI“投毒”亂象的治理應當將其放置在“法制統一”的框架之下,綜合利用多種法律手段。當前,我國網絡安全的立法框架已基本成型,諸如《網絡安全法》《數據安全法》等法律對人工智能訓練數據也都有了相應的規制。在此背景下,治理AI“投毒”不應寄望于單部法律的單兵突進,而應致力于構建不同法律層級間的制度合力。在此,可嘗試構建“行政監管—民事救濟—刑事制裁”三位一體的梯度化治理格局。在行政監管層面,應充分激活《網絡安全法》關于人工智能訓練數據安全的前置監管功能,壓實平臺企業的數據審核義務,將“投毒”行為阻斷于語料輸入環節;在民事救濟層面,應暢通被侵權主體的損害賠償路徑,賦予因AI虛假輸出而遭受損失的用戶、經營者以明確的可訴依據;在刑事制裁層面,則可以嘗試“兩步走”的漸進制度升級,確保刑法作為“最后手段”的審慎性、精準性與威懾力。唯有三種手段協同發力、前后銜接,方能避免“都管都不管”的治理碎片化困境。此外,技術治理亦不可缺位。應鼓勵研發針對數據投毒的自動化檢測工具,推動“以技術規制技術”的安全生態建設。唯有法律與技術雙輪驅動,監管與自律并行推進,方能從根源上鏟除AI“投毒”的滋生土壤,讓人工智能在法治軌道上安全運行,真正服務于社會公共利益,筑牢數字時代國家安全的堅實屏障。
