分享好友 最新资讯首页 最新资讯分类 切换频道
国安部:警惕人工智能「数据投毒」,0.01%虚假训练文本可致有害内容增加11.2%
2025-08-07 14:19

8月5日,国家安全部发布安全提示文章,人工智能的训练数据存在良莠不齐的问题,其中不乏虚假信息、虚构内容和偏见性观点,造成数据源污染,给人工智能安全带来新的挑战。

全文如下:

当前,人工智能已深度融入经济社会发展的方方面面,在深刻改变人类生产生活方式的同时,也成为关乎高质量发展和高水平安全的关键领域。然而,人工智能的训练数据存在良莠不齐的问题,其中不乏虚假信息、虚构内容和偏见性观点,造成数据源污染,给人工智能安全带来新的挑战。

图片
数据是人工智能的基础
图片

人工智能的三大核心要素是算法、算力和数据,其中数据是训练AI模型的基础要素,也是AI应用的核心资源。

——提供AI模型的原料。海量数据为AI模型提供了充足的训练素材,使其得以学习数据的内在规律和模式,实现语义理解、智能决策和内容生成。同时,数据也驱动人工智能不断优化性能和精度,实现模型的迭代升级,以适应新需求。

——影响AI模型的性能。AI模型对数据的数量、质量及多样性要求极高。充足的数据量是充分训练大规模模型的前提;高准确性、完整性和一致性的数据能有效避免误导模型;覆盖多个领域的多样化数据,则能提升模型应对实际复杂场景的能力。

——促进AI模型的应用。数据资源的日益丰富,加速了“人工智能+”行动的落地,有力促进了人工智能与经济社会各领域的深度融合。这不仅培育和发展了新质生产力,更推动我国科技跨越式发展、产业优化升级、生产力整体跃升。

图片
数据污染冲击安全防线
图片

高质量的数据能够显著提升模型的准确性和可靠性,但数据一旦受到污染,则可能导致模型决策失误甚至AI系统失效,存在一定的安全隐患。

——投放有害内容。通过篡改、虚构和重复等“数据投毒”行为产生的污染数据,将干扰模型在训练阶段的参数调整,削弱模型性能、降低其准确性,甚至诱发有害输出。研究显示,当训练数据集中仅有0.01%的虚假文本时,模型输出的有害内容会增加11.2%;即使是0.001%的虚假文本,其有害输出也会相应上升7.2%。

——造成递归污染。受到数据污染的人工智能生成的虚假内容,可能成为后续模型训练的数据源,形成具有延续性的“污染遗留效应”。当前,互联网AI生成内容在数量上已远超人类生产的真实内容,大量低质量及非客观数据充斥其中,导致AI训练数据集中的错误信息逐代累积,最终扭曲模型本身的认知能力。

——引发现实风险。数据污染还可能引发一系列现实风险,尤其在金融市场、公共安全和医疗健康等领域。在金融领域,不法分子利用AI炮制虚假信息,造成数据污染,可能引发股价异常波动,构成新型市场操纵风险;在公共安全领域,数据污染容易扰动公众认知、误导社会舆论,诱发社会恐慌情绪;在医疗健康领域,数据污染则可能致使模型生成错误诊疗建议,不仅危及患者生命安全,也加剧伪科学的传播。

图片
筑牢人工智能数据底座
图片

——加强源头监管,防范污染生成。以《网络安全法》《数据安全法》《个人信息保护法》等法律法规为依据,建立AI数据分类分级保护制度,从根本上防范污染数据的产生,助力有效防范AI数据安全威胁。

——强化风险评估,保障数据流通。加强对人工智能数据安全风险的整体评估,确保数据在采集、存储、传输、使用、交换和备份等全生命周期环节安全。同步加快构建人工智能安全风险分类管理体系,不断提高数据安全综合保障能力。

——末端清洗修复,构建治理框架。定期依据法规标准清洗修复受污数据。依据相关法律法规及行业标准,制定数据清洗的具体规则。逐步构建模块化、可监测、可扩展的数据治理框架,实现持续管理与质量把控。

国家安全机关将在以习近平同志为核心的党中央坚强领导下,全面贯彻总体国家安全观,与有关部门一道防范针对我人工智能领域的数据污染风险,依法维护人工智能安全和数据安全,不断筑牢国家安全屏障。(国家安全部)

最新文章
智能新闻写作助手:探索AI技术在新闻采编与内容创作中的应用前景-2024ai学习
智能新闻写作助手:探索AI技术在新闻采编与内容创作中的应用前景随着科技的飞速发展人工智能()逐渐渗透到各行各业新闻行业也不
沈阳市“爱我国防 强国有我”系列主题宣传教育活动推进会在和平区南京一校长白岛第一小学举行|国防教育|沈阳市委_网易新闻
为深入贯彻落实习近平总书记关于加强全民国防教育的重要指示精神,不断增强国防教育吸引力感染力,普及国防知识,增强全民国防观
地产研究革新利器!CRIC深度智联重新定义行业效率_腾讯新闻
引言在房地产行业深度调整的当下,如何突破传统研究模式的桎梏,实现高效、专业、精准的研究成果产出?CRIC深度智联作为房地产行
我国50岁以上网民突破3.51亿 最爱玩《开心消消乐》_腾讯新闻
快科技1月13日消息,QuestMobile 2025年银发人群洞察报告显示,截至2025年11月,我国50岁以上银发网民月活跃用户规模达3.51亿,
专业蜻蜓写作平台官网 - 创意文案与内容创作新篇章-2024ai知识
专业蜻蜓写作平台官网 - 创意文案与内容创作新篇章在数字化时代内容创作已成为信息传播的必不可少手,无论是企业传、推广还是个
《助贷新规》执行在即 百融旗下榕树贷款最高36%年利率广告投放不停歇!_腾讯新闻
百融云创上半年营收53%靠导流,净利润2.01亿元,同比增长41%。近日,「互金圈」经常刷到百融旗下“榕树贷款”的广告。广告合规存
【硬件资讯】消息称,未来RTX 50系列供应量或大幅增加?_腾讯新闻
最近到处传出有关英特尔拆分英特尔代工和芯片设计部门的消息,传闻英特尔正面临来自台积电和博通的潜在收购要约。其中台积电评估
朝日集团控股披露网络安全事件致近200万个人信息或泄露
日本朝日集团控股公布今年9月末发生的网络安全事件调查结果,显示近200万份个人信息存在泄露风险。朝日集团控股表示,日本当地时
上门回收新30年茅台酒瓶免费上门收购茅台空瓶
上门回收新30年茅台酒瓶免费上门收购茅台空瓶;1、30年茅台酒瓶子回收:常年高价提供30年茅台酒瓶、30年贵州茅台酒瓶、30年年份
新书速递 | 林希最新长篇小说《梧桐庭院》出版_腾讯新闻
公元一九一二年,皇帝退位,民国建立,孙中山在南京就任中华民国大总统,没过多少日子,又听说袁世凯在北京接替孙中山成了中华民