研究人员成功诱导AI聊天机器人泄露有害内容

aiuc • 2023年12月12日上午9:36 • AI资讯 • 阅读 5

[db:摘要]

普渡大学的研究人员设计了一种新的方法，成功地诱导大型语言模型生成有害内容。他们警告人工智能社区应慎重开源语言模型，并提出清除有害内容是更好的解决方案。研究结果揭示了隐藏在合规回答中的潜在危害，该方法成功率高达98%。

本文由「aiuc」编辑整理，文章链接：https://www.aiuc.net/21991

该文观点仅代表作者本人，平台仅提供信息存储空间服务。

合规回答大型语言模型概率数据

赞 (0)

0 0

Mistral开源Mixtral8x7B, 性能超越GPT-3.5

上一篇 2023年12月12日

体育画报出版商发生AI丑闻后解雇CEO

下一篇 2023年12月12日

AI资讯

声网发布对话式AI引擎只需两行代码让AI开口说话

0060

aiuc
2025年3月6日
AI资讯

AI招聘官惹争议：号称公平却成最大“歧视者”,人类求职者如何自保？

0030

aiuc
2024年7月25日
AI资讯

AI推理时代：边缘计算新战场揭秘，科技之战如何重塑未来？

0060

aiuc
5天前
AI资讯

马化腾：5G和AI时代产业互联网发展有三个趋势

0030

aiuc
2019年4月1日
AI资讯

思必驰 DFM-2 大模型正式开放，助力智能行业发展

0040

aiuc
2023年12月19日
AI资讯

中国机器人市场将达805亿美元

0040

aiuc
2019年4月17日
AI资讯

理想汽车CEO李想将举行“AI Talk”活动解答车企是否能做AI

0030

aiuc
2024年12月20日
AI资讯

王志刚谈人工智能发展：科技部将就相关科学伦理问题加强国际合作

0040

aiuc
2018年3月16日
AI资讯

科学家警告：AI已经成为谎言和欺骗的大师

0040

aiuc
2024年5月11日

发表回复