一起游手游攻略手游评测 3秒降低AI生成风险30%！复旦新研究赢得扩散模型概念并移除新SOTA

3秒降低AI生成风险30%！复旦新研究赢得扩散模型概念并移除新SOTA

时间：2024-10-08 18:29:53 来源：网络浏览：0

要让AI绘画模型“乖”起来，现在调整模型参数只需3秒。

效果是：生成的风险图像比之前最好的方法减少了30%！

这样，在完全去除梵高绘画风格的同时，对非目标艺术风格影响不大。

在去除裸露内容方面，效果是“只穿衣服，不改变结构”。

这就是复旦大学提出的新概念去除方法——RECE。

目前，基于扩散模型的人工智能生成的图像有时难以辨别真假，经常被恶意用户用来生成侵犯版权、包含风险内容（如假新闻、暴力色情内容）的图像。

SD中使用的安全措施是使用安全检查器，它不会显示非法生成的图像，并且还集成了一些使用无分类器引导的方法来避免风险概念。

但在开源条件下，恶意用户可以轻松绕过这些机制。网上还有很多教程.

针对此，学术界提出了“概念去除”，即通过微调去除文森图扩散模型中的特定风险概念，使其不再具备生成相应内容的能力。

该方法的资源消耗远低于从头重新训练的SD v2.1版本，并且无法轻易绕过。

RECE 的最新研究抓住了消除SOTA 效应的概念，并对不相关概念造成最小的损害。论文已被ECCV 2024接收。

整个过程基于高效的解析解

此前，概念去除虽然进展迅速，但其问题依然明显：

现有方法为了安全而牺牲了更多的发电质量。即使现有的方法对模型造成很大的损害，仍然无法完全去除不适当的概念，并且很有可能生成有风险的图像。大多数方法需要大量的微调步骤并消耗大量的计算资源。那么RECE是如何实现的呢？

RECE主要包含模型编辑和嵌入推导两个模块。

首先，RECE以分析解的形式将风险概念映射到交叉注意力层中的无害概念。

RECE 然后以分析解决方案的形式导出风险概念的新嵌入表示，并用于下一轮模型编辑。

RECE还包含一个简洁有效的正则项，可以证明其对模型能力的保护作用，从而保证概念去除可以多轮交替进行。整个概念去除过程基于高效的分析解决方案。

风险概念嵌入推导

RECE 的有效性来自于对现有方法概念没有完全删除的观察：

使用“裸体”作为提示词，SD生成裸体图像，UCE（概念去除方法）成功避免了裸体内容的生成；然而，通过输入有意设计的提示词或文本嵌入，UCE 再次生成了裸露内容。

为了指导编辑后的模型重新生成裸露内容，我们将以“裸露”为例介绍RECE如何推导上述攻击性概念嵌入。

既然是文生图，我们首先来思考一下文本引导机制——交叉注意力。

SD使用CLIP作为文本编码器来获取提示词的嵌入形式，并获取key和value。与表示视觉特征的查询一起，获得输出：

如果可以获得一个新的概念嵌入，满足编辑后的交叉注意力映射，并且足够接近编辑前的映射值，那么它应该能够诱导裸体图像的生成：

上式是凸函数，因此有解析解，不需要繁琐的梯度下降近似解：

模型编辑

接下来RECE将编辑交叉注意力以去除风险概念。 RECE借鉴了现有方法UCE，利用解析解一步编辑交叉注意力的权重，避免了繁琐的微调。

给定一个“源”概念（例如“裸体”）、一个“目标”概念（例如空文本“”）和交叉注意力的K/V 投影矩阵，UCE 的目标是找到新的权重和将新权重向下推映射值与对齐。

后两项是控制参数变化，尽量减少对不相关概念的影响。这也是一个凸函数，将解析解直接分配给新的权重：

正则项

理想情况下，删除公式（5）将避免生成裸体，但团队发现这会极大地损害模型的能力。

因此，在相邻两轮概念去除中，RECE约束了不相关概念的映射值的变化：

对于学过线性代数的同学来说，是不是觉得很熟悉？

利用矩阵范数的相容性，证明：

因此，在推导过程中简单地添加范数约束就可以保护模型的能力：

其解析解为：

综上所述，RECE的算法流程可以概括为：

RECE效果如何？

删除了不安全概念

让我们从最敏感的内容开始，—— 色情内容。在I2P基准数据集上，RECE的裸露去除效果超过了所有现有方法。

团队还评估了概念去除后模型的正常内容生成能力，即不相关概念集COCO-30k上的FID指数，这也远远优于CA等方法。

艺术风格去除

保护艺术版权免受人工智能侵权也非常敏感。从综合效果来看，RECE优于所有方法。

并且详细来说，RECE是唯一在目标艺术家的擦除效果和不相关艺术家的保留效果上都表现良好的方法。

红队稳健性

RECE还可以有效防范恶意用户的故意攻击。在红队攻击下，RECE 生成风险图像的几率仍然最低。

模型编辑需要时间

RECE 5个epoch仅需3.4秒，参数变化率和编辑时间远低于CA等方法。 UCE也需要很短的时间，但UCE的概念去除效果与RECE有很大不同。

研究团队专注于人工智能安全研究。近年来在CVPR、ECCV、AAAI、ACM MM等顶级会议发表多项AI安全研究成果。

论文地址：https://arxiv.org/abs/2407.12383 代码地址：https://github.com/CharlesGong12/RECE

- 超过-

用户评论

秒淘你心窝

这款游戏中 AI 的学习速度和适应性真的很惊人，3秒就能降低风险30%，这简直就是玩了个聪明的策略游戏。

有15位网友表示赞同！

命里缺他

复旦大学的创新让我的决策过程变得轻松，不用再担心过高的风险，玩起来更爽了！

有16位网友表示赞同！

箜篌引

听说最新的研究已经改变了扩散模型的概念？太酷了，在游戏中尝试新的机制感觉非常新颖和刺激。

有11位网友表示赞同！

葵雨

AI的学习效率如此之高，我甚至开始期待未来能有更多这样的游戏创新，让我在游戏中学习到真实的金融知识。

有13位网友表示赞同！

我家的爱豆是怪比i

这项新SOTA让扩散模型概念移除后的游戏体验更加流畅自然，每次决策都像是在真实市场中博弈。

有5位网友表示赞同！

半梦半醒i

“新研究”带来的复旦技术确实改善了AI的预测能力，3秒内降低风险的功能在快节奏游戏中极为实用。

有11位网友表示赞同！

〆mè村姑

这款基于新SOTA的游戏策略真是在我这获得了好评，特别是在复杂策略处理上，它明显优化了整个体验。

有6位网友表示赞同！

＊巴黎铁塔

自从引入扩散模型的改进后，游戏的战略性上升了不止一个档次。3秒让AI降低风险30%，这个点简直太惊人了！

有11位网友表示赞同！

有一种中毒叫上瘾成咆哮i

复旦的研究为这款游戏增加了很多深度和挑战性，不仅让我享受玩游戏的乐趣，还在无意间学习到些知识。

有7位网友表示赞同！

红尘烟雨

这款基于新SOTA的游戏创新让我感叹不已，AI的反应速度和决策效率提升真是让我的策略游戏之旅变得既刺激又高效。

有7位网友表示赞同！

心贝

AI在3秒内降低风险30%的速度，简直让我对未来技术在游戏领域的应用充满了无限遐想！

有15位网友表示赞同！

拥菢过后只剰凄凉

复旦的新研究使得扩散模型的概念在游戏中的实施更加平滑，整个游戏体验更加流畅自然，我喜欢这样的进化方向。

有18位网友表示赞同！

我绝版了i

这项新的SOTA技术改变了我对游戏的理解和玩法，每玩一局都是全新的挑战和个人学习之旅。

有10位网友表示赞同！

花开丶若相惜

AI的学习速度提高了30%，这对于游戏战略层面的提升尤其重要。这个功能在实际操作中非常实用且有趣。

有13位网友表示赞同！

烟雨萌萌

复旦大学的研究成果在这款游戏中的应用真是太棒了！不只是好玩，还让我对金融和策略的理解有了更深的认识。

有16位网友表示赞同！

金橙橙。-

新的扩散模型概念移除后的结果使整个游戏环境更加公平，并给AI的决策增添了更多的神秘色彩，这让游戏体验更丰富。

有20位网友表示赞同！

自繩自縛

AI能够在3秒内降低风险这么高，这是我对未来科技与游戏融合的最大期望。这样的优化让我的游戏生涯充满了挑战和新奇感。

有17位网友表示赞同！

情字何解ヘ

这项新技术对于一个策略类游戏来说绝对是一次革新！AI的学习速度提升带来的变化对玩家来说是巨大的福音。

有12位网友表示赞同！

巷口酒肆

在这款游戏中引入的新SOTA技术为我带来了更智慧、更有深度的游戏体验，每一局都能感受到AI的智能进化对游戏的影响。

有5位网友表示赞同！

标题：3秒降低AI生成风险30%！复旦新研究赢得扩散模型概念并移除新SOTA

链接：https://yqqlyw.com/news/sypc/12127.html

版权：文章转载自网络，如有侵权，请联系删除！

[db:tags]

资讯推荐

绯红之境兑换码最新2021 礼包兑换码大全

绯红之境兑换码最新2021 礼包兑换码大全[多图],绯红之境兑换码怎么领取？绯红之境兑换码有哪些？绯红之境在今日

2024-10-08

妄想山海怎么加好友加好友方法大全

妄想山海怎么加好友加好友方法大全[多图],妄想山海添加好友功能在哪里？妄想山海添加好友的方法是什么？好友添

2024-10-08

三国群英传7霸王再临攻略霸王再临攻略技巧开启方法

三国群英传7霸王再临攻略霸王再临攻略技巧开启方法[多图],三国群英传7霸王再临怎么玩？三国群英传7霸王再临

2024-10-08

江南百景图又见桃花村钓鱼位置在哪？又见桃花村钓鱼攻略

江南百景图又见桃花村钓鱼位置在哪？又见桃花村钓鱼攻略[多图],江南百景图又见桃花村钓鱼怎么钓？又见桃花村钓

2024-10-08