南洋理工大学与A*STAR联合推出局部鲁棒图像水印技术新突破——MaskMark,实现AI水印领域成本优化新SOTA

整理后的文章

低成本实现AI水印新突破:南洋理工大学A*STAR联合研究

近年来,随着AI生成(AIGC)的快速发展,图像溯源和版权保护成为行业关注的重点。给AI生成的作品添加水印,已经成为确保图像可追溯性的关键手段。然而,传统水印技术存在诸多局限性,例如全局嵌入方式难以应对局部篡改、无法精准定位水印区域等。

为解决这些问题,来自南洋理工大学和新加坡A*STAR前沿人工智能研究中心的研究团队提出了一种全新的局部鲁棒图像水印方法——MaskMark。该方法不仅在性能上全面超越Meta出品的顶级模型WAM,而且训练成本仅为后者的1/15,展现出极高的性价比。

MaskMark的核心优势

多水印嵌入与精准定位
MaskMark支持多种水印嵌入方式,包括多水印嵌入、灵活提取局部水印以及精准定位篡改区域。这一特性使其能够适应不同的应用场景,如整体图像保护、版权声明、隐私感知场景等。

掩码机制驱动的技术创新
研究人员通过引入掩码机制,让模型“看得见”水印的具体位置。MaskMark设计了两个版本:
– MaskMark-D:适用于整体图像保护,即使部分图像被篡改,也能成功提取水印。
– MaskMark-ED:专注于特定区域的水印嵌入(如人脸或LOGO),对小范围攻击更具鲁棒性。

端到端训练流程
MaskMark的训练流程分为四个阶段:
1. 掩码生成:从预定义类型中随机选择或生成一个掩码M。
2. 水印嵌入:将水印比特嵌入原始图像,并结合轻量级CNN和U-Net结构优化视觉效果。
3. 水印掩码操作:使用掩码M融合并裁剪出仅含水印信号的区域。
4. 水印提取:解码器预测掩码并提取水印比特,同时减少非水印区域的干扰。

性能表现

高精度提取
在全局水印任务中,即使在高视觉保真度下(PSNR > 39.5, SSIM > 0.98),MaskMark仍能保持近乎100%的比特准确率。尤其在几何失真攻击下,其表现显著优于现有基线模型。

精准定位能力
无论水印区域比例如何变化,MaskMark的定位性能(以IoU衡量)均优于EditGuard和WAM等方法。特别是在小区域定位任务中,MaskMark-ED表现出明显优势。

高效性与扩展性
MaskMark仅需在单个A6000 GPU上训练约20小时,计算效率比WAM高出15倍。此外,它还支持不同比特长度(如32、64、128位)的消息嵌入,并保持较高性能。

快速微调能力
通过简单调整失真层或进行少量微调,MaskMark即可适应不同的鲁棒性需求和新兴威胁,展现出强大的灵活性。

论文与代码链接
– 论文链接:[https://arxiv.org/abs/2504.12739](https://arxiv.org/abs/2504.12739)
– 代码链接:[https://github.com/hurunyi/maskmark](https://github.com/hurunyi/maskmark)

本文来源: 量子位【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...