Skip to content

FSBI: Self-Blended Images for Generalized Deepfake Detection (FSBI)

  • 作者:Ahmed Abul Hasnanaath
  • 年份:2024
  • 机构:King Fahd University of Petroleum and Minerals
  • 论文链接arXiv
  • 代码链接GitHub

1. 论文背景与动机

深度伪造检测模型在遇到未知类型伪造时常常表现不佳。FSBI关注于提升检测模型的泛化能力,提出自混合图像(SBI)合成和小波频域特征,旨在生成多样化伪造样本并增强特征表达。

2. 方法原理与实现细节

  • 核心思想
  • 通过单图像两次不同增强,检测人脸关键点生成mask,融合两图生成SBI伪造样本。
  • 采用小波变换提取RGB三通道频域特征,提升对伪造的敏感性。
  • SBI(Self Blended Image)合成流程
  • 对单张图像分别做两次不同的随机增强,增强方式包括:
    • RGB和HSV抖动
    • 对比度和亮度抖动
    • 下采样
    • 平移 得到两张增强图像 \(I_t\)\(I_s\)
  • \(I_s\) 上用人脸关键点检测模型生成mask,取关键点凸包,经过高斯模糊和膨胀处理得到平滑mask \(M\)
  • 按如下公式融合两张图像: \(\(I_{SBI} = I_s \cdot M + I_t \cdot (1 - M)\)\) 其中 \(M\) 为[0,1]区间的灰度张量,边缘平滑。
  • 频域特征生成
  • 将图像分为R、G、B三个通道
  • 分别对每个通道做小波变换,提取频域系数
  • 将各通道系数resize到同一尺寸后拼接,作为最终频域特征输入检测器
  • 网络结构
  • 输入为SBI合成图像,特征提取后送入分类器。
  • 创新点
  • 自混合伪造样本生成,提升训练数据多样性。
  • 小波频域特征增强模型泛化能力。
  • 损失函数
  • 采用常规分类损失。
  • 流程图/结构图
  • FSBI方法流程图

3. 实验设置与结果分析

  • 在多种公开伪造数据集上训练和测试,评估跨伪造类型的检测能力。
  • SBI样本和频域特征显著提升了模型对未知伪造的检测准确率。

4. 主要贡献与不足

  • 贡献
  • 提出自混合图像合成和小波频域特征,提升检测模型泛化能力。
  • 不足
  • 对极端复杂伪造或极小区域伪造的检测仍有提升空间。

5. 个人点评/启示

FSBI通过数据增强和频域特征提升了伪造检测的鲁棒性。自混合伪造和小波特征值得在其他视觉任务中借鉴。

💬 Comments Share your thoughts!