文字感知图像修复技术突破:2025 年 6 月,韩国科学技术院(KAIST)AI 研究院闵在元、朴贤熙、金胜龙教授团队联合高丽大学、延世大学和三星电子,提出了文字感知图像修复(TAIR)技术,并开发了 TeReDiff 模型。该模型通过构建包含 10 万张高质量图像的 SA-Text 数据集,经过 “基础绘画训练”“文字专业训练”“协同训练” 三个阶段,让图像修复和文字识别两个模块协同工作。同时,引入 “智能提示机制”,能准确恢复老照片中的文字内容,解决了图像修复领域长期存在的文字恢复难题。
高分辨率修复技术优化:Stable Diffusion 模型在老照片高分辨率修复方面取得进展。它通过图像扩展,借助大量数据训练智能猜测图像细节,使模糊或低清晰度部分变清晰;利用生成对抗网络(GANs)进行细化处理,去除噪声和假影子;最后对整个图像进行重建优化,让每个像素在高分辨率下协调一致,可将模糊老照片修复为高清图像。
智能工作流提升修复效果:ComfyUI 工作流可用于老照片修复,结合 ControlNet 和 IPAdapter 等技术,前者能约束画面结构,后者可提取人物面部特征,从而保持人物基本形象不变。微软开发的 ComfyUI - Bringing - Old - Photos - Back - to - Life 插件,可实现破损识别修复和面部增强,能去除照片中严重的划痕、折痕和破损,还可增加高清修复和替换背景颜色等功能。
风格化修复模型开源:阿里妈妈创意团队开源了 AI 图像修复模型 FLUX - Controlnet - Inpainting。它结合了 FLUX.1 - dev 和 ControlNet 的优势,既能高精度修复图像,又能根据用户指令调整图像风格,适用于日常图像修复、老照片修复、艺术作品修复等多个场景,用户还可通过自然语言描述对图像进行修复,降低了使用门槛。
