【猎云网(微信号:ilieyun)】5月27日报道(编译:田小雪)
伴随科技发展,想要准确判断某段视频的真实性,已经变得越来越难。
据外媒报道,近日,三星位于莫斯科的人工智能实验室研究人员,已经成功借助神经网络将静止图像变为动图甚至视频。基于大量动图和视频素材,以及“深度卷积神经网络”训练,三星的人工智能技术能够准确识别某些面部特征,从而进一步将静止图像变为动态图像。
在一篇题为《Few-Shot Adversarial Learning of Realistic Neural Talking Head Models》的文章中,三星人工智能中心的研发人员具体介绍了这项技术。虽然借助该技术生成的图像质量,不如此前异常火爆的DeepFake“换脸”技术,但考虑到DeepFake需要大量图像素材作为生成基础,三星还是存在一定优势的,毕竟它只需要一张图片即可生成一段视频。
在实验中,三星人工智能中心的研究人员,以陀思妥耶夫斯基、萨尔瓦多·达利、爱因斯坦、玛丽莲·梦露甚至蒙娜丽莎的静止图像为基础,分别生成了他们正在说话的视频。
虽然目前这些视频的质量仍然较低,无法实现以假替真,但正如数年前人工智能图像生成技术一样,经过数年持续研究,视频质量应该就能得到大幅优化。
当然,这类技术所带来的影响,还是为不少人所担心的。在这类技术的支持之下,仅仅一张照片就能生成虚假视频。而对于现代人来说,获取照片是一件再容易不过的事情。换句话说,如果再配上事先准备好的音频素材,这类技术工具几乎能够做到“操控任何人说出任何话”。不仅如此,就在去年,英伟达还推出了新一代生成式对抗网络(Generative Adversarial Networks),能够生成足以以假替真的人脸高清大图。如若未来这些技术越来越强大、越来越普及,那么区分真假将会变得异常困难。因而,专门用于区分真假的技术工具,最好也能同时实现发展进步。