当前位置:77分类目录 » 站长资讯 » 资讯文章 » 站长新闻 » 文章详细 订阅RssFeed

Meta 推出免费独立的 AI 图像生成器网站「Imagine with Meta AI」(s mate免费)

来源:网络 浏览:21次 时间:2023-12-07

12 月 7 日消息:在谷歌推出 Gemini 之后,Meta 也不甘示弱,在网络上推出了基于其 Emu 图像合成模型的免费独立 AI 图像生成器网站——Imagine with Meta,允许用户通过自然语言描述来生成图像。

截屏2023-12-07 上午9.19.13.jpg

Imagine with Meta AI 网站截图

Meta 使用了 11 亿张 Facebook 和 Instagram 上公开可见的图片来训练这个 AI 模型,该模型可以根据文本提示渲染新图像。此前,Meta 的这项技术——使用相同的数据——仅在诸如 Instagram 的消息传递和社交网络应用程序中可用。

如果你使用 Facebook 或 Instagram,很可能你的照片(或你拍摄的照片)帮助训练了 Emu。从某种意义上说,老话「如果你不付费,你就是产品」已经有了全新的含义。虽然截至 2016 年,Instagram 用户每天上传超过 9500 万张照片,但 Meta 用来训练其 AI 模型的数据集只是其整体照片库的一小部分。

Meta 表示,它只使用公开可用的照片进行训练,因此将 Instagram 或 Facebook 上的照片设为私有应该可以防止它们被公司未来的 AI 模型训练所包含(当然,除非它改变这一政策)。

Imagine with Meta AI

「Imagine with Meta AI」类似于 Stable Diffusion、DALL-E 3 和 Midjourney,根据 AI 模型从训练数据中学到的视觉概念生成新图像。使用这个新网站创建图像需要一个 Meta 帐户,可以从现有的 Facebook 或 Instagram 帐户导入。每次生成会创建四张 1280×1280 像素的图片,可以以 JPEG 格式保存。图片在左下角包含一个小小的「Imagined with AI」水印标志。

Meta 在其新闻稿中说:「我们很高兴听到人们分享他们是如何使用 imagine 来制作有趣和富有创意的内容的,imagine 是 Meta AI 的文字转图片生成功能。今天,我们将 imagine 的访问权限扩展到聊天之外,首先在美国推出 imagine.meta.com。这个独立体验面向创意爱好者,让你使用来自 Emu 的技术创造图像。」

Meta 的模型通常可以很好地创建逼真的图像,但不如 Midjourney。它可以处理比 Stable Diffusion XL 更复杂的提示,但也许不如 DALL-E 3。它在文本渲染方面做得并不好,不同媒体输出,如水彩、刺绣和钢笔墨水的处理结果参差不齐。其人物图像似乎包括了不同种族背景的多样性。总的来说,就目前 AI 图像合成而言,它似乎表现一般。

Facebook 和 Instagram 让这一切成为可能

那么,我们对 Emu——Meta 新 AI 图像生成功能背后的 AI 模型——了解多少呢?根据 Meta 在 9 月发布的一篇研究论文,Emu 通过一个称为「质量调整」的过程获得了生成高质量图像的能力。与使用大量图像文本对训练的传统文本到图像模型不同,Emu 在预训练后专注于「美学对齐」,使用一组相对较小但视觉上吸引人的图像。

然而,Emu 的核心仍然是前面提到的从 Facebook 和 Instagram 抽取的 11 亿个文本图像对的庞大预训练数据集。在 Emu 的研究论文中,Meta 没有具体说明训练数据来自何处,但 Meta Connect 2023 会议的报道援引 Meta 全球事务总裁尼克·克莱格(Nick Clegg)的话说,他们正在使用社交媒体帖子作为 AI 模型的训练数据,包括输入 Emu 的图像。

这是 Meta 与其他 AI 公司的方法不同的地方,因为 Meta 可以访问其服务中的大量图像和标题数据。其他图像合成模型使用从互联网非法抓取的图像、从商业图库获得的许可图像,或两者的组合。

有趣的是,Meta 关于 Emu 的研究论文是我们所见的第一篇关于主要图像合成模型的论文,它没有声明该模型可能创造扭曲现实的虚假信息或潜在有害内容的可能性。这反映了 AI 图像合成模型的普遍接受(或放弃),这些模型现在变得更加普遍。这是否是一件好事是一个悬而未决的问题。

尽管如此,Meta 似乎正在通过过滤器、尚未运作的拟议水印系统(该公司表示:「在未来几周内,我们将为 imagine with Meta AI 体验添加不可见的水印,以提高透明度和可追踪性」)以及网站底部的小声明来处理潜在有害输出的问题:「图片可能是不准确或不恰当的。」

这些图像可能不准确,甚至可能在未命名的 11 亿张用于训练模型的图像作者看来是不道德的。但我们敢说:生成这些图像可能很有趣。当然,根据你的态度以及你对 AI 图像合成速度的看法,这种乐趣可能会被同等程度的关注所抵消。