生成式人工智能图像模型的列表还在不断增长。
周一,人工智能公司Luma发布了其新的文本到图像模型Photon。面向设计师和创意人员,该模型建立在Luma的Dream Machine视频生成器之上,该生成器允许用户从他们上传的图像中创建短视频剪辑。
与Dream Machine一样,Photon是为所有人设计的,目标受众是那些“在我们周围建造世界的人,从设计师、电影制作人、视觉思想家到小企业和教育工作者,”发布解释说。这包括从时尚到架构的所有用例。
Photon具有多图像输出和清晰的文本渲染功能,基于Luma定制的通用变压器架构,该公司声称该架构使其“比其他同类机型快800%,价格便宜”。与类似的生成器一样,用户可以在编辑和定制生成的图像时调整提示。
Luma还宣布了一个Photon API,可能会在2024年底之前发布。可扩展的API将允许开发人员创建文本到图像和图像到图像的内容。
a16z普通合伙人、Luma AI董事会成员Anjney Midha在新闻稿中表示:“Luma AI的真正魔力在于成为每个创作者独特创意DNA的家园——他们的参考资料、风格和历史——而Dream Machine则随着每个用户的创意旅程而学习和发展。”
Luma希望用户将Dream Machine和Photon视为真正的创意合作伙伴,能够理解用户独特的环境和需求。其中一个功能允许用户上传一个人的照片,并创建一个可重复使用的“角色”,光子可以在几个单一的图像场景中描绘——这是一个头脑风暴活动的理想工具。用户可以上传该人的肖像,并在提示符中加上“@character”来激活该功能。
然而,在ZDNET的演示中,Photon似乎在某些位置的角色渲染自然表情方面存在一些问题,这立即引起了人们对深度伪造和其他潜在滥用的担忧。
Luma的使用指南中有一个关于内容审核的说明,表明该公司将删除某些生成的图像。
值得注意的是,Luma表示,来自Photon的输入和输出数据不会用于训练该公司的模型。在演示过程中,当被问及Luma的训练数据集时,首席执行官Amit Jain表示,他无法透露其中包含的内容,以及它是否包含从互联网上抓取的材料或授权内容。
就版权问题而言,指导方针有点模糊。该公司要求用户“不要要求或生成侵犯版权或商标材料的内容”,并“始终尊重知识产权”。
最后,该公司还发布了Dream Machine的新界面,现在可以在网页和iOS上使用。据该公司介绍,它可以与自然语言一起使用:不需要学习如何成为一名更好的提示工程师。
新界面易于使用,让人想起其他生成器,这些生成器在提示符中识别关键描述符,并在您想修改想法或探索不同变体的情况下提供类似替代方案的下拉菜单。该服务面向任何想要探索设计概念,迭代产品想法,头脑风暴以及通过Luma方便的情绪板基础设施与团队成员合作的用户。
“视觉人工智能服务”还提供图像和视频的个性化功能,以及每月10美元起的免费和付费订阅。