如何营销改变世界的AI

   日期:2025-08-27     来源:本站    作者:admin    浏览:72    
核心提示:      昨天下午,OpenAI发布了视频生成模型Sora,该模型承诺将书面文本提示转换为高度逼真的视频。该公司发布的视频描述了

  

  

  昨天下午,OpenAI发布了视频生成模型Sora,该模型承诺将书面文本提示转换为高度逼真的视频。该公司发布的视频描述了这样的例子:“一只戴着贝雷帽和黑色高领毛衣的Shiba Inu狗”,“在一个华丽的历史大厅里,一个巨大的浪潮达到顶峰,开始崩溃。”媒体的兴奋让人想起了2022年围绕图像创造者DALL-E或ChatGPT的舆论:苍井空被形容为“令人瞠目”、“改变世界”、“令人惊叹,但又令人恐惧”。

  画面确实令人印象深刻。乍一看,一个动画“毛茸茸的怪物”看起来比《怪物史莱克》更好;一个女人眼睛的“极端特写”,加上她面前的场景的反射,令人惊讶地栩栩如生。但苍井空也笼罩在神秘之中。目前,除了经过OpenAI批准的安全测试人员和艺术家之外,没有人可以使用该程序(尽管该公司首席执行官萨姆·奥特曼(Sam Altman)一直在社交媒体上接受Sora的即时请求,并发布结果)。这种模式很可能带来人们已经飘浮的幻想。也许这将是一个想象力的引擎,一场电影革命,或者是一个错误信息的机器。但就目前而言,最好将其视为一种挑衅或广告闪电战。

  尽管这些产品中的许多都被吹捧得强大到足以颠覆我们对世界的看法,或者彻底摧毁它,但像OpenAI这样的公司往往不会详细说明它们的内部工作原理。(最近的一项研究在人工智能透明度指数上给包括OpenAI在内的10家大型科技公司打了不及格。)《麻省理工科技评论》(MIT Technology Review)在同意了被其记者称为“不寻常”的条件后,才得以预览Sora制作的样本视频,即在OpenAI宣布这款产品之前,他们不会征求外界的意见;最初,并没有相关的研究论文。

  OpenAI后来发布的技术报告包含了简短的通用描述,对技术细节的描述很少。这远不是第一个文本到视频的模型(meta在2022年9月发布了一个,大约比ChatGPT发布早两个月),但现在,没有公司外部的人研究或测试Sora的能力,知道它是如何建立的或与以前的产品进行比较是不可能的。从报告中可以明显看出,与这家初创公司的语言模型类似,OpenAI向Sora注入的计算能力越强,其输出的质量就越高——当用16倍的资源生成时,一团可怕的皮毛就会变成逼真的、可爱的小狗。除了任何技术突破之外,Sora可能是OpenAI数十亿美元资金的最新成果,也可能是最引人注目的成果——这是规模和创新的胜利。

  OpenAI的一位发言人在一份书面声明中告诉我,该公司正在“尽早分享我们的研究进展,以便开始与OpenAI以外的人合作,并从他们那里获得反馈,让人们了解即将出现的人工智能功能。”当被问及训练数据时,发言人只会说明该模型是根据“许可和公开可用的内容”进行训练的;当被问及潜在的危害时,她说公司仍在努力解决“错误信息、仇恨内容和偏见”。

  OpenAI并不是唯一一个保密的公司。同样在昨天,谷歌宣布了其旗舰语言模型Gemini 1.5的更新版本,并将其誉为“突破”。但是,除了一小部分开发人员和主要的企业客户之外,没有人能够测试其最先进的功能。许多其他人工智能产品也在没有太多相关信息的情况下发布。

  然而,我们确实知道,人工智能产品的演示往往包含缺陷,有些是次要的,有些是令人尴尬的,苍井空也不例外。OpenAI自己也承认,它在描述物理、因果关系(该公司表示,你可能会要求提供一个人咬饼干的视频,却发现没有留下咬痕)和其他简单的细节(一个人在跑步机上走错了路)方面遇到了困难。网络侦探还发现了其他失败,比如物体消失和畸形的手。尽管如此,这款产品还是令人惊讶——尽管令人兴奋,但它也引发了人们对深度造假、版权侵犯、艺术家生计、隐藏偏见等问题非常熟悉但又严重的担忧。

  与此同时,互联网上充斥着狗仔队式的理论和观察:猜测苍井空是如何工作的;暗示苍井空不是在创造新东西,而是在复制现有的视频;对比显示了它的视频和一个领先的文本到图像模型的输出之间的相似性。就目前而言,这些担忧无法判断是对还是错。公众仍然不太了解DALL-E和ChatGPT的内部工作原理,但至少我们可以自己测试这些产品的功能;随着苍井空的宣布,OpenAI已经进入了创造神话的领域。

 
打赏
 
更多>同类文章

推荐图文
推荐文章
点击排行