
周三,谷歌发布了其新的人工智能模型Gemini,让公众首次看到了一项让科技媒体陷入谣言的技术。Gemini是该公司迄今为止最强大的人工智能,将于今天开始在Bard和Pixel 8 Pro智能手机上使用,并将很快与谷歌服务的其他产品集成,包括Chrome、搜索、广告等。谷歌有一个最重要的信息想让你听到:这个东西比你从OpenAI得到的任何东西都要好得多。
谷歌首席执行官桑达尔·皮查伊在一份声明中表示:“这个新时代的模型代表了我们作为一家公司所做的最大的科学和工程努力之一。”“我真的为未来感到兴奋,也为双子座为世界各地的人们带来的机会感到兴奋。”
就在一年多前,OpenAI放弃了ChatGPT,让谷歌和其他公司争先恐后地证明他们的工具也同样先进。到目前为止,谷歌的聊天机器人巴德与ChatGPT相比相形见绌。这家搜索巨头表示,这种情况正在改变,从现在开始。巴德将是大多数人第一次接触双子座,尽管它不会带着该模型的全部功能发射。
双子座有三层。Gemini Ultra是谷歌最强大的机型,被定位为OpenAI GPT-4的竞争对手。Gemini Pro是一款中档机型,可以击败ChatGPT的基准版本GPT-3.5。最后是Gemini Nano,这是一款更高效的手机。
谷歌助理和巴德副总裁萧茜茜(Sissie Hsiao)在新闻发布会上表示,截至周三,巴德正在运行“经过微调的Gemini Pro版本”。“这将具有更高级的推理、规划、理解和其他能力。”
萧说,谷歌将在明年年初推出一款运行在Gemini Ultra上的付费版聊天机器人,该公司称其为Bard Advanced。她拒绝透露定价细节。
谷歌分享了一长串的基准测试,显示几乎在每一项指标上,新的Bard都优于免费版的ChatGPT。该公司分享了几次巴德新增压能力的演示,包括与youtube用户马克·罗伯(Mark Rober)的合作,其中人工智能帮助建造了一架超精确的纸飞机。
除了巴德,双子座也将在周三更新Pixel 8 Pro安卓手机,尽管容量有限。Gemini Nano现在为Pixel 8 pro上的Android Recorder应用程序的summary功能提供支持。谷歌表示,该人工智能还将支持Pixel 8 Pro上的安卓智能回复功能,但前提是你使用的是谷歌键盘,而且只能在WhatsApp上使用。该公司表示,明年将有更多的即时通讯应用和操作系统的其他部分加入Gemini。
目前,GPT-4是公众可用的最强大的模型。谷歌表示,它已经击败了GPT-4, Gemini Ultra推出后将成为市场上最好的人工智能。
谷歌DeepMind产品副总裁Eli Collins表示:“Gemini的得分超过90%,是第一个在行业标准基准MMLU上超过人类专家的人工智能模型。”“这是我们最大、最强大的人工智能模型。”MMLU是大规模多任务语言理解(Massive Multitask Language Understanding)的缩写,通过数学、物理、历史、法律、医学和伦理学等57个学科的标准测试来衡量人工智能的能力。

然而,目前尚不清楚公众何时能看到证据。上周,the Information报道称,谷歌推迟了Gemini的发布,因为该人工智能“无法可靠地处理一些非英语查询”。原定于本周举行的谷歌Gemini现场演示被无限期推迟。在回答有关所谓的外语问题时,柯林斯说:“实际上,双子座在多语言能力方面表现相当出色。”谷歌没有透露更多的具体信息,只是说Gemini Ultra将在“明年初”上市。
柯林斯说:“在32项广泛使用的行业基准测试中,Gemini的性能在30项上也超过了目前最先进的水平。”
谷歌强调,Gemini是为“多模式性能”而设计的,这意味着它可以理解不同类型的信息,如文本、图像、视频、音频等。谷歌分享了一段视频,在视频中,由双子座驱动的巴德帮助一名学生完成物理作业,首先是一张带有手写问题的作业照片。然后,人工智能会无缝过渡到书面建议,包括公式和一步一步的答案。
谷歌的双子座人工智能可以帮助你完成物理作业
字幕
从
英语
去年11月,路透社报道称,OpenAI在“通用人工智能”(AGI)方面取得了进展,这是一个行业术语,指的是比人类更聪明的人工智能,它拥有一个名为“Q- star”或“Q*”的秘密模型。所谓的新闻是Q*展示了回答基本数学问题的能力,这比听起来更重要,因为法学硕士们没有接受过只有一个正确答案的训练。数学能力将显示出高水平的推理能力。
谷歌一再强调Gemini的数学和物理性能,但在新闻发布会上没有提到AGI。Gizmodo问双子座的数学表现是否表明了AGI的进展。
柯林斯说:“我没有看到OpenAI工作的细节,所以我真的不能说。”“然而,我们在多模态推理和数学中的高级推理方面取得了很大进展。”




