文章开始之前先说个冷知识:今年是Google举办I/O开发者大会的第15个年头。 纵观近七年来的I/O大会,AI内容一直是Google的重中之重。例如在ChatGPT爆火之前,Google就已经在I/O大会上展示过LaMDA系列语言生成模型,只是一直没等到大火的机会。 如今,ChatGPT的爆发让AI来到了最好的时刻,但也让Google感到无比焦虑。 看完整场大会,Google共提及「AI」一词近200次,几乎把AI写进了包括Gmail、搜索、Pixel等所有产品里面,迫切地想向所有人证明自己仍在AI最前沿。 如果把这场大会开在半年以前,那么它将无比精彩:AI协助办公、AI搜索、AI编程,每一项都是重要的技术应用。只可惜在此之前,微软已经把所有的路都走了一遍。 现场观众的反应甚至可以说有点冷淡。事实上,现场只出现了两次热烈的欢呼:Bard的暗黑模式,和Pixel平板免费赠送底座。 在今天的I/O大会上,Google发布的新产品、技术都像是对微软和OpenAI的一次追赶——追赶那个被抢先实现的AI未来。 PaLM2,Google反击GPT-4的秘密武器 大语言模型目前俨然成为了科技圈最顶尖的产品,各家公司都希望能够拿出能够叫板GPT的自研模型,以证明自己的科研实力,Google也不例外。 Google发布了全新一代的大语言模型PaLM2,与GPT-4对抗。 根据Google介绍,他们用了大量数学和科学数据集对PaLM2进行训练,相比去年的PaLM模型,PaLM2在多语言处理、推理和编码能力上有了很大的提升。 原文地址在下方⬇️:https://ai.google/static/documents/palm2techreport.pdf 根据Google的官方测试,PaLM2的部分结果(例如数学)比GPT-4还要好。 Google并没有透露PaLM2具体的参数规模,只提到PaLM2是基于最新的JAX和TPUv4计算设施构建的。Google对PaLM2做了算法优化,使得它在体积上比PaLM要小,但整体性能更好,计算效率更高。 PaLM2支持100多种不同的语言和20多种编程语言,包括JavaScript、Python、Prolog、Verilog、Fortran等,可以说是个语言通。 仅能做常规的文字理解和生成还不够,支持多模态的PaLM2还能看懂和生成音视频内容,Google展示了一个名为Med-PaLM的专为医疗领域微调的模型,可以根据X光片分析病人伤势,Google其在这方面已经达到人类医生的水平。 PaLM2模型还可以「拆分」成不同大小的4种版本,在各种设备上部署。例如在智能手机上就可以运行规模比较小的Gecko模型,让移动端也能拥有大语言模型。 值得一提的是,PaLM2目前已经开放预览,Google自家的聊天机器人Bard已经用上了PaLM2模型,增强自己的作答能力。Google内容已经有超过70个产品团队在使用PaLM2构建产品,本场大会上绝大部分更新都是基于PaLM2模型设计而来,可以说PaLM2就是Google全面AI化的核心引擎。 除了PaLM2,GoogleCEO桑德尔·皮查伊还稍微了剧透了一点下一代大模型Gemini(双子座)的消息,他称Gemini旨在实现多模态、高效和为未来创新而构建。。 Gemini是GoogleBrain和DeepMind两个顶尖AI团队合并后共同开发的全新模型,从命名上可以看出,Gemini将会集二者之所长,有望挤入最强大的大语言模型之列。 Bard:升级多模态,能画图也能读图 更好看,更综合,更多人可以用到。 在不到2个月的更新后,Google将Bard迁移到功能更强大的大语言模型PalM2,这个ChatGPT和BingChat的竞争对手得到了大幅更新,能力更强大: 取消等候名单,向180多个国家和地区开放;新增图片问答,对话更加直观;整合AdobeFirefly,快速生成图片;来源引用、深色模式、代码导出按钮,更多细节更新。 英美限定、只会英文、等候名单,想用到限制颇多的Bard并不是件容易事。即日起,Bard正式宣布取消等候名单,并向180多个国家和地区开放体验。 Bard现在还支持了日语和韩语,很快就会将支持语言扩大到40种,包括中文。 功能方面Bard也有不小的升级,用四个字总结就是「图文并茂」。询问Bard问题时,它不再是一个只会干巴巴回复文字的机器人,还能用图片的形式为我们展示更丰富直观的答案。 同时,Google还将GoogleLens的能力带入了Bard,让后者不仅可以回复图片,还能看懂图片,根据图片信息起草内容。比如,你可以把一只狗的照片发给他,让它根据狗的品种来写一些标题。 或许是隔壁文生图的功能好评声音太大,Google也为Bard新增了这一功能,不过它是与AdobeFirefly合作的,整合了Firefly的Bard,就可以用自然语言生成高质量图像了。而且有了Adobe的背书,图片的版权、质量都不需要担心。 Adobe只是开始,Google还将与Kayak、OpenTable、zip招聘公司、可汗学院等多个合作伙伴与同努力,为Bard增加更多功能。 相比ChatGPT,Bard的定位更偏向BingChat,兼顾搜索引擎与生产力工具的它,会在下周加入引用功能,并为生成的代码展示来源以确保准确性。并新增了导出、运行代码的能力,方便开发人员高效工作。顺便还新增了深色模式,引起了现场欢呼。 虽然初登场时闹过一些乌龙,但Google还是让我们看到了一个不断进步的Bard。只可惜在介绍中我们听到最多的词还是「we’ll」,等今日发布的功能全部实装上线后,Bard就是一款足够全面且成熟的工具了。 DuetAI:办公的事交给AI做 Copilot的竞争者来了。 Google为自己的Workspace引入了一个全新的工具DuetAI,让我们看到了AI在基于云计算的Google办公套件中扮演的角色: 文档:总结全文、自动编写;幻灯片:文生图,提高效率;表格:分析数据,制定策略。 在Google文档中,你可以告诉DuetAI想要创作的内容,让它自动生成文章。你也可以让它根据需求生成不同文风。 「阅读」文章、重点提问的类「ChatPDF」功能也没落下。 这些文字生成、扩写、调整的能力,同样也应用在GoogleMail里。 幻灯片方面,DuetAI扮演着一个图片生成器的角色,可以帮你节省在互联网上找图的时间,并用原创内容来丰富幻灯片。 在表格里,DuetAI可以根据你的提问自动整理数据,让数据更加规范。 这些能力也可以与其他Google服务进行联动,比如当你在Bard中创建好一个表格后,可以一键生成表格文档,方便后续使用。 DuetAI还增加了一套机器学习驱动的Google云开发工具,可以提供实时代码纠错、生成等,支持Go、Java、Javascript、Python和SQL等多种开发语言。 不用等Bard通过的我们,现在又可以等DuetAI了,如果你想体验这些功能,还是需要加入等待名单,等待Google在对应地区开启测试。 总体来说,DuetAI少了些初见Copilot的惊艳,功能演示上似乎也弱了一些。但Bard用不到两个月的时间便迎头赶上,期待DuetAI能带来更多可能性吧。 Google搜索:重新定义,全面全能 未来的搜索,或许应该长这样: 在PaLM2的驱动下,Google搜索也迎来了革新,推出了全新的搜索引擎SGE(SearchGenerativeExperience),你不需要再把一个大问题分割成多个小问题,搜索后再把答案凑起来,有了生成式AI的加持,你可以让搜索干一些重活了。 大会中,Google重点展示了生成式AI在购物方面的提升,当你使用Google搜索一款产品时,你会看到它的产品描述、评论、价格和展示图。 拥有超过350亿产品列表的Google,还在以每小时18亿的速度不断更新着,通过Google搜索购物,你可以获得更新鲜、可靠的结果。 Google认为,广告是互联网的重要组成部分,他们将继续坚持对广告透明度的承诺,并保证广告和搜索结果的区分。 今天Google将开放搜索实验室的注册,并在未来几周内开启访问,支持Googleapp和Chrome浏览器。申请链接如下:labs.google.com/search Google的AI焦虑,只能用AI来解 有人戏称本届GoogleI/O应该叫做GoogleAI/O,微软和OpenAI的珠玉在前,Google少了一点令人高呼Amazing的时刻,但这无疑也是Google近年来最为坚决的一次自我革命。 自称AI-first的Google,却一直因为过于谨慎保守的策略多次错失先机。如今Google也终于意识到自己必须快速行动,就像Google多位高管所说的那样要「大胆而负责任」,不能再因为害怕犯错而踌躇不前了。 当然AI也并非万能药,大升级后的Bard也未必能改变Google搜索被颠覆的趋势。但毫无疑问,AI会重塑搜索,彻底改变这种交互方式。 份额远不如Google的Bing已经通过聊天机器人,在短短几个月达到超过1亿的日活跃用户,进行了超过5亿次聊天,其中70%尝试新Bing聊天功能的用户,都会用来进行搜索相关的任务。 当全球最大的搜索引擎决定抛下过往包袱,完全拥抱这个趋势,被改变的或许就不仅仅是Google的未来,更可能颠覆互联网的运行机制,改变数十亿的用户的交互。 一个全新、更简洁的世界将会来临。 香奈兒包包 https://www.aartmt.com/category/brand/chanel ![]() |