google i/o 发布会的内容
google 紧随 open ai 开了今年的 i/o 发布会,一个字概括就是全。模型层面所有的指标都在卷,同时也发布了所有现在主流的模型类型。产品层面所有的产品内容全部都接入了 ai 能力,包括命根子搜索也做了大刀阔斧的 ai 改革。
- gmini 1.5 pro 宣布开始支持 200 万上下文,跨关键用例的一系列质量改进,例如翻译、编码、推理等”,但没有发布测试结果。
- flash:这款更小的 gemini 模型针对较窄或高频任务进行了优化,其中模型响应时间的速度最为重要。提到百万 token 的价格比 gpt-3.5 要便宜。
- gemini 模型家族的构成:
- ultra:“最大的模型”(仅在gemini advanced提供)
- pro:“最佳总体性能模型”(在 api 预览版中提供)
- flash:“轻量级速度/效率模型”(在 api 预览版中提供)
- nano:“设备上模型”(将内置于chrome 126中)
- gemini gems 谷歌的 gpts,支持自定义与 gemini 的互动方式。
- gemini live :“使用声音进行深入的双向对话的能力。”,project astra 实时视频理解个人助理聊天机器人,就是基于这个能力。
- gemma 2:6 月发布规模为27b(之前为 7b 和 2b),以一半的尺寸提供接近 llama-3-70b 的性能。
- paligemma:谷歌的第一个视觉语言开放模型,灵感来自pali-3 。
- veo:deepmind 对标 sora 的模型,hn 上有些体验过的人表示不太行,国际象棋的棋盘和棋子生成的都不对。
- imagen 3:图像模型,能够理解人们自然书写的提示,生成更高质量的逼真图像,并且在渲染文本方面表现卓越。
- music ai sandbox:旨在彻底改变音乐创作方式的ai工具套件。用户能够全新创作乐器部分,轻松在不同曲目间转换风格。
- trillium:最新的tpus,在每颗芯片的计算性能上,相比上一代tpu v5e,实现了高达4.7倍的显著提升。
其中值得关注的演示内容有两个一个是 的,一个是 的。
- 谷歌搜索的更新:
- ai overviews:今天将开始向美国所有人推出,很将能够通过选项调整 ai 概述,以简化语言或更详细地解释。
- 引入多步骤推理能力,这一功能能够将复杂的问题拆解成多个小部分,明确解决问题的顺序和方法。
- 很快就能在搜索中使用视频提问了。
- 提前计划:在搜索中直接具有规划功能,可以为需要的任何事物制定计划,从餐饮到度假。
- ai 组织的搜索结果:搜索将使用生成式人工智能与您进行头脑风暴,并创建一个由人工智能组织的结果页面(跟 arc 那个 demo 类似)。
- workspace(gmail): 内置了gemini pro 1.5,可以帮助总结查找邮件内容和编写邮件回复。
- 谷歌文档:侧边栏的 gemini pro 1.5 集成,文档的改写总结等。
- 谷歌表格:使用 gemini 和 data q&a 功能请求帮助,创建表格和数据分析等功能在今年晚些时候推出。
- google photos:ask photos可以帮助用自然语言搜索图片和视频,可以理解并回答复杂问题。
- circle to search:现在成为了极佳的学习小帮手,可以在手机或平板上圈选复杂的物理问题,获得分步骤的指导帮助你学会解题。
原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/yun296214.html