在刚刚结束的Google I/O大会上,Google CEO Demis Hassabis公布了一系列令人瞩目的数据:Gemini应用月活跃用户突破9亿,每月处理的Token数量高达3200万亿,Nano Banana生成图片数量超过500亿张。这些数字不仅展示了AI技术在Google生态中的深度渗透,也预示着AI正成为驱动公司发展的核心动力。
本次大会的发布内容从模型创新切入,逐步延伸至编程工具和智能代理领域。Gemini Omni作为新一代多模态模型,将推理能力与生成式媒体技术相结合,不仅能够处理视频、图像等传统内容,还能模拟物理世界的运动规律和重力效应。例如,用户输入"生成蛋白质折叠黏土动画"的指令后,模型可自动将抽象科学概念转化为直观视频内容。该模型还支持视频风格迁移、元素添加等自然编辑功能,用户甚至可将普通圆形转化为黑洞效果,或将日常散步场景转化为戏剧化画面。
在编程领域,Gemini 3.5 Flash的推出标志着AI代码生成进入新阶段。相比前代模型,3.5 Flash在代码能力和真实经济任务处理上均有显著提升,输出速度达到行业前沿水平的4倍,经过Antigravity优化后更可提升至12倍。Google现场演示了用该模型构建操作系统的复杂任务:93个智能代理并行工作12小时,完成调度器、内存管理等核心模块开发,期间处理26亿Token,消耗成本不足1000美元。这种效率提升正在重塑软件开发范式,照片编辑套件、实时通讯应用等项目的开发周期从数天压缩至数小时。
搜索业务的变革同样引人注目。AI Mode月活用户突破10亿,查询量保持季度翻倍增长。升级后的智能搜索框支持文本、图像、视频等多模态输入,并能根据用户问题提供AI建议。更值得关注的是搜索代理功能的推出:用户可创建个性化信息代理,持续跟踪市盈率低于15的生物科技股,或监控租房信息等动态数据。当条件变化时,代理会自动推送综合更新。结合Antigravity技术,搜索结果还将呈现交互式视觉组件,用户可通过调整参数探索"双黑洞引力波"等复杂科学问题。
消费端产品创新聚焦个人生活场景。Gemini Spark作为运行在Google Cloud专用虚拟机上的智能代理,可在用户离线时持续执行任务。现场演示中,Spark自动汇总Gemini Live会议记录,提取关键信息生成团队邮件;在管理社区派对时,它能同步更新Google Sheets签到表,生成提醒邮件草稿,并自动创建宣传幻灯片。该产品本周启动可信测试,下周将面向美国AI Ultra订阅用户开放Beta版本,同时推出100美元新订阅计划,最高档套餐价格从250美元降至200美元。
创意工具领域迎来全面升级。Google Pics支持从基础图生成派对海报、信息图等视觉内容,用户可删除元素、调整对象大小并编辑文字;Stitch设计工具通过自然语言指令生成网站界面,支持语音修改和代码导出;Google Flow则引入多代理协同机制,可批量生成不同机位视频,或将清晨场景批量转换为深夜效果。这些工具均内置SynthID水印技术,该技术已为超过1000亿张图片和视频添加隐形标识,未来将扩展至Search和Chrome浏览器。
硬件布局方面,Google将Android XR平台从头显设备扩展至智能眼镜形态。音频眼镜作为首批产品,由三星参与硬件开发,Warby Parker与Gentle Monster负责设计,支持Android和iOS系统连接。用户可通过眼镜实现导航、自动下单咖啡、管理日程等操作,与手表配合还可拍摄现场照片并生成卡通图像。在网络安全领域,CodeMender代码安全代理能够自动检测和修复软件漏洞,即将启动专家测试并向更广泛用户开放。
这场信息密度极高的发布会,折射出Google从免费互联网服务向AI订阅基础设施转型的战略意图。当长上下文记忆、多模态生成等能力带来持续算力消耗时,传统的"免费功能升级"模式已难以覆盖成本。通过叠加智能服务层,Google正在构建包含更强模型、更长记忆、更深系统权限的新生态体系。这种转变能否被市场接受,将取决于用户对"全天候处理邮件、统筹任务、分析报表的超级助理"的价值认知——当AI不再只是工具,而是成为数字生活的延伸时,付费意愿的门槛或许将自然降低。