谷歌Gemini Omni模型发布：跨模态编辑新突破，自然语言指令轻松改大片-峰会-巨人天成财经

在最新一届Google I/O开发者大会上，谷歌推出了具有突破性意义的Gemini Omni多模态人工智能模型。这款模型不仅能够处理文本、图像、音频和视频等多种输入形式，还具备跨模态内容生成与编辑能力，标志着人工智能技术在多媒体处理领域迈出了重要一步。

据谷歌介绍，Gemini Omni在音频处理方面已实现初步突破。虽然目前仅支持语音输入功能，但公司计划在短期内扩展更多类型的音频输入能力，进一步丰富用户交互方式。这一特性使其在语音助手、智能客服等场景中具有广泛应用潜力。

该模型的核心优势体现在其深度视频编辑功能上。用户只需通过自然语言指令，即可对视频内容进行精细修改，包括添加或删除特定对象、调整摄像机视角、改变场景环境与艺术风格等操作。这种交互方式显著降低了视频创作的专业门槛，使普通用户也能轻松完成高质量视频制作。

在内容生成质量方面，Gemini Omni展现出强大的逻辑推理能力。通过对物理规律的理解和跨学科知识的整合，模型生成的视频在角色行为、场景转换和视觉叙事上保持高度连贯性，甚至能够根据上下文自动推演后续情节发展。更引人注目的是，用户可以创建个性化数字分身，并将其自然融入视频场景中。

针对生成内容的安全性问题，谷歌同步推出了技术保障措施。所有通过Gemini Omni生成的视频都会自动嵌入SynthID数字水印，这种隐形标记可通过Google搜索和Chrome浏览器进行验证，有效防止虚假信息的传播。这一举措体现了谷歌在推动AI技术创新的同时，对内容真实性的高度重视。

在产品落地方面，首发版本Gemini Omni Flash已通过Gemini应用向个人用户开放。拥有Google AI Plus/Pro/Ultra订阅服务的用户，以及YouTube Shorts混剪创作者和YouTube Create应用用户，均可免费体验这项新技术。企业客户稍后将获得API接口权限，以便将模型能力集成到自有产品中。

Google DeepMind负责人哈萨比斯在发布会上强调，Gemini Omni代表了人工智能发展的重要方向。通过整合多模态处理能力和复杂场景理解，该模型正在推动AI系统从执行特定任务向具备通用认知能力演进，为构建更智能的人机协作模式奠定了基础。

阿里Qwen3.7-Max发布：聚焦Agent能力，引领国产大模型迈向新阶段

因此，Qwen3.7-Max 的发布是阿里把模型、云、MaaS、开发者工具和真实业务场景连接起来，参与 Agent 时代竞争的一个重要节点。它既是千问模型能力的一次更新，也是阿里把模型、云服务、MaaS、应…

2026-05-20

2026马来西亚My‑Plas塑胶展启幕，搭建平台共探东南亚橡塑产业新未来

2026-05-20

广西首个5G-A海域超远覆盖测试成功开启智慧海洋建设新篇章

北海5月19日电(张广权韦啸嵩张馨予)中国电信广西公司近日携手中兴通讯，在北部湾海域成功完成广西首个基于3.5G+2.1G频段的5G-A技术海域超远覆盖与智能化网络保障技术测试。本次试点通过多项创新技术组…

2026-05-20

场景为舵技术为帆：高校全光网络建设以太彩光方案适配性深度洞察

极简以太彩光4.0通过将主干单芯光纤与弱电间透明汇聚构建为纯物理的“光学透明通道”，在未来十年内升级时，高校信息办无需变动既有物理布线工程，只需在核心设备与终端交换机两侧插拔更换更高速率的标准光模块，即可平滑…

2026-05-20

无线麦克风出口日本必看：TELEC认证全流程解析与核心要点汇总

无线麦克风（发射器）属于主动发射无线电信号的设备，出口日本必须办理 TELEC 认证（技适认证），这是日本《电波法》的强制性要求。证书一般长期有效，但若无线模块、天线、硬件或影响射频的软件发生实质变更…

2026-05-20

长江存储母公司长控集团拟IPO，AI算力爆发下其市值有望突破万亿？

2026-05-20

云深处IPO获受理引关注 “摘星脱帽”潮涌67股申请潜力股浮现

2026-05-20

港股“商业航天第一股”拓璞数控首日上市涨幅近80%市值达193亿港元

2026-05-20

中巨芯5月20日大宗交易：500万股折价成交成交额达8835万元

2026-05-20

*ST高科澄清与长江存储无关联股价午后“天地板” ST洲际等ST股异动

2026-05-20