巨人网
产经 科技 企业 数据 峰会 快讯

苹果再出手,300亿参数AI大模型MM1.5来了!

2024-10-13来源:ITBEAR编辑:瑞雪

苹果公司近期为其多模态大模型MM推出了1.5版本,新版本在延续前代MM1数据驱动训练原则的基础上,着重研究了混合不同类型数据对模型性能的影响。相关模型文档已在Hugging Face上发布,并附有论文链接。

MM1.5版本提供了10亿至300亿多种参数规模的选择,具备图像识别和自然语言推理能力。苹果的研发团队在新版本中改进了数据混合策略,显著增强了模型在多文本图像理解、视觉引用与定位以及多图像推理方面的表现。

根据参考论文,苹果在MM1.5的持续预训练阶段引入了高质量的OCR数据和合成图像描述,大幅提升了模型对富含文本内容的图像的理解能力。研究团队还在监督式微调阶段分析了不同数据类型对模型性能的影响,并优化了视觉指令微调数据的混合方式,使模型实现了更高的效率,即便是小规模的模型(10亿、30亿参数版本)也能展现出优秀的性能。

苹果公司此次还推出了MM1.5-Video模型,专门用于视频理解,以及MM1.5-UI模型,专注于移动设备用户界面的理解。MM1.5-UI模型未来有望成为iOS背后的“苹果牌”AI,它能够处理各种视觉引用与定位任务,总结屏幕上的功能,或者通过对话与用户进行交互。

特斯拉Cybercab遭质疑:双座设计,真的实用吗?
10月13日消息,特斯拉前天发布了名为Cybercab的自动驾驶出租车原型,其双座跑车的设计风格与传统出租车截然不同,令投资者和分析师感到困惑。马斯克表示,他希望Cybercab的运营成本低于公共交通…

2024-10-13

宝马MINI Cooper五门版掀背车,11月15日上市?期待了!
10月13日消息,据懂车帝报道,全新MINI五门燃油版有望于今年11月15日(媒体日)开幕的2024广州车展上市,将继续以进口方式销售。这是MINI品牌最后一款仅提供燃油动力的车型,作为参考,前代MI…

2024-10-13

银联国际牵手越南NAPAS,跨境支付新篇章?
2021 年,NAPAS 推出国家二维码 VietQR,随后银联推进银联二维码与 VietQR 互联互通。 获悉,未来越南本地VietQR 钱包将可在包括中国在内的 47 个国家和地区直接扫银联二…

2024-10-13

鸿蒙公测引爆热情,华为原生系统报名超百万!
一位车主发布视频称,今年 7 月 1 日,他花费 215 万元在苏州元星奔驰 4S 店购买了一辆全新迈巴赫 GLS480,提车仅 2天就发现中控异响,7 月 11 日将车送回 4S 店维修,当天还发现副驾…

2024-10-13