马斯克xAI新模型Grok 4.2公测，通过趣味测试，回答倾向引发热议-产经-巨人天成财经

马斯克旗下xAI公司推出的Grok 4.2公测版近日悄然上线，尽管团队近期经历高层动荡，这款新模型仍成为科技圈焦点。与当前主流大模型动辄万亿参数的规模不同，Grok 4.2仅采用5000亿参数架构，这种"轻量化"设计在测试阶段引发了截然相反的评价。

马斯克在社交平台连续转发十余条用户好评，并亲自下场"公关"："当前版本仍有缺陷，但公测结束后将比前代快得多、聪明得多。模型具备每周自我迭代能力，未来会持续进化。"据技术团队披露，新架构引入实时反馈机制，使模型能像人类一样通过实践快速优化，这种动态更新模式区别于传统静态升级逻辑。

测试阶段暴露的争议尤为突出。支持者展示其通过"弱智吧"风格逻辑测试的案例——当被问及"50米外洗车店该开车还是步行"时，模型准确识别出距离过近的矛盾性。另有用户证实其成功通过涉及性别认知的敏感测试，这项曾让ChatGPT陷入争议的题目，成为Grok 4.2的加分项。代码生成和多模态处理能力也获得开发者认可，部分测试显示其响应速度超越竞品。

反对声音则聚焦于参数规模限制。深度用户指出，在处理复杂逻辑推理时，5000亿参数明显力不从心，有开发者调侃："马斯克说的'横扫榜单'可能只在特定实验室环境成立。"更尖锐的批评指向模型偏见问题，测试显示多个回答与马斯克个人观点高度吻合，这与他宣称的"无偏见"原则形成反差。成本争议同样存在，有消息称其训练成本高于同类模型。

技术细节的缺失加剧了讨论的两极分化。xAI至今未发布完整技术报告，公开的评测数据仅限于部分排行榜成绩。这种信息透明度引发两种猜测：要么模型尚未成熟，要么团队在刻意保持神秘感。值得注意的是，马斯克转发确认了AI工程师Mark Krechman的爆料——当前版本只是"小尺寸"试水，中大型版本将在后续推出。

在模型公测同期，xAI还低调上线了Grok imagine视频生成工具，目前仅支持iOS平台。这项新功能与模型升级形成互补，显示出团队在多模态领域的布局野心。随着公测持续至下月，这场关于参数规模、更新模式与商业化的争论，或将因更多实测数据披露而迎来新转折。

巴菲特段永平齐减持苹果：一个求稳一个冲AI，科技投资风向要变？

2026-02-18

马年春晚科技闪耀：无人机破纪录、机器人秀功夫，新质生产力走进生活

XR、AR、数字分身全程贯穿，虚实结合的舞台效果让每一个节目都极具视觉冲击力，科技不再是点缀，而是今年春晚真正的主角。与往年简单的灯光特效不同，今年科技元素深度融入节目内核，从开场到零点倒计时，每一个高光时刻…

2026-02-18

高瓴HHLR四季度调仓：增持阿里拼多多等，清仓百度并减持多股

2026-02-18

科沃斯T90与热门扫地机器人大比拼：谁才是智能清洁的优选答案？

为了更好地了解T90的市场地位，我们将与以下几款同类产品进行详细对比：iRobotRoombai7、石头科技S5Max、360扫地机器人和小米米家扫地机器人。总结来看，科沃斯T90凭借其智能导航、强劲清洁能力…

2026-02-18

春晚成机器人“带货王”：搜索订单双激增，人形机器人加速进家庭

在刚刚结束的2月16日马年除夕夜，松延动力、宇树科技、魔法原子和银河通用这四家机器人公司扎堆登上央视春晚，成为今年春晚舞台上最硬核的科技景观。分析师指出，机器人企业集体上春晚是行业走向成熟的标志，具身智能…

2026-02-18

特斯拉Cybercab得州工厂下线无人驾驶出租车赛道再添强劲竞争者

2026-02-18

巴菲特卸任前最后一季调仓：减持科技股增持石油消费金融股建仓纽约时报

2026-02-18

除夕互动19亿次！豆包AI助力春晚打造科技与艺术交融盛宴

2026-02-18

星链成战场关键变量：5万乌军精锐反击下南线战局何去何从？

2026-02-18