人工智能领域迎来一位重量级创业者的身影——前谷歌DeepMind首席科学家、AlphaGo项目核心负责人戴维·席尔瓦(David Silver)宣布在伦敦创立人工智能公司"Ineffable Intelligence"。据知情人士透露,这家初创企业正在推进规模达10亿美元的种子轮融资,目前已进入收官阶段。这一融资规模与OpenAI前首席科学家伊利亚·苏茨克维(Ilya Sutskever)2024年创立的Safe Superintelligence(SSI)持平,创下AI初创企业融资新纪录。
与当前主流的大语言模型技术路线形成鲜明对比,席尔瓦的新公司明确提出要突破传统范式。其核心战略是回归强化学习(Reinforcement Learning)本质,构建能够自主探索未知领域的智能系统。这种技术路径不依赖人类既有知识库,而是通过智能体与环境的持续交互实现自我进化。作为图灵奖得主查理·萨顿(Charlie Sutton)的得意门生,席尔瓦在强化学习领域深耕二十余年,其学术成果被引用超28万次,2019年更荣获ACM计算奖。
2025年4月,席尔瓦与导师萨顿联合发表的《欢迎来到经验时代》论文引发学界震动。该研究提出新一代AI系统应聚焦"经验学习"——通过持续试错、自我迭代和长期互动积累知识,而非单纯依赖静态数据训练。这一理论框架直接构成了Ineffable Intelligence的技术基石。论文指出,当前主流的"预训练+微调"模式存在根本性局限:AI的能力边界被人类数据规模和质量所束缚,难以实现真正的认知突破。
资本市场对席尔瓦的技术路线表现出强烈信心。参与融资谈判的投资人分析,10亿美元的天价估值主要基于两点考量:一是席尔瓦在AI领域的权威地位,二是其提出的"后大模型时代"技术路线具有战略前瞻性。尽管公司尚未发布任何产品,但多位顶级风投机构已承诺注资,认为这可能是通往通用人工智能(AGI)的全新路径。
这场技术路线之争正引发AI界的深刻变革。2024年以来,多位参与AlphaGo项目的核心成员陆续离职创业,其中Reflection AI同样聚焦强化学习领域。meta首席AI科学家杨立昆(Yann LeCun)则带领团队重组"超级智能实验室",探索非Transformer架构的新路径。行业观察家指出,当前局面与2010年代深度学习爆发前夜颇为相似,学界普遍意识到现有大模型可能并非通往AGI的终极方案。
不过,席尔瓦的激进路线也面临现实挑战。批评者指出,强化学习在围棋等规则明确的环境中表现优异,但在现实世界这类开放环境中,其有效性尚未得到充分验证。大语言模型的成功恰恰在于语言作为人类智慧载体的高效性——通过学习语言,AI能以较低成本获取常识知识。若完全摒弃这条路径,Ineffable Intelligence可能需要构建极其复杂的数字孪生系统,其算力成本将呈指数级增长。
据悉,Ineffable Intelligence已在伦敦设立总部,并启动全球顶尖强化学习专家的招募计划。虽然公司尚未公布具体产品路线图,但其技术方向和资源投入规模,已使其成为影响AI技术演进的关键力量。这场由技术理想主义驱动的创业实验,或将重新定义人工智能的发展边界。