巨人天成
产经 科技 企业 数据 峰会 快讯 商业

数据库泰斗Stonebraker谈行业变迁:AI挑战下,年轻人择业需谨慎

2026-05-03来源:快讯编辑:瑞雪

Mike Stonebraker,这位2014年图灵奖得主,因其在数据库系统领域的开创性贡献而广受赞誉。他的研究成果不仅被写进教科书,还催生了多个商业上成功的工程系统,如Ingres、Postgres、Vertica、VoltDB和SciDB等。最近,Stonebraker做客meta资深工程师Ryan Peterman的播客,分享了他对数据库行业的深刻见解以及对人工智能(AI)的独到看法。

在对话中,Stonebraker直言不讳地批评了行业中的一些做法。他提到,Oracle的创始人Larry Ellison在推广产品时,常常混淆现在时和将来时,实际上是在对客户撒谎。他还对Google过去推崇的MapReduce和最终一致性表示质疑,认为这些技术不仅效率低下,而且在处理复杂数据时存在严重缺陷。对于亚马逊同时维护多个数据库系统的做法,他也认为过于冗余,建议精简至三个以内。

谈到AI,Stonebraker认为当前的agentic AI大多还停留在“只读”阶段,即只能进行数据分析和预测,而无法真正修改数据库中的数据。然而,一旦AI开始进行读写操作,比如两个agent协作完成转账,问题就会回到数据库的核心领域:事务、一致性和原子性。他指出,尽管大模型在公开的text-to-SQL基准上表现不错,但在真实生产环境中的准确率却极低,甚至为零。这表明,至少在可见的未来,这项技术还不足以投入生产使用。

Stonebraker还分享了他对数据库系统发展的看法。他认为,一种数据库不可能解决所有问题,针对不同需求设计专门的数据库方案才是正确的方向。他举例说,流处理数据库、列存数据库和关系数据库在实现上完全不同,但每种都比通用数据库快一个数量级。因此,使用不适合工作负载的数据库会付出巨大的性能代价。

在谈到自己的职业生涯时,Stonebraker回忆了他在伯克利大学如何从零开始构建Ingres和Postgres的过程。他强调,学术版Ingres最初的目标是支持地理信息系统(GIS),但由于数据类型限制而失败。这一教训促使他在Postgres中设计了可扩展的类型系统,使其能够高效支持各种抽象数据类型。这一创新大大扩展了Postgres的适用范围,使其成为开源关系型数据库的首选。

对于年轻工程师,Stonebraker建议他们寻找那些能够挑战自我、实现三倍于合理工作量目标的机会。他认为,真正出色的工程师通常能够轻松应对深度技术问题,而识别不聪明的人也只需通过简单的对话即可。他还提到,自己天生不适合大公司的官僚环境,更喜欢在学术界和创业领域发挥作用。

在对话的最后部分,Stonebraker介绍了他的最新项目DBOS(Database Operating System)。这个项目起源于一个学术想法:用数据库技术来管理操作系统中的大规模数据。尽管最初的目标是替换Linux内核,但实际商业化的产品更侧重于编程语言和持久化工作流。DBOS支持多种编程语言,并在云环境中表现出色,尤其在处理agentic AI的读写操作时具有原子性和一致性的优势。

对于数据库领域的未来,Stonebraker认为,尽管大模型在text-to-SQL任务上表现不佳,但随着技术的进步,这一问题有望得到解决。他强调,将所有数据转化为表格形式,并利用查询优化器进行连接,是处理复杂结构化数据的有效方法。他还看好agentic AI在读写操作中的发展潜力,认为这将是一个充满机遇的领域。