数据库泰斗Stonebraker谈行业变迁：AI挑战下，年轻人择业需谨慎-产经-巨人天成财经

Mike Stonebraker，这位2014年图灵奖得主，因其在数据库系统领域的开创性贡献而广受赞誉。他的研究成果不仅被写进教科书，还催生了多个商业上成功的工程系统，如Ingres、Postgres、Vertica、VoltDB和SciDB等。最近，Stonebraker做客meta资深工程师Ryan Peterman的播客，分享了他对数据库行业的深刻见解以及对人工智能（AI）的独到看法。

在对话中，Stonebraker直言不讳地批评了行业中的一些做法。他提到，Oracle的创始人Larry Ellison在推广产品时，常常混淆现在时和将来时，实际上是在对客户撒谎。他还对Google过去推崇的MapReduce和最终一致性表示质疑，认为这些技术不仅效率低下，而且在处理复杂数据时存在严重缺陷。对于亚马逊同时维护多个数据库系统的做法，他也认为过于冗余，建议精简至三个以内。

谈到AI，Stonebraker认为当前的agentic AI大多还停留在“只读”阶段，即只能进行数据分析和预测，而无法真正修改数据库中的数据。然而，一旦AI开始进行读写操作，比如两个agent协作完成转账，问题就会回到数据库的核心领域：事务、一致性和原子性。他指出，尽管大模型在公开的text-to-SQL基准上表现不错，但在真实生产环境中的准确率却极低，甚至为零。这表明，至少在可见的未来，这项技术还不足以投入生产使用。

Stonebraker还分享了他对数据库系统发展的看法。他认为，一种数据库不可能解决所有问题，针对不同需求设计专门的数据库方案才是正确的方向。他举例说，流处理数据库、列存数据库和关系数据库在实现上完全不同，但每种都比通用数据库快一个数量级。因此，使用不适合工作负载的数据库会付出巨大的性能代价。

在谈到自己的职业生涯时，Stonebraker回忆了他在伯克利大学如何从零开始构建Ingres和Postgres的过程。他强调，学术版Ingres最初的目标是支持地理信息系统（GIS），但由于数据类型限制而失败。这一教训促使他在Postgres中设计了可扩展的类型系统，使其能够高效支持各种抽象数据类型。这一创新大大扩展了Postgres的适用范围，使其成为开源关系型数据库的首选。

对于年轻工程师，Stonebraker建议他们寻找那些能够挑战自我、实现三倍于合理工作量目标的机会。他认为，真正出色的工程师通常能够轻松应对深度技术问题，而识别不聪明的人也只需通过简单的对话即可。他还提到，自己天生不适合大公司的官僚环境，更喜欢在学术界和创业领域发挥作用。

在对话的最后部分，Stonebraker介绍了他的最新项目DBOS（Database Operating System）。这个项目起源于一个学术想法：用数据库技术来管理操作系统中的大规模数据。尽管最初的目标是替换Linux内核，但实际商业化的产品更侧重于编程语言和持久化工作流。DBOS支持多种编程语言，并在云环境中表现出色，尤其在处理agentic AI的读写操作时具有原子性和一致性的优势。

对于数据库领域的未来，Stonebraker认为，尽管大模型在text-to-SQL任务上表现不佳，但随着技术的进步，这一问题有望得到解决。他强调，将所有数据转化为表格形式，并利用查询优化器进行连接，是处理复杂结构化数据的有效方法。他还看好agentic AI在读写操作中的发展潜力，认为这将是一个充满机遇的领域。