巨人天成
产经 科技 企业 数据 峰会 快讯 商业

知乎技术新突破:ZhiLight大模型推理框架正式开源,引领AI新风向

2024-12-09来源:ITBEAR编辑:瑞雪

在科技领域的一次重要聚会中,知乎携手DataFun共同呈现了一场聚焦大模型应用工程化实践的深度技术沙龙。此次活动汇聚了来自15个行业、130家企业的专业人士,共同探讨了大模型技术从实验室迈向千万级用户产品的路径。

知乎CTO孙斌在活动现场带来了一个振奋人心的消息:知乎自研的轻量高效大模型推理框架ZhiLight正式开源。这一消息标志着知乎在大模型工程化实践上的又一重要进展。

知乎在2024年持续推进大模型技术的落地应用,先后推出了知乎直答和专业搜索功能。这些功能不仅聚焦于专业人士的生产力场景,更是将AI搜索推向了更具专业性和实用性的深度搜索阶段。在沙龙上,知乎AI算法负责人王界武详细介绍了知乎直答的搭建过程和技术方案选型。

王界武指出,在构建AI问答系统时,知乎直答团队对比了LLM持续pretrain+posttrain与检索增强生成(RAG)两种方案,最终选择了RAG方案。RAG系统通过从知识库检索相关信息作为上下文,再由大语言模型生成回答,显著降低了AI的幻觉问题,提高了答案的准确性和权威度。团队在Query理解、召回、大模型生成等多个环节进行了深入优化。

在专业搜索功能方面,知乎直答团队采用了多种前沿技术,实现了多智能体的协同工作,并支持信息查询、内容分析、数学计算等多种功能。同时,结合大语言模型的强大推理能力,对用户的上下文和提问进行深入分析,从多角度、多层次召回高质量的内容。

王界武还透露,知乎直答团队计划将产品与社区深度融合,满足更多场景下用户找答案的需求,并在准确性、时效性、交互模式等领域实现更多升级。同时,将进一步提升模型的推理能力,使知乎直答具备更强的解决复杂问题能力和使用体验。

在沙龙上,知乎自研的大模型推理框架ZhiLight也正式亮相。知乎机器学习平台负责人王新介绍了ZhiLight的设计目标和优化重点。ZhiLight旨在快速部署与实践LLaMa-like模型,并兼容OpenAI chat/completions接口,便于日常使用及与开源引擎的性能与稳定性对比。

ZhiLight在PCIe卡间通讯优化、内存管理以及并发请求管理等方面进行了深入优化,并集成了FlashAttention、Marlin、TensorRT、exllama等开源项目。通过计算与通讯overlap和低精度通讯等手段,单层Transformer计算时间降低了40%以上。在模型规模达到70B时,ZhiLight在TTFT指标上明显优于主流开源推理引擎。

百川智能大语言模型资深算法专家王宇龙在沙龙上分享了对Agent技术的探索。他认为,基于LLM驱动的智能体相较于传统Agent,能够利用大型语言模型的强大能力,彻底改变智能体的工作方式。这类智能体能够在不同的任务之间切换,并通过理解自然语言来解决问题。

王宇龙还介绍了当前Agent面临的主要问题,并探讨了Agent和LLM的底层细节。他认为,人工智能有可能以新的方式发现并利用计算简化的区域,从而做出近似和“大致正确”的预测。但AI在进行精确、详细的预测时会遇到困难,特别是在面对计算不可约性时。

在交流会上,“提示词布道师”李继刚也分享了关于Prompt的深刻见解。他提出“Prompt=表达”,并阐述了“表达=本意+文意+解意”以及“本意=经验+词汇+知识”的概念。他认为,与大模型实现“共振”是Prompt设计的核心,即用最清晰、简洁的表达指向核心本质。

李继刚还分享了Prompt的实战经验,认为Prompt工程师应具备人文和技术两项基本素质,既要能写编程、具备理性数学的思维,又要会写作、拥有感性表达的思维。

此次大模型技术沙龙不仅为与会者带来了前沿的技术分享和深度交流,也展示了知乎在大模型应用工程化实践上的坚实步伐。知乎将继续加强与科技行业、技术从业者的交流联动,为互联网行业前沿技术研发和应用贡献力量。

企业禁用无线网卡攻略:三种方法详解,第二种助企业高效管控风险
对于中大型企业或对数据安全要求高的单位,域智盾终端安全管理系统提供了更智能、更彻底、更可追溯的无线网卡管控方案。在Windows专业版或企业环境中,IT人员可以用系统自带的组策略(Group Policy…

2025-11-15

蓝牙耳机被他人连接别慌!三招轻松夺回“控制权”
当发现耳机被别人连接时,最直接的解决方法是重置连接。操作很简单:先打开你的手机蓝牙设置,找到已配对的耳机名称,选择“忽略此设备”或“取消配对”。最后,在手机蓝牙列表中找到你的耳机并重新点击连接即可。这个操作…

2025-11-15

工业通信新选择:环网交换机如何以冗余设计保障现场数据稳定传输
每个交换机上有两个用于组环的端口(网口),交换机之间通过手拉手形式构成了环形的网络拓扑。我们设计的千兆工业交换机整体设计采用“凹陷”网口设计,外观上和普通交换机大有差别,将网线水晶头能够有力的支撑保护住。 …

2025-11-14

安科瑞ASCB3-80m智能微断:全参量监测+远程操控,筑牢低压配电安全防线
智能微型断路器配合智能网关使用,对用电线路的关键电气参数,如电压、电流、功率、温度、漏电、能耗等进行实时监测,具有远程操控、异常预警、事故跳闸告警、电能计量统计、故障定位等功能。ASCB3-80m 系列智能…

2025-11-14

谷歌AI新动作与苹果不谋而合,隐私赛道上苹果技术路线获印证
过去几个月里,我得出一个结论:苹果在AI方面的困境真正令人失望的地方,并不仅仅是人们普遍认为它在当前AI趋势中"落后"了。 A:苹果确实错过了ChatGPT发布引发的AI变革浪潮,在大语言模型产品方面相比其…

2025-11-13

物联网+AI赋能制造业边坡:构建“工业大脑”实现安全与效率双提升
物联网 + AI 构建的 “工业大脑”,通过全维度感知、智能化分析、精准化决策,让边坡管理实现了从 “事后补救” 到 “预测性维护” 的根本性转变,不仅破解了安全与效率、投入与效益的平衡难题,更重塑了制造业…

2025-11-13

广电卡适配指南:哪些手机能用?这些旗舰机型可能不兼容!
华为P50系列是个特例,即便是4G版,也能通过软件方案支持广电5G。中国广电表示,近六年主流手机型号均已升级适配广电网络,98%以上的新入网5G手机支持700MHz频段。 判断你的手机是否适配广电卡,不仅…

2025-11-13

星闪智联引领未来:无线短距通信开启智能社会新篇章
为统一目标、保证质量,在国际星闪联盟组织与号召下,联盟领导、行业协会及合作伙伴的11位代表上台发起了《消费电子新短距产业共建倡议》,明确提出要“共建星闪技术新标准、共创智能连接新应用、共赢消费电子新未来”。 …

2025-11-13

Kernelcom“智能键盘”来袭:12.5英寸超宽屏,AMD/Intel双版本可选
快科技11月12日消息,近日一款名为Kernelcom的设备正在Kickstarter上众筹,虽然其本质上是一款功能完备的笔记本电脑,但制造商还是将其宣传为“智能键盘”。 这款设备最大的特点是其12.5英寸超…

2025-11-13