DeepSeek“识图模式”登场多模态交互新体验开启新征程-数据-巨人天成财经

近日，DeepSeek在网页版与APP端同步推出了一项名为“识图模式”的新功能，该功能与现有的“快速模式”“专家模式”并列呈现，为用户带来全新的交互体验。这一变动标志着DeepSeek在产品功能上迈出了重要一步，从单一的文本对话领域拓展至图文交互领域。

据了解，“识图模式”允许用户上传图片，系统将对其进行内容理解与分析。这一功能的出现，使得用户在与DeepSeek交互时，不再局限于文字输入，而是可以通过图片这一更直观的方式获取信息或进行交流。例如，用户可以上传一张风景照片，询问关于该地点的相关信息；或者上传一张产品图片，获取产品的详细介绍和购买建议。

在“识图模式”上线前，DeepSeek负责多模态开发的研究员陈小康在X平台发布了一条引人注目的消息：“Now, we see you”，并配有一张图片。图片中，DeepSeek标志性的“鲸鱼”形象摘下了眼罩，这一设计被业内人士解读为DeepSeek多模态能力即将上线的信号。随着“识图模式”的推出，这一解读得到了验证，DeepSeek的产品矩阵正式从纯文本对话延伸至图文交互领域，其能力也向GPT-4o、Gemini、Qwen等多模态大模型看齐。

然而，从用户反馈来看，“识图模式”目前尚未全量推送，仍处于灰度测试阶段。这意味着并非所有用户都能立即体验到这一新功能，只有部分被选中的用户才能提前感受图文交互的魅力。对于尚未被灰度到的用户，不妨多刷新几次页面，看看自己是否成为了幸运儿。

DeepSeek“识图模式”登场 多模态交互新体验开启新征程

DeepSeek“识图模式”登场多模态交互新体验开启新征程