近日,DeepSeek在网页版与APP端同步推出了一项名为“识图模式”的新功能,该功能与现有的“快速模式”“专家模式”并列呈现,为用户带来全新的交互体验。这一变动标志着DeepSeek在产品功能上迈出了重要一步,从单一的文本对话领域拓展至图文交互领域。
据了解,“识图模式”允许用户上传图片,系统将对其进行内容理解与分析。这一功能的出现,使得用户在与DeepSeek交互时,不再局限于文字输入,而是可以通过图片这一更直观的方式获取信息或进行交流。例如,用户可以上传一张风景照片,询问关于该地点的相关信息;或者上传一张产品图片,获取产品的详细介绍和购买建议。
在“识图模式”上线前,DeepSeek负责多模态开发的研究员陈小康在X平台发布了一条引人注目的消息:“Now, we see you”,并配有一张图片。图片中,DeepSeek标志性的“鲸鱼”形象摘下了眼罩,这一设计被业内人士解读为DeepSeek多模态能力即将上线的信号。随着“识图模式”的推出,这一解读得到了验证,DeepSeek的产品矩阵正式从纯文本对话延伸至图文交互领域,其能力也向GPT-4o、Gemini、Qwen等多模态大模型看齐。
然而,从用户反馈来看,“识图模式”目前尚未全量推送,仍处于灰度测试阶段。这意味着并非所有用户都能立即体验到这一新功能,只有部分被选中的用户才能提前感受图文交互的魅力。对于尚未被灰度到的用户,不妨多刷新几次页面,看看自己是否成为了幸运儿。