巨人网
产经 科技 企业 数据 峰会 快讯

微软新探索:音生图AI,实时视觉化会议演讲场景?

2024-10-15来源:ITBEAR编辑:瑞雪

近日,科技媒体MSPoweruser发布报道,透露微软公司新获一项创新专利,该专利描述了一种基于用户实时语音输入来生成图片的技术。

据悉,这项专利文件长达20页,微软于2023年4月5日提交申请,并于10月10日获得批准。根据专利的详细描述,该系统能够在会议或讲座等场合实时捕捉音频内容,随后利用语言模型对这些音频进行总结,并据此生成相应的AI图像。

该专利所描述的工作流程分为三个主要步骤:首先是捕捉音频,即用户通过麦克风发言,系统实时记录并将其转化为文本;其次是处理文本,系统将文本分段记录,并对每段内容通过语言模型进行总结;最后是生成图像,系统根据总结生成的提示,创建AI生成的图像,并在屏幕上实时显示。

预计这一功能将主要应用于Microsoft Teams平台。随着演讲者话题的变化,实时生成的图像也会随之更新,从而为用户带来更加丰富的视觉沟通体验。微软表示,这种图像的使用有助于澄清概念,尤其适合那些需要通过视觉辅助来学习的用户。

马斯克“画饼”?用户追捧资本却冷漠,一夜蒸发4800亿!
这种无人出租车,没有方向盘,没有刹车、油门,没有后视镜,因为它是完全无人驾驶的汽车,不需要人工操作,保留这些没有任何意义,不如没有,节省成本。马斯克甚至还画了一个大饼,表示这种“Cybercab”一旦出市后,…

2024-10-15

微信新功能曝光,这是要打造“体内小红书”?
这也为微信商业化变现踩下了加速踏板,2024年,小龙明显从佛系变得更加进取了,二季度财报业绩会透露出,视频号的广告收入同比增长了近80%,是腾讯广告收入增长的主要驱动之一,以及,微信电商体系在努力搭建中,视…

2024-10-15

55元毛绒玩偶转卖3000元,这50倍溢价,谁之手笔?
她原本只想买给朋友做礼物,但在经历了线下店拥挤的人潮后,她给自己和两岁的女儿也都买了一只,“毕竟排队排了20多人,多买几只才划算。”在她看来,最好的入坑时间是2024年6、7月,官方的大量补货让原本非常难买的…

2024-10-15

航天新蓝图!《国家空间科学中长期发展规划》发布,未来怎么飞?
《规划》围绕五大科学主题,聚焦优先发展方向,提出至 2027 年、2028—2035 年和 2036—2050年三个阶段实施的科学任务规划,形成至 2050 年我国空间科学发展路线图。 围绕五大科学主题,…

2024-10-15