巨人天成
产经 科技 企业 数据 峰会 快讯 商业

麻省理工等借Apple Watch数据构建AI模型 挖掘健康数据潜力助力疾病预测

2025-12-11来源:快讯编辑:瑞雪

麻省理工学院与Empirical Health的研究团队近日取得一项突破性进展,他们基于300万“人-天”的Apple Watch健康数据,开发出一种新型自监督学习模型,在疾病预测领域展现出显著优势。这项研究通过创新的数据处理方式,成功解决了可穿戴设备数据不完整、不规则的难题,为健康监测技术开辟了新方向。

研究核心基于meta前首席AI科学家Yann LeCun提出的“联合嵌入预测架构”(JEPA)。该架构突破传统AI系统直接重建缺失数据的模式,转而训练模型从上下文推断缺失部分的语义表征。例如在图像处理中,系统不会尝试还原被遮蔽区域的原始像素,而是通过可见部分推断其抽象特征。这种思路被研究团队创新性地应用于健康数据领域,特别是处理心率、睡眠时长等存在大量缺失的时间序列指标。

研究团队构建的纵向数据集涵盖16,522名参与者,累计记录约300万“人-天”的生理数据。每位参与者每日记录63项指标,覆盖心血管、呼吸、睡眠、运动等五大健康维度。值得注意的是,仅15%的参与者拥有完整医疗标注记录,传统监督学习框架下85%的数据难以利用。研究团队通过自监督预训练策略,先让模型在无标注数据中学习通用特征,再针对特定疾病在少量标注数据上进行微调。

在数据处理环节,研究人员将每条观测记录转化为包含日期、数值、指标类型的“三元组”,进而编码为可学习的“token”。通过随机掩码部分token,模型需要预测被遮挡片段的嵌入表示。这种训练方式使模型能够捕捉数据中的潜在模式,即使面对极端不平衡的记录频率——某些指标仅0.4%的记录时间出现,而另一些指标存在于99%的日常读数中。

实验结果显示,新型模型在多项疾病预测任务中表现优异:高血压预测的AUROC指标达到86.8%,慢性疲劳综合征为81%,病态窦房结综合征同样取得86.8%的成绩。虽然房扑预测的70.5%略低于部分基线模型,但整体性能优势明显。研究特别指出,AUROC和AUPRC指标反映的是模型对病例的排序能力,而非传统意义上的预测准确率。

这项成果的重要价值在于证明了日常可穿戴设备的潜在价值。尽管Apple Watch等设备存在佩戴时间不固定、数据记录不连续等问题,但通过创新的模型架构和训练策略,仍能从海量数据中提取有效健康信号。研究团队开发的JETS模型不仅为疾病早期预警提供了新工具,更展示了如何最大化利用不完整健康数据的可能性,为智能健康监测领域树立了新的技术标杆。

IDC机房搬迁全流程解析:科学规划保障业务平稳迁移与高效运行
根据分析结果,制定详尽的搬迁方案,内容应涵盖搬迁时间计划、分组分批策略、设备下电顺序、运输路线规划、新机房机位规划、网络切换方案以及应急预案。 最后,项目组应召开总结会议,回顾整个搬迁过程,整理经验教训,更新…

2025-12-11

杭州以勒:以技术创新为笔,绘就自动售货机智能化新画卷
杭州以勒将自身定位为“新基建智慧终端整体解决方案的智造商”,其产品涵盖服务型AI机器人,正体现了这种从单一销售设备向综合服务节点拓展的趋势。 在这个过程中,像杭州以勒这样的企业,通过持续的技术创新和扎实的产业…

2025-12-11

谷歌印度上线Google AI Plus订阅:399卢比享多模型及创意工具等权益
谷歌就在当地时间 10 日宣布在印度推出 Google AI Plus,这是一项可在 6 位家庭成员中共享的平价 AI 订阅,基础价格也仅有每月399 卢比(现汇率约合 31.4 元人民币),甚至前半年还能…

2025-12-11