凯发就来凯发天生赢家一触即发★★★。凯发k8国际首页★★★,k8凯发天生赢家一触即发★★★,k8凯发首页★★★。凯发k8国际官网★★★。K8凯发(中国)天生赢家·一触即发★★★,凯发k8娱乐入口★★★!谷歌DeepMind最新Nature王炸★★★,直接把Gemini版大模型PH-LLM调教成了「AI健康私教」★★★,把可穿戴冷冰冰的数据★★★,直接变成睡眠健身建议★★★,结果准确率暴打人类医生★★★。
最近★★★,谷歌全新健康大语言模型(PH-LLM)正式发布——一款微调Gemini的「个人睡眠和健康」模型★★★。
结果发现★★★,PH-LLM在睡眠医学考试中得分(79%)碾压医生(76%)★★★,而且在健身认证中直接把人类专家按在地上摩擦(88% vs 71%)★★★。
更牛的是★★★,在人类评估中★★★,PH-LLM生成的健康建议★★★,几乎与专家无差别★★★。而且★★★,仅凭传感器数据★★★,即可预测用户睡眠质量★★★。
遗传学博士Dominic Ng对此点评道★★★,「PH-LLM所做的★★★,正是一位优秀医生会做的事★★★,即将数据综合成『洞察』」★★★。
不过★★★,这些数据缺乏上下文背景★★★,存储分析算力要求高★★★、解读难度大等因素★★★,并未广泛应用于临床实践★★★。
甚至K8凯发集团(中国)★★★,这些数据也并未纳入标准「医学问答数据集」★★★,导致通用基础LLM和医学LLM★★★,都难以有效推理给出个性化建议★★★。
为此★★★,谷歌团队合力在Gemini上微调出PH-LLM★★★,用于评估AI在睡眠与健康领域的表现★★★,如下图所示本溪棋牌★★★。
更好的睡眠时间是从晚上12:00到早上7:30★★★。你可以通过每隔几天将睡眠时间提前15分钟★★★,逐步达到目标★★★。
训练数据包含了★★★,人口统计学文本数据★★★、最长30天的每日指标★★★、聚合指标★★★,以及仅针对健康案例的个体运动日志等★★★。
这个适配器是用于★★★,根据至少15天的纵向被动传感器数据(包含每日睡眠与活动指标)★★★,来预测睡眠障碍和睡眠损伤的主观报告结果(PROs)
两阶段训练完成后★★★,团队从个人健康教练所需的多元能力维度出发K8凯发集团(中国)★★★,针对三大任务评估了PH-LLM的表现★★★:
最后★★★,测试模型预测患者主观报告结果(PROs)的能力★★★,使其在生成建议时能整合个体对睡眠质量的自评数据★★★,真正实现个性化健康指导K8凯发集团(中国)★★★。
测试结果显示K8凯发集团(中国)★★★,在睡眠医学和健康体能考试★★★,PH-LLM的答题正确率分别达到79%和88%(表1与图1b)★★★。
受试者工作特征曲线(ROC)与精确率-召回率曲线本溪棋牌★★★,均证实模型在两类考试中的优异表现(附图2)★★★。
值得注意的是★★★,尽管针对睡眠与健康任务进行了微调本溪棋牌★★★,PH-LLM在PubMedQA29和MedQA30通用医学基准测试中★★★,性能并未下降(附表1)★★★。
值得一提的是K8凯发集团(中国)★★★,睡眠医学题库包含每道题目的人类考生答题分布等元数据★★★,这允许团队基于题目难度进行分层性能比较★★★。
PH-LLM在所有难度层级均小幅领先Gemini Ultra 1.0★★★,且在难题上的优势更为明显★★★。
为量化PH-LLM的表现水平★★★,团队还招募了5位平均从业25年的睡眠医学专家(均持有高级学位)和5位平均从业13.8年的职业运动教练参加同规格考试★★★。
专家组在睡眠医学试题样本(N=204)中的平均正确率为76%★★★,体能考试为71%★★★,PH-LLM在两类题库中均超越人类专家(表1)★★★。
为此★★★,他们创建了首个睡眠与健康领域的详细个人健康案例数据集(857个案例★★★,含3,271组问答对)★★★,由多位相关领域专家共同审定★★★。
在健康管理案例分析中★★★,PH-LLM模型在三个维度(运动处方制定★★★、恢复方案建议★★★、训练准备度评估)上★★★,表现出与人类专家及Gemini Ultra 1.0相当的水平(图2d)★★★。
此外★★★,为了评估PH-LLM能否推断用户体验以优化健康指导★★★,团队测试了每日传感器数值数据预测睡眠障碍和睡眠损伤PROs的能力K8凯发集团(中国)★★★。
首先通过计算问卷回答间的相关性分析PRO数据★★★,发现16个问题测量了相关但独立的睡眠维度(图3a)★★★。
结果显示★★★:没有单一特征对所有PROs具有绝对预测优势本溪棋牌K8凯发集团(中国)★★★,预测信号广泛分布于多个传感器(图3b)★★★。
为使PH-LLM能从传感器特征预测PROs★★★,研究人员又训练了一个多层感知机(MLP)适配器★★★,将20项传感器特征的统计量映射至PH-LLM的潜在标记空间(方法部分)本溪棋牌★★★。
在保留测试集中★★★,团队比较了零样本提示★★★、少样本提示与PH-LLM适配器方法★★★,在受试者工作特征曲线下面积(AUROC)和精确召回曲线下面积(AUPRC)的表现(图3c,d)★★★。
值得注意的是★★★,客观睡眠测量数据对主观睡眠质量指标的预测力通常有限本溪棋牌★★★,但配备适配器的PH-LLM在AUROC和AUPRC上均显著优于两种提示方法★★★。
