k8凯发(中国)天生赢家·一触即发_凯发k8旗舰厅ag_K8凯发集团(中国)|本溪棋牌|谷歌Nature震撼发文Gemini教练暴打专家

　　凯发就来凯发天生赢家一触即发★★★。凯发k8国际首页★★★，k8凯发天生赢家一触即发★★★，k8凯发首页★★★。凯发k8国际官网★★★。K8凯发(中国)天生赢家·一触即发★★★，凯发k8娱乐入口★★★！谷歌DeepMind最新Nature王炸★★★，直接把Gemini版大模型PH-LLM调教成了「AI健康私教」★★★，把可穿戴冷冰冰的数据★★★，直接变成睡眠健身建议★★★，结果准确率暴打人类医生★★★。

　　最近★★★，谷歌全新健康大语言模型（PH-LLM）正式发布——一款微调Gemini的「个人睡眠和健康」模型★★★。

　　结果发现★★★，PH-LLM在睡眠医学考试中得分（79%）碾压医生（76%）★★★，而且在健身认证中直接把人类专家按在地上摩擦（88% vs 71%）★★★。

　　更牛的是★★★，在人类评估中★★★，PH-LLM生成的健康建议★★★，几乎与专家无差别★★★。而且★★★，仅凭传感器数据★★★，即可预测用户睡眠质量★★★。

　　遗传学博士Dominic Ng对此点评道★★★，「PH-LLM所做的★★★，正是一位优秀医生会做的事★★★，即将数据综合成『洞察』」★★★。

　　不过★★★，这些数据缺乏上下文背景★★★，存储分析算力要求高★★★、解读难度大等因素★★★，并未广泛应用于临床实践★★★。

　　甚至K8凯发集团(中国)★★★，这些数据也并未纳入标准「医学问答数据集」★★★，导致通用基础LLM和医学LLM★★★，都难以有效推理给出个性化建议★★★。

　　为此★★★，谷歌团队合力在Gemini上微调出PH-LLM★★★，用于评估AI在睡眠与健康领域的表现★★★，如下图所示本溪棋牌★★★。

　　更好的睡眠时间是从晚上12:00到早上7:30★★★。你可以通过每隔几天将睡眠时间提前15分钟★★★，逐步达到目标★★★。

　　训练数据包含了★★★，人口统计学文本数据★★★、最长30天的每日指标★★★、聚合指标★★★，以及仅针对健康案例的个体运动日志等★★★。

　　这个适配器是用于★★★，根据至少15天的纵向被动传感器数据（包含每日睡眠与活动指标）★★★，来预测睡眠障碍和睡眠损伤的主观报告结果（PROs）

　　两阶段训练完成后★★★，团队从个人健康教练所需的多元能力维度出发K8凯发集团(中国)★★★，针对三大任务评估了PH-LLM的表现★★★：

　　最后★★★，测试模型预测患者主观报告结果（PROs）的能力★★★，使其在生成建议时能整合个体对睡眠质量的自评数据★★★，真正实现个性化健康指导K8凯发集团(中国)★★★。

　　测试结果显示K8凯发集团(中国)★★★，在睡眠医学和健康体能考试★★★，PH-LLM的答题正确率分别达到79%和88%（表1与图1b）★★★。

　　受试者工作特征曲线（ROC）与精确率-召回率曲线本溪棋牌★★★，均证实模型在两类考试中的优异表现（附图2）★★★。

　　值得注意的是★★★，尽管针对睡眠与健康任务进行了微调本溪棋牌★★★，PH-LLM在PubMedQA29和MedQA30通用医学基准测试中★★★，性能并未下降（附表1）★★★。

　　值得一提的是K8凯发集团(中国)★★★，睡眠医学题库包含每道题目的人类考生答题分布等元数据★★★，这允许团队基于题目难度进行分层性能比较★★★。

　　PH-LLM在所有难度层级均小幅领先Gemini Ultra 1.0★★★，且在难题上的优势更为明显★★★。

　　为量化PH-LLM的表现水平★★★，团队还招募了5位平均从业25年的睡眠医学专家（均持有高级学位）和5位平均从业13.8年的职业运动教练参加同规格考试★★★。

　　专家组在睡眠医学试题样本（N=204）中的平均正确率为76%★★★，体能考试为71%★★★，PH-LLM在两类题库中均超越人类专家（表1）★★★。

　　为此★★★，他们创建了首个睡眠与健康领域的详细个人健康案例数据集（857个案例★★★，含3,271组问答对）★★★，由多位相关领域专家共同审定★★★。

　　在健康管理案例分析中★★★，PH-LLM模型在三个维度（运动处方制定★★★、恢复方案建议★★★、训练准备度评估）上★★★，表现出与人类专家及Gemini Ultra 1.0相当的水平（图2d）★★★。

　　此外★★★，为了评估PH-LLM能否推断用户体验以优化健康指导★★★，团队测试了每日传感器数值数据预测睡眠障碍和睡眠损伤PROs的能力K8凯发集团(中国)★★★。

　　首先通过计算问卷回答间的相关性分析PRO数据★★★，发现16个问题测量了相关但独立的睡眠维度（图3a）★★★。

　　结果显示★★★：没有单一特征对所有PROs具有绝对预测优势本溪棋牌K8凯发集团(中国)★★★，预测信号广泛分布于多个传感器（图3b）★★★。

　　为使PH-LLM能从传感器特征预测PROs★★★，研究人员又训练了一个多层感知机（MLP）适配器★★★，将20项传感器特征的统计量映射至PH-LLM的潜在标记空间（方法部分）本溪棋牌★★★。

　　在保留测试集中★★★，团队比较了零样本提示★★★、少样本提示与PH-LLM适配器方法★★★，在受试者工作特征曲线下面积（AUROC）和精确召回曲线下面积（AUPRC）的表现（图3c,d）★★★。

　　值得注意的是★★★，客观睡眠测量数据对主观睡眠质量指标的预测力通常有限本溪棋牌★★★，但配备适配器的PH-LLM在AUROC和AUPRC上均显著优于两种提示方法★★★。