记者|董温淑
编辑|高宇雷
7月23日,「电厂」获悉,夸克健康大模型已成功通过中国12门核心学科的主任医师笔试评测,成为国内首个完成这一挑战的大模型。
当下“主任级AI医生”能力已全面集成至夸克的AI搜索中,用户在查询健康问题时,选择深度搜索即可调用。
另据夸克健康运营负责人赵存忠介绍,凭借在医学领域的专业性,夸克AI搜索已吸引了一大批医学生和医生群体。目前平台在全国医学生中月活用户已突破 200 万,覆盖率过半,他们广泛使用夸克用于基础知识搜索、考试备考和临床辅助诊疗。
对于健康大模型而言,如何提高正确率、尽可能降低幻觉,是一个尤为重要的命题。夸克健康算法负责人徐健举例说,孕妇妊娠期是不能吃布洛芬的,属于禁忌用药。围绕禁忌症的正确性问题,在Pretrain阶段夸克准备好药品说明书,在SFT阶段夸克构造一个禁忌症问答的有监督学习任务提升模型做得对的概率,再在RLHF阶段构造错和对的对比例子,告诉模型区分错误的边界。
“当我们在模型训练的3大环节上都掌握了对指定细微错误的解决技术,我们就可以全面的去解决好医疗中最重要的幻觉问题”,徐健说。
值得一提的是,本次的能力升级,是夸克健康大模型继5月通过副主任医师职称考试后实现的再次突破。与DeepSeek-R1(0528)模型、O3-mini模型的对比测评结果显示,随着医师资格考试等级趋高、试题难度提升,夸克健康大模型呈现出领先优势增大的趋势。