近年来,人工智能技术迅猛发展,其中大型语言模型(LLMs)凭借其强大的自然语言处理能力,在医疗健康领域显示出巨大潜力。公共卫生作为保障全民健康的重要体系,面对信息复杂、数据海量且多样的挑战,传统人工方法逐渐显现出局限性。在此背景下,LLMs在公共卫生数据处理、疾病监测和疫情管理中的应用受到了广泛关注,推动了行业创新与转型。值得一提的是,英国卫生安全局(UKHSA)在这一领域的前瞻性探索为行业提供了宝贵经验和示范效应。 公共卫生工作中大量涉及文本信息分类与提取,比如疫情传播调查表上的症状记录、接触者密切程度的界定以及评估个体是否属于临床易感人群等。这些信息往往以非结构化、杂乱的形式存在,人工审核既耗时又易误判。
LLMs的引入,有望实现自动化、高效且精准的文本分析,大幅提高信息整合与判断能力,为公共卫生干预和监测提供坚实的支撑。 一个典型应用场景是利用LLMs扩大公共卫生数据来源。以食源性胃肠道疾病为例,这类疾病发病率高且难以完全被医疗系统捕获,据估计仅有大约十分之一的病例会寻求医疗帮助。借助大型语言模型自动处理网络餐厅评价这类公开自由文本信息,能够从中识别疑似感染病例以及相关症状与食物信息,为疾病隐形负担的估算和趋势判断提供宝贵数据。UKHSA团队采用了如Llama 3.3、Mistral Large和Gemma 2等先进模型进行文本分类,模型在判断病例相关内容时取得超过90%的微观F1分数,成绩令人鼓舞。此外,模型还经过了偏见检测,确保在敏感人群和群体之间的公平性。
通过建立这样结构化的公共卫生新数据集,LLMs不仅丰富了数据渠道,也为未来疾病预警奠定了基础。 在疫情暴发响应阶段,快速扩展干预措施和监测能力是重大挑战。2022年猴痘(mpox)疫情是极佳的案例研究。该次疫情的传播特征新颖,患者多为男性同性恋及其相关群体,涉及敏感的性行为文本,且接触者分类规则复杂且具有特定专业定义。研究发现LLMs在无示例的零样本测试中表现平平,最高仅达53%的微观F1分数;但通过提供十个实例的示范,模型性能跃升至近80%,显示出通过精心设计的提示和示范,模型对复杂任务的适应力大幅提升。这表明未来结合链式思维提示和领域专门微调,LLMs完全有望成为公共卫生应急响应中不可或缺的助手,帮助扩大接触者追踪和数据处理规模,以应对快速增长的疫情需求。
除了大规模疫情响应,日常公共卫生流程中同样存在大量文本处理需求。以结核病筛查为例,判断潜在感染风险往往需核实患者的旅行或居住史,诸如出生地等信息可能多以模糊或非标准格式书写。LLMs通过训练自动辨认和消歧国家信息,能够替代人工完成数以千计的申请表审核工作,提高工作效率和准确率。同样,公共卫生指导文件繁多且动态更新,如何确保各类指导内容间的一致性和无冲突是专业团队头痛的问题。利用LLMs自动识别文件中的推荐内容并检测潜在冲突,目前已进入实际开发阶段,有望将这一智能辅助工具推广至更多领域,帮助公共卫生机构优化决策流程和信息传递质量。 整体来看,公共卫生文本信息处理的复杂性和多样性对人工智能提出了高标准要求。
LLMs凭借其广泛的知识基础、上下文学习能力和批量处理优势,已经在多个公共卫生相关任务上展示出强大潜力。当前的关键任务是开展系统而深入的评估,识别易于应用且安全可信的具体场景,确保模型在实际环境中的表现稳定且公平,进而实现与现有公共卫生工作有机结合。 未来,随着LLMs模型架构和训练方法的持续改进,结合领域专门数据微调以及先进的提示技术,公共卫生领域的智能化水平将持续提升。疾病隐形负担的更加全面捕捉,疫情应急响应效率的显著增强,健康指导信息处理的智能化和自动化,都必将从根本上改变公共卫生的工作方式,助力实现精准防控和健康保障目标。 在推动这一应用进程中,跨学科合作是不可或缺的元素。专家团队需要与AI研究者紧密配合,设计合适的工作流程并执行多维度测试,确保模型决策的透明性和可控性。
同时,重视伦理和隐私保护,建立清晰的使用规范,是实现技术赋能公共卫生的基础保障。只有这样,LLMs才能真正成为提升公共卫生能力的可靠伙伴。 总的来说,大型语言模型在公共卫生领域正方兴未艾。它们不仅为疾病监测和疫情管理带来了创新工具,也为信息处理自动化和智能化指明了方向。伴随技术进一步成熟和实践经验积累,LLMs必将在保障公众健康、推动医疗卫生进步中发挥越来越重要的作用,助力构建更为安全、智能和高效的公共卫生体系。