随着全球视觉健康需求的不断增长,眼科疾病的早期筛查和精准诊断成为提升公共健康水平的重要保障。为应对临床上眼科影像数据日益复杂和多样化的挑战,人工智能(AI)领域涌现出一批专门针对眼科的基础模型,EyeFM便是其中的典型代表。这是一款结合多模态视觉与语言理解的眼科辅助诊断模型,通过大量多样化的眼科影像数据及临床文本信息训练,旨在为临床医生提供智能辅助,为患者带来更准确和高效的诊疗服务。EyeFM的开发与应用不仅彰显了AI与医学融合的潜力,也为眼科医疗进入智能辅助时代树立了新的标杆。 EyeFM的核心优势在于其庞大的预训练数据基础和多模态能力。该模型基于超过1450万张覆盖五种不同眼科成像模式的眼科图像,同时结合全球多种族临床文本数据,进行深入的视觉与语言联合预训练。
多样化的影像数据包括彩色眼底照片(CFP)、光学相干断层扫描(OCT)、荧光素眼底血管造影(FFA)、前眼段照片以及裂隙灯照片等,涵盖了从宏观到微观的眼部结构和病变表现。这种跨模态的训练使EyeFM能够理解和分析不同类型的影像信息,与临床描述无缝对接,支持更全面的临床辅助诊断。 在研发过程中,EyeFM经历了多阶段的严谨验证。最初通过回顾性分析,模型的疾病检测性能在多民族队列中被充分证实,并与现有医学基础模型进行了对比,显示出明显的优势。紧接着,EyeFM在北美、欧洲、亚洲和非洲的44位眼科医师中进行了多国多中心的临床辅助效果验证,覆盖初级和专科医疗环境。这一步将模型的理论性能与实际临床应用的效率相结合,确认了其作为临床辅助工具的实用性和适用性。
最具代表性的是EyeFM在中国高危人群视网膜疾病筛查中的随机对照试验(RCT)。该试验采用双盲设计,共有668名平均年龄57.5岁的参与者,79.5%为男性,被随机分配给16位眼科医生,分为接受EyeFM辅助的干预组和常规诊疗的对照组。结果显示,配备EyeFM的医生在正确诊断率和转诊率上均显著优于对照组,分别达到92.2%和92.2%,而对照组仅为75.4%和80.5%。此外,临床报告的标准化程度也获得提升,患者对筛查的满意度相当,但干预组患者在自我管理和遵循转诊建议上表现出更高的依从性,彰显了模型在改善患者后续健康管理中的潜力。 EyeFM不仅在诊断准确性上表现卓越,其应用场景也极其广泛。在资源相对匮乏的基层医疗环境中,EyeFM能够利用低成本的单模态检查结果辅助诊断,突破技术瓶颈,提升筛查效率和精准率。
对于需进一步诊疗的病例,EyeFM的跨模态整合能力和零样本识别能力支持专科医生进行更快速、全面的病灶分析。此外,其基于视觉问答的报告生成技术还帮助医生高效撰写临床报告与患者沟通材料,大幅缩短工作时间,减少人为错误。 技术层面上,EyeFM的影像编码部分由包含24个Transformer模块的编码器组成,配以针对各个成像模式的独立解码器,有效捕获细粒度图像特征。其语言模块基于最新的LLaMA 2架构,拥有70亿参数,能够精准理解和生成医学语言内容。结合人类知识编码机制,EyeFM采用了直接偏好优化(DPO)和联邦学习框架,实现了模型在保护隐私的条件下持续演进和优化,这为医疗AI的安全应用提供了范例。 此外,EyeFM项目高度重视数据透明与开放。
相关算法代码已公开托管于GitHub平台,部分最低数据集也在Zenodo上公开,鼓励学术界和产业界进行后续研究和改进。同时,所有临床试验数据的分享均严格遵守伦理及隐私保护协议,以确保患者信息安全和科研诚信。 凭借其强大的跨模态数据处理能力、严谨的临床验证和实际应用效果,EyeFM代表了眼科人工智能领域的领先水平。它的成功不仅体现了深度学习技术在眼科疾病早期识别和管理上的实用价值,也推动了全球眼健康服务的均衡发展。眼科医生通过EyeFM的辅助可以提高诊断速度和准确率,同时减轻工作负担,改善医患沟通效率。患者方面,则因早期检测和科学管理增强了疾病预防和治疗效果,提升了生活质量。
未来,EyeFM将在多方面持续拓展。模型将进一步融合更多眼科及全身健康相关的临床指标,实现更加智能化的风险预测和个性化诊疗建议。同时,借助不断积累的多中心、多国家临床数据,EyeFM将强化其普适性和泛化能力,助力实现全球范围内多层次、多环境的眼科智能诊疗体系。政策与行业层面,EyeFM的研究成果为制定AI医疗设备标准、临床应用指南提供了科学依据,并激励更多跨学科合作,将AI技术更安全、有效地融入日常眼科诊疗流程。 随着视力健康逐渐成为全球公共卫生焦点,EyeFM的成功展示了人工智能在医学领域的重要角色。它不仅是技术创新的结晶,更是临床医生和患者的有力助手。
未来,更多类似的智能基础模型将不断涌现,推动医疗行业迈入智慧诊疗新时代,造福更多因眼病而受困的人群。通过深化AI与医疗的融合,未来眼科服务将更加精准、便捷、个性化,真正实现"让光明触手可及"的美好愿景。 。