MMAAF：一种基于多模态视觉特征与机器学习的气道插管困难评估框架-AET-电子技术应用

MMAAF：一种基于多模态视觉特征与机器学习的气道插管困难评估框架

电子技术应用

田伊1，陈泽玮2，李百川2，倪诚1，郑晖1

1.国家癌症中心/国家肿瘤临床医学研究中心/中国医学科学院北京协和医院肿瘤医院；2.北京邮电大学计算机学院

摘要： 气道插管困难是临床麻醉中的重要风险之一，提出了一种基于患者张口静态图像的自动化、客观化气道评估框架MMAAF（Multi-Modal Airway Assessment Framework），针对患者数据集的张口图像，运用计算机视觉技术自动提取六项关键解剖学特征，与患者真实插管困难标签结合，构建结构化的多模态预测数据集，进行随机过采样技术处理，集成随机森林与梯度提升树两种机器学习算法进行模型训练与评估。结果表明，梯度提升树与随机森林模型在独立测试集上的预测准确率分别达到92%和93%，评估性能良好。同时，在MMAAF框架内进行逻辑回归模型训练，并依据特征重要性权重对特征进行加权，计算得到患者的个体化插管困难概率评分，为临床决策提供了基于多模态特征的直观量化参考。

关键词： 困难气道插管困难预测医学图像分析计算机视觉随机森林

中图分类号：TP181；R319 文献标志码：A DOI: 10.16157/j.issn.0258-7998.268137
中文引用格式： 田伊，陈泽玮，李百川，等. MMAAF：一种基于多模态视觉特征与机器学习的气道插管困难评估框架[J]. 电子技术应用，2026，52(6)：13-20.
英文引用格式： Tian Yi，Chen Zewei，Li Baichuan，et al. MMAAF: a multi-modal visual feature and machine learning-based framework for difficult airway intubation assessment[J]. Application of Electronic Technique，2026，52(6)：13-20.

MMAAF： a multi-modal visual feature and machine learning-based framework for difficult airway intubation assessment

Tian Yi1，Chen Zewei2，Li Baichuan2，Ni Cheng1，Zheng Hui1

1.National Cancer Center/ National Clinical Research Center for Cancer/ Cancer Hospital， Chinese Academy of Medical Sciences and Peking Union Medical College；2.School of Computer Science， Beijing University of Posts and Telecommunications

Abstract： Difficult airway intubation is a critical risk in clinical anesthesia. This study proposes an automated, objective airway assessment framework named MMAAF (Multi-Modal Airway Assessment Framework) based on static mouth-opening images of patients. Using computer vision techniques, the framework automatically extracts six key anatomical features from the dataset of patient mouth-opening images. These features are combined with actual difficult intubation labels to construct a structured multi-modal prediction dataset, which is processed with a random oversampling technique. The study employs two integrated machine learning algorithms—random forest and gradient boosting decision trees—for model training and evaluation. Results show that the gradient boosting and random forest models achieve prediction accuracies of 92% and 93%, respectively, on an independent test set, demonstrating good assessment performance. Concurrently, a logistic regression model is trained within the MMAAF framework. Features are weighted according to their importance weights, and a personalized probability score for difficult intubation is calculated for each patient. This provides an intuitive quantitative reference based on multi-modal features to support clinical decision-making.

Key words : difficult airway；intubation difficulty prediction；medical image analysis；computer vision；random forest；gradient boosting decision tree

引言

气道管理是麻醉、重症及急诊医学的核心，气管插管是最常用的人工气道建立技术。然而，困难气道（Difficult Airway）的发生给临床带来严峻挑战。传统预测主要依赖临床评估工具，结果受评估者主观经验影响大，存在观察者间变异，且多为定性或半定量指标，缺乏客观统一的量化标准。尤其在张口度评估中，常用目测或简单测量，难以精确捕捉口腔内复杂解剖细节（如舌体大小、咽喉可见度等），而这些细节是影响喉镜显露和插管成败的关键。

现有困难气道预测技术，包括传统的临床评估和引入智能化算法的方案，均存在显著局限。首先，传统临床评估方法主观性强、量化不足，结果高度依赖于评估者的个人经验与主观判断，导致观察者间变异大。同时，这些方法多为定性或半定量指标，缺乏客观、统一的量化标准。其次，现有基于人工智能的预测研究在特征维度与模型可解释性上存在不足。近年来，虽有研究尝试利用面部图像或视频预测插管困难，但其关注点多局限于面部外部轮廓（如颈部轮廓、面部比例）或少数几项指标。这些方法对口腔内部关键解剖结构（如舌、腭咽、声门可见区）的精细化、多维度联合量化分析明显不足。此外，许多模型被视为黑箱，其决策过程缺乏可解释性，医生难以理解预测依据，从而限制了其在关键临床决策中的被接受度。因此，现有方法的预测性能、鲁棒性及其在真实临床场景中的普适性仍有较大提升空间。

为了填补这一研究空白，本研究提出了一种基于患者张口静态图像的自动化、客观化气道评估框架MMAAF（Multi-Modal Airway Assessment Framework），主要创新点与贡献在于：

（1）多维度解剖特征量化：突破传统单一张口度测量，利用计算机视觉技术，从单张图像中自动化提取六项精细的解剖学与几何特征，包括张口度与头部比例、舌口面积比、咽峡部可见性、张嘴纵横比、上下门齿间距以及颏唇沟角度，实现了对气道入口结构数字化描述。

（2）构建结构化预测数据集：将提取的视觉特征与患者是否存在插管困难的真实临床标签相结合，构建了结构化的机器学习预测数据集，为模型训练与验证奠定了基础。

（3）集成学习模型构建与验证：针对医疗数据中常见的类别不平衡问题，采用随机过采样技术进行处理。应用随机森林和梯度提升树两种集成学习算法进行建模，通过独立测试集和五折交叉验证系统评估模型性能，确保其准确性与稳健性。

（4）可解释的临床决策支持：不仅追求高预测精度，还通过特征重要性分析揭示各视觉特征的贡献度，并进一步结合逻辑回归模型生成个体化的插管困难概率评分，为麻醉医生提供一个直观、量化的风险评估工具，辅助术前制定更精准的气道管理方案。

本文详细内容请下载：

https://www.chinaaet.com/resource/share/2000007098

作者信息：

田伊1，陈泽玮2，李百川2，倪诚1，郑晖1

（1.国家癌症中心/国家肿瘤临床医学研究中心/中国医学科学院北京协和医院肿瘤医院，北京 100021；

2.北京邮电大学计算机学院，北京 100876）

原创声明：此内容为AET网站原创，未经授权禁止转载。

相关内容