Ứng dụng mô hình học sâu trong hỗ trợ chẩn đoán bệnh bụi phổi silic nghề nghiệp
Keywords:
Bụi phổi silic, CNN, học sâu, swin transformer, X-quang ngực.Abstract
Bệnh bụi phổi silic nghề nghiệp là một bệnh nghiêm trọng cần chẩn đoán sớm để phòng ngừa tiến triển nặng. Nghiên cứu này đề xuất sử dụng kiến trúc Swin Transformer để tự động phân loại ảnh X-quang ngực thành hai lớp: bình thường và mắc bệnh bụi phổi silic. Trong quy trình thực hiện, ảnh X-quang gốc ở định dạng DICOM được chuyển đổi sang PNG/JPEG, thay đổi kích thước về 224×224 pixel, kèm theo kỹ thuật tăng cường dữ liệu để mở rộng tập huấn luyện. Mô hình Swin Transformer được xây dựng và huấn luyện sử dụng bộ tối ưu hóa Adam, tận dụng cơ chế attention phân lớp (Hierarchical attention) để trích xuất các đặc trưng quan trọng từ ảnh X-quang phức tạp. Hiệu năng phân loại được đánh giá toàn diện thông qua các chỉ số Accuracy, Precision, Recall, F1-score, AUC-ROC, cùng phân tích ma trận nhầm lẫn và kỹ thuật Grad-CAM để trực quan hóa các vùng ảnh quan trọng. Kết quả thử nghiệm cho thấy mô hình Swin Transformer đạt Accuracy 86,13% và F1-macro 82,96%, vượt trội so với các kiến trúc DenseNet201 và MobileNetV3-Small. Những kết quả này cho thấy khả năng ứng dụng cao của Swin Transformer trong hỗ trợ chẩn đoán sớm bệnh bụi phổi silic từ ảnh X-quang ngực. Hướng nghiên cứu tiếp theo tập trung vào kết hợp phương pháp Graph Transformer Post-hoc nhằm nâng cao hiệu suất phân loại và khả năng giải thích kết quả.