Deep Learning for Medical Image-Based Cancer Diagnosis
Jiang et al., 2023
Abstract
Background: The application of deep learning technology to realize cancer diagnosis based on medical images is one of the research hotspots in the field of artificial intelligence and computer vision. Due to the rapid development of deep learning methods, cancer diagnosis requires very high accuracy and timeliness as well as the inherent particularity and complexity of medical imaging. A comprehensive review of relevant studies is necessary to help readers better understand the current research status and ideas.
Methods: Five radiological images, including X-ray, ultrasound (US), computed tomography (CT), magnetic resonance imaging (MRI), positron emission computed tomography (PET), and histopathological images, are reviewed in this paper. The basic architecture of deep learning and classical pretrained models are comprehensively reviewed. In particular, advanced neural networks emerging in recent years, including transfer learning, ensemble learning (EL), graph neural network, and vision transformer (ViT), are introduced. Five overfitting prevention methods are summarized: batch normalization, dropout, weight initialization, and data augmentation. The application of deep learning technology in medical image-based cancer analysis is sorted out.
Results: Deep learning has achieved great success in medical image-based cancer diagnosis, showing good results in image classification, image reconstruction, image detection, image segmentation, image registration, and image synthesis. However, the lack of high-quality labeled datasets limits the role of deep learning and faces challenges in rare cancer diagnosis, multi-modal image fusion, model explainability, and generalization.
Conclusions: There is a need for more public standard databases for cancer. The pre-training model based on deep neural networks has the potential to be improved, and special attention should be paid to the research of multimodal data fusion and supervised paradigm. Technologies such as ViT, ensemble learning, and few-shot learning will bring surprises to cancer diagnosis based on medical images.
Español
Aprendizaje profundo para el diagnóstico de cáncer basado en imagenología médica
Resumen
Antecedentes: El uso de tecnología de aprendizaje profundo para realizar diagnósticos de cáncer basados en imagenología médica es uno de los puntos más populares de la investigación en el campo de la inteligencia artificial y la visión por computadora. Debido a los rápidos avances en los métodos de aprendizaje profundo, el diagnóstico de cáncer debe ser altamente preciso y puntual, en especial por la inherente particularidad y complejidad de la imagenología médica. Se necesita de una revisión comprensiva de estudios relevantes para ayudar a los lectores a entender mejor el estado y las ideas actuales de la investigación.
Métodos: Se revisan 5 tipos de imágenes radiológicas en esta publicación, incluyendo radiografía, ultrasonido (US), tomografía axial computarizada (TAC), resonancia magnética (RM), tomogragía por emisión de positrones (PET, por sus siglas en inglés) e imágenes histopatológicas. Se revisa de manera comprensiva la arquitectura básica de modelos de aprendizaje profundo y modelos pre-entrenados clásicos. Se introducen en particular redes neuronales avanzadas que han surgido en los últimos años, incluyendo el aprendizaje por transferencia, el aprendizaje en conjunto (ensemble learning, EL), las redes neuronales de grafos y los transformadores de visión (ViT). Se sintetizan [cuatro] métodos de prevención del sobreajuste: normalización por lotes, desactivación (dropout), inicialización de pesos y aumento de datos. Se resolvió la aplicación de la tecnología de aprendizaje profundo en el análisis del cáncer basado en imagenología médica.
Resultados: El aprendizaje profundo ha conseguido gran éxito en el diagnóstico de cáncer basado en imagenología médica, mostrando buenos resultados en la clasificación, reconstrucción, detección, segmentación, registro y síntesis de imágenes. Sin embargo, la falta de bases de datos etiquetadas de alta calidad limita el papel del aprendizaje profundo y enfrenta desafíos en el diagnóstico de cánceres atípicos fusión de imágenes multimodales, explicabilidad de modelos y generalización.
Conclusiones: Se necesitan más bases de datos estandarizadas públicas para el cáncer. El modelo pre-entrenado basado en redes neuronales profundas tiene potencial de mejora, y se debe prestar especial atención a la investigación de fusión de datos multimodales y del paradigma supervisado. Tecnologías como el ViT, aprendizaje en conjunto y aprendizaje con pocas muestras (few-shot learning) traerá sorpresas en el diagnóstico de cáncer basado en imagenología médica.