Construcción de descripciones clínicas a partir de imágenes de embriones humanos mediante modelos de lenguaje pequeños

Aguirre León, José Alberto

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12104/112481

Registro completo de metadatos

Campo DC	Valor	Lengua/Idioma
dc.contributor.author	Aguirre León, José Alberto
dc.date.accessioned	2026-04-13T17:57:49Z	-
dc.date.available	2026-04-13T17:57:49Z	-
dc.date.issued	2025-11-10
dc.identifier.uri	https://wdg.biblio.udg.mx
dc.identifier.uri	https://hdl.handle.net/20.500.12104/112481	-
dc.description.abstract	La rápida expansión de los modelos de lenguaje ha transformado la forma en que se procesa, genera y comunica la información. Sin embargo, el entrenamiento y la implementación de modelos a gran escala implica importantes retos en materia de privacidad de los datos y requisitos computacionales. Este trabajo propone la evaluación de modelos de lenguaje pequeños como alternativas eficientes y que preserven la privacidad y accesibilidad de los datos en tareas clínicas para fortalecer e impulsar el uso de esta clase de modelos pequeños. La investigación tiene como objetivo explorar y evaluar modelos de lenguaje pequeños que puedan funcionar con recursos computacionales limitados, ajustarlos con descripciones clínicas proporcionadas por especialistas en embriología e integrarlos en un prototipo funcional capaz de automatizar la generación de texto descriptivo. Los resultados obtenidos se analizan para estimar su coherencia, claridad y similitud en comparación con las descripciones escritas por expertos, así como su compresibilidad para un público no técnico. Los resultados muestran una capacidad prematura de los modelos de lenguaje pequeños para ver y comprender características de las imágenes de embriones, por los codificadores de imagen, así como su ventana de contexto en base a su cantidad de parámetros. Sin embargo, son capaces de reconocer patrones para identificar características principales en una imágen de un embrión humano, sin mucho detalle al ser afinado con datos de imágenes de embriones, por lo que presentan un potencial para ser capaces de detectar regiones y posibles estados de desarrollo siendo ajustados en conjuntos de datos más grandes y estructurados.
dc.description.tableofcontents	Índice Agradecimientos 2 Índice 3 Índice de figuras 6 Resumen 7 Abstract 8 Introducción 9 Marco Teórico 10 Modelos de lenguaje 10 Transformers 10 Tokenizador 11 Encoder / Decoder 12 Modelos de lenguaje-Visión 12 Modelos de Lenguaje Pequeños 13 Optimización y ajuste fino 14 Modelos de lenguaje en la medicina 15 Aplicaciones de Aprendizaje Profundo en Evaluación Embrionaria 15 Desarrollo Embrionario Humano Temprano 15 Estructuras principales del blastocisto 15 Evaluación morfológica de embriones 16 Retos de Privacidad en IA Médica 16 Objetivo General 17 Objetivos Específicos 17 Metodología 18 3 Selección de modelos 18 Tamaño de parámetros 18 Capacidades multimodales 18 Disponibilidad 19 Diversidad arquitectónica 19 Modelos seleccionados 19 Configuración de cuantización: 19 Versión estándar 19 Versión cuantizada 19 Entorno de ejecución 20 Datos 20 Origen y colaboración 20 Características del conjunto de datos 20 Segmentador 20 Procesamiento de las imágenes 21 Descripciones de las imágenes 21 Pruebas iniciales (zero-shot). 21 Hiperparámetros. 21 Ejecución y cuantización. 21 Automatización. 21 Estrategias de prompting 22 Zero-shot 22 One-shot 22 Few-shot 23 Evaluación 24 Resultados 25 Descripción General del Análisis 25 Eficiencia Computacional 25 Análisis Cuantitativo por Estrategia 26 Similitud con Descripciones de Especialistas 29 Análisis de Agrupamiento 29 4 Configuración Óptima por Modelo 30 Anomalía de Llama3.2-Vision 31 Síntesis Comparativa 31 Validación con Usuarios Potenciales 31 Hallazgos Principales 33 Conclusiones 34 Discusión 35 Referencias 37 5 Índice de figuras Figura 1. Diagrama de la arquitectura Transformer (Vaswani et al., 2017) 10 Figura 2. Ejemplo de cómo se dividen los tokens en una oración. 11 Figura 3. Bits por valor en distintos formatos (FP32→INT4). La reducción de precisión disminuye la memoria y el coste computacional, con potencial impacto en exactitud. 13 Figura 4. Diagrama metodológico. 17 Figura 5. Consumo de memoria de GPU aproximada para inferencia de modelos de lenguaje pequeños. 24 Figura 6. Tiempo de inferencia para la generación de las descripciones por modelo. 25 Figura 7. Extensión promedio de palabras de las descripciones por estrategia. 26 Figura 8. Evolución del uso de terminología especializada por modelo y estrategia. 26 Figura 9. Consistencia en el uso de terminología médica. 27 Figura 10. En la figura del lado izquierdo se muestra el promedio de similitud semántica con descripciones de embriólogos humanos. En la figura del lado derecho se muestra la distribución de la similitud por estrategia. 28 Figura 11. En las figuras se puede ver un agrupamiento semántico con base a los componentes principales sin contexto, contexto básico y completo respectivamente. 29 Figura 12. Configuraciones óptimas con mejores resultados para cada modelo. 29 Figura 13. Comparación de selecciones por imágenes IA vs Especialistas. 31 Figura 14. Distribución de porcentajes de selección AI vs Especialistas. 32
dc.format	application/PDF
dc.language.iso	spa
dc.publisher	Biblioteca Digital wdg.biblio
dc.publisher	Universidad de Guadalajara
dc.rights.uri	https://www.riudg.udg.mx/info/politicas.jsp
dc.subject	Modelos De Lenguaje Pequeños
dc.subject	Privacidad De Datos
dc.subject	Procesamiento Del Lenguaje Natural
dc.subject	Recursos Computacionales Limitados
dc.subject	Descripciones Clinicas
dc.subject	Embriologia
dc.subject	Generacion Automatica De Texto
dc.subject	Evaluacion De Coherencia Y Claridad
dc.subject	Similitud Semantica
dc.subject	Codificadores De Imagen
dc.subject	Anali
dc.title	Construcción de descripciones clínicas a partir de imágenes de embriones humanos mediante modelos de lenguaje pequeños
dc.type	Tesis de Maestría
dc.rights.holder	Universidad de Guadalajara
dc.rights.holder	Aguirre León, José Alberto
dc.coverage	GUADALAJARA, JALISCO
dc.type.conacyt	masterThesis
dc.degree.name	MAESTRIA EN CIENCIAS EN BIOINGENIERIA Y COMPUTO INTELIGENTE
dc.degree.department	CUCEI
dc.degree.grantor	Universidad de Guadalajara
dc.rights.access	openAccess
dc.degree.creator	MAESTRIA EN CIENCIAS EN BIOINGENIERO EN Y COMPUTO INTELIGENTE
dc.contributor.director	Paredes, Omar
dc.contributor.codirector	Aguilar Figueroa, Isaac Rene
Aparece en las colecciones:	CUCEI

Ficheros en este ítem:

Fichero	Tamaño	Formato
MCUCEI11272FT.pdf	4.98 MB	Adobe PDF	Visualizar/Abrir

Mostrar el registro sencillo del ítem