Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12104/112481
Registro completo de metadatos
Campo DCValorLengua/Idioma
dc.contributor.authorAguirre León, José Alberto
dc.date.accessioned2026-04-13T17:57:49Z-
dc.date.available2026-04-13T17:57:49Z-
dc.date.issued2025-11-10
dc.identifier.urihttps://wdg.biblio.udg.mx
dc.identifier.urihttps://hdl.handle.net/20.500.12104/112481-
dc.description.abstractLa rápida expansión de los modelos de lenguaje ha transformado la forma en que se procesa, genera y comunica la información. Sin embargo, el entrenamiento y la implementación de modelos a gran escala implica importantes retos en materia de privacidad de los datos y requisitos computacionales. Este trabajo propone la evaluación de modelos de lenguaje pequeños como alternativas eficientes y que preserven la privacidad y accesibilidad de los datos en tareas clínicas para fortalecer e impulsar el uso de esta clase de modelos pequeños. La investigación tiene como objetivo explorar y evaluar modelos de lenguaje pequeños que puedan funcionar con recursos computacionales limitados, ajustarlos con descripciones clínicas proporcionadas por especialistas en embriología e integrarlos en un prototipo funcional capaz de automatizar la generación de texto descriptivo. Los resultados obtenidos se analizan para estimar su coherencia, claridad y similitud en comparación con las descripciones escritas por expertos, así como su compresibilidad para un público no técnico. Los resultados muestran una capacidad prematura de los modelos de lenguaje pequeños para ver y comprender características de las imágenes de embriones, por los codificadores de imagen, así como su ventana de contexto en base a su cantidad de parámetros. Sin embargo, son capaces de reconocer patrones para identificar características principales en una imágen de un embrión humano, sin mucho detalle al ser afinado con datos de imágenes de embriones, por lo que presentan un potencial para ser capaces de detectar regiones y posibles estados de desarrollo siendo ajustados en conjuntos de datos más grandes y estructurados.
dc.description.tableofcontentsÍndice Agradecimientos 2 Índice 3 Índice de figuras 6 Resumen 7 Abstract 8 Introducción 9 Marco Teórico 10 Modelos de lenguaje 10 Transformers 10 Tokenizador 11 Encoder / Decoder 12 Modelos de lenguaje-Visión 12 Modelos de Lenguaje Pequeños 13 Optimización y ajuste fino 14 Modelos de lenguaje en la medicina 15 Aplicaciones de Aprendizaje Profundo en Evaluación Embrionaria 15 Desarrollo Embrionario Humano Temprano 15 Estructuras principales del blastocisto 15 Evaluación morfológica de embriones 16 Retos de Privacidad en IA Médica 16 Objetivo General 17 Objetivos Específicos 17 Metodología 18 3 Selección de modelos 18 Tamaño de parámetros 18 Capacidades multimodales 18 Disponibilidad 19 Diversidad arquitectónica 19 Modelos seleccionados 19 Configuración de cuantización: 19 Versión estándar 19 Versión cuantizada 19 Entorno de ejecución 20 Datos 20 Origen y colaboración 20 Características del conjunto de datos 20 Segmentador 20 Procesamiento de las imágenes 21 Descripciones de las imágenes 21 Pruebas iniciales (zero-shot). 21 Hiperparámetros. 21 Ejecución y cuantización. 21 Automatización. 21 Estrategias de prompting 22 Zero-shot 22 One-shot 22 Few-shot 23 Evaluación 24 Resultados 25 Descripción General del Análisis 25 Eficiencia Computacional 25 Análisis Cuantitativo por Estrategia 26 Similitud con Descripciones de Especialistas 29 Análisis de Agrupamiento 29 4 Configuración Óptima por Modelo 30 Anomalía de Llama3.2-Vision 31 Síntesis Comparativa 31 Validación con Usuarios Potenciales 31 Hallazgos Principales 33 Conclusiones 34 Discusión 35 Referencias 37 5 Índice de figuras Figura 1. Diagrama de la arquitectura Transformer (Vaswani et al., 2017) 10 Figura 2. Ejemplo de cómo se dividen los tokens en una oración. 11 Figura 3. Bits por valor en distintos formatos (FP32→INT4). La reducción de precisión disminuye la memoria y el coste computacional, con potencial impacto en exactitud. 13 Figura 4. Diagrama metodológico. 17 Figura 5. Consumo de memoria de GPU aproximada para inferencia de modelos de lenguaje pequeños. 24 Figura 6. Tiempo de inferencia para la generación de las descripciones por modelo. 25 Figura 7. Extensión promedio de palabras de las descripciones por estrategia. 26 Figura 8. Evolución del uso de terminología especializada por modelo y estrategia. 26 Figura 9. Consistencia en el uso de terminología médica. 27 Figura 10. En la figura del lado izquierdo se muestra el promedio de similitud semántica con descripciones de embriólogos humanos. En la figura del lado derecho se muestra la distribución de la similitud por estrategia. 28 Figura 11. En las figuras se puede ver un agrupamiento semántico con base a los componentes principales sin contexto, contexto básico y completo respectivamente. 29 Figura 12. Configuraciones óptimas con mejores resultados para cada modelo. 29 Figura 13. Comparación de selecciones por imágenes IA vs Especialistas. 31 Figura 14. Distribución de porcentajes de selección AI vs Especialistas. 32
dc.formatapplication/PDF
dc.language.isospa
dc.publisherBiblioteca Digital wdg.biblio
dc.publisherUniversidad de Guadalajara
dc.rights.urihttps://www.riudg.udg.mx/info/politicas.jsp
dc.subjectModelos De Lenguaje Pequeños
dc.subjectPrivacidad De Datos
dc.subjectProcesamiento Del Lenguaje Natural
dc.subjectRecursos Computacionales Limitados
dc.subjectDescripciones Clinicas
dc.subjectEmbriologia
dc.subjectGeneracion Automatica De Texto
dc.subjectEvaluacion De Coherencia Y Claridad
dc.subjectSimilitud Semantica
dc.subjectCodificadores De Imagen
dc.subjectAnali
dc.titleConstrucción de descripciones clínicas a partir de imágenes de embriones humanos mediante modelos de lenguaje pequeños
dc.typeTesis de Maestría
dc.rights.holderUniversidad de Guadalajara
dc.rights.holderAguirre León, José Alberto
dc.coverageGUADALAJARA, JALISCO
dc.type.conacytmasterThesis
dc.degree.nameMAESTRIA EN CIENCIAS EN BIOINGENIERIA Y COMPUTO INTELIGENTE
dc.degree.departmentCUCEI
dc.degree.grantorUniversidad de Guadalajara
dc.rights.accessopenAccess
dc.degree.creatorMAESTRIA EN CIENCIAS EN BIOINGENIERO EN Y COMPUTO INTELIGENTE
dc.contributor.directorParedes, Omar
dc.contributor.codirectorAguilar Figueroa, Isaac Rene
Aparece en las colecciones:CUCEI

Ficheros en este ítem:
Fichero TamañoFormato 
MCUCEI11272FT.pdf4.98 MBAdobe PDFVisualizar/Abrir


Los ítems de RIUdeG están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.