Por favor, use este identificador para citar o enlazar este ítem:
https://hdl.handle.net/20.500.12104/112481Registro completo de metadatos
| Campo DC | Valor | Lengua/Idioma |
|---|---|---|
| dc.contributor.author | Aguirre León, José Alberto | |
| dc.date.accessioned | 2026-04-13T17:57:49Z | - |
| dc.date.available | 2026-04-13T17:57:49Z | - |
| dc.date.issued | 2025-11-10 | |
| dc.identifier.uri | https://wdg.biblio.udg.mx | |
| dc.identifier.uri | https://hdl.handle.net/20.500.12104/112481 | - |
| dc.description.abstract | La rápida expansión de los modelos de lenguaje ha transformado la forma en que se procesa, genera y comunica la información. Sin embargo, el entrenamiento y la implementación de modelos a gran escala implica importantes retos en materia de privacidad de los datos y requisitos computacionales. Este trabajo propone la evaluación de modelos de lenguaje pequeños como alternativas eficientes y que preserven la privacidad y accesibilidad de los datos en tareas clínicas para fortalecer e impulsar el uso de esta clase de modelos pequeños. La investigación tiene como objetivo explorar y evaluar modelos de lenguaje pequeños que puedan funcionar con recursos computacionales limitados, ajustarlos con descripciones clínicas proporcionadas por especialistas en embriología e integrarlos en un prototipo funcional capaz de automatizar la generación de texto descriptivo. Los resultados obtenidos se analizan para estimar su coherencia, claridad y similitud en comparación con las descripciones escritas por expertos, así como su compresibilidad para un público no técnico. Los resultados muestran una capacidad prematura de los modelos de lenguaje pequeños para ver y comprender características de las imágenes de embriones, por los codificadores de imagen, así como su ventana de contexto en base a su cantidad de parámetros. Sin embargo, son capaces de reconocer patrones para identificar características principales en una imágen de un embrión humano, sin mucho detalle al ser afinado con datos de imágenes de embriones, por lo que presentan un potencial para ser capaces de detectar regiones y posibles estados de desarrollo siendo ajustados en conjuntos de datos más grandes y estructurados. | |
| dc.description.tableofcontents | Índice Agradecimientos 2 Índice 3 Índice de figuras 6 Resumen 7 Abstract 8 Introducción 9 Marco Teórico 10 Modelos de lenguaje 10 Transformers 10 Tokenizador 11 Encoder / Decoder 12 Modelos de lenguaje-Visión 12 Modelos de Lenguaje Pequeños 13 Optimización y ajuste fino 14 Modelos de lenguaje en la medicina 15 Aplicaciones de Aprendizaje Profundo en Evaluación Embrionaria 15 Desarrollo Embrionario Humano Temprano 15 Estructuras principales del blastocisto 15 Evaluación morfológica de embriones 16 Retos de Privacidad en IA Médica 16 Objetivo General 17 Objetivos Específicos 17 Metodología 18 3 Selección de modelos 18 Tamaño de parámetros 18 Capacidades multimodales 18 Disponibilidad 19 Diversidad arquitectónica 19 Modelos seleccionados 19 Configuración de cuantización: 19 Versión estándar 19 Versión cuantizada 19 Entorno de ejecución 20 Datos 20 Origen y colaboración 20 Características del conjunto de datos 20 Segmentador 20 Procesamiento de las imágenes 21 Descripciones de las imágenes 21 Pruebas iniciales (zero-shot). 21 Hiperparámetros. 21 Ejecución y cuantización. 21 Automatización. 21 Estrategias de prompting 22 Zero-shot 22 One-shot 22 Few-shot 23 Evaluación 24 Resultados 25 Descripción General del Análisis 25 Eficiencia Computacional 25 Análisis Cuantitativo por Estrategia 26 Similitud con Descripciones de Especialistas 29 Análisis de Agrupamiento 29 4 Configuración Óptima por Modelo 30 Anomalía de Llama3.2-Vision 31 Síntesis Comparativa 31 Validación con Usuarios Potenciales 31 Hallazgos Principales 33 Conclusiones 34 Discusión 35 Referencias 37 5 Índice de figuras Figura 1. Diagrama de la arquitectura Transformer (Vaswani et al., 2017) 10 Figura 2. Ejemplo de cómo se dividen los tokens en una oración. 11 Figura 3. Bits por valor en distintos formatos (FP32→INT4). La reducción de precisión disminuye la memoria y el coste computacional, con potencial impacto en exactitud. 13 Figura 4. Diagrama metodológico. 17 Figura 5. Consumo de memoria de GPU aproximada para inferencia de modelos de lenguaje pequeños. 24 Figura 6. Tiempo de inferencia para la generación de las descripciones por modelo. 25 Figura 7. Extensión promedio de palabras de las descripciones por estrategia. 26 Figura 8. Evolución del uso de terminología especializada por modelo y estrategia. 26 Figura 9. Consistencia en el uso de terminología médica. 27 Figura 10. En la figura del lado izquierdo se muestra el promedio de similitud semántica con descripciones de embriólogos humanos. En la figura del lado derecho se muestra la distribución de la similitud por estrategia. 28 Figura 11. En las figuras se puede ver un agrupamiento semántico con base a los componentes principales sin contexto, contexto básico y completo respectivamente. 29 Figura 12. Configuraciones óptimas con mejores resultados para cada modelo. 29 Figura 13. Comparación de selecciones por imágenes IA vs Especialistas. 31 Figura 14. Distribución de porcentajes de selección AI vs Especialistas. 32 | |
| dc.format | application/PDF | |
| dc.language.iso | spa | |
| dc.publisher | Biblioteca Digital wdg.biblio | |
| dc.publisher | Universidad de Guadalajara | |
| dc.rights.uri | https://www.riudg.udg.mx/info/politicas.jsp | |
| dc.subject | Modelos De Lenguaje Pequeños | |
| dc.subject | Privacidad De Datos | |
| dc.subject | Procesamiento Del Lenguaje Natural | |
| dc.subject | Recursos Computacionales Limitados | |
| dc.subject | Descripciones Clinicas | |
| dc.subject | Embriologia | |
| dc.subject | Generacion Automatica De Texto | |
| dc.subject | Evaluacion De Coherencia Y Claridad | |
| dc.subject | Similitud Semantica | |
| dc.subject | Codificadores De Imagen | |
| dc.subject | Anali | |
| dc.title | Construcción de descripciones clínicas a partir de imágenes de embriones humanos mediante modelos de lenguaje pequeños | |
| dc.type | Tesis de Maestría | |
| dc.rights.holder | Universidad de Guadalajara | |
| dc.rights.holder | Aguirre León, José Alberto | |
| dc.coverage | GUADALAJARA, JALISCO | |
| dc.type.conacyt | masterThesis | |
| dc.degree.name | MAESTRIA EN CIENCIAS EN BIOINGENIERIA Y COMPUTO INTELIGENTE | |
| dc.degree.department | CUCEI | |
| dc.degree.grantor | Universidad de Guadalajara | |
| dc.rights.access | openAccess | |
| dc.degree.creator | MAESTRIA EN CIENCIAS EN BIOINGENIERO EN Y COMPUTO INTELIGENTE | |
| dc.contributor.director | Paredes, Omar | |
| dc.contributor.codirector | Aguilar Figueroa, Isaac Rene | |
| Aparece en las colecciones: | CUCEI | |
Ficheros en este ítem:
| Fichero | Tamaño | Formato | |
|---|---|---|---|
| MCUCEI11272FT.pdf | 4.98 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de RIUdeG están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.