Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12104/92084
Registro completo de metadatos
Campo DCValorLengua/Idioma
dc.contributor.advisorCarrillo Ballesteros, Francisco Josué
dc.contributor.authorGutierrez Ricardo, Francisco Roman
dc.date.accessioned2023-04-19T18:51:10Z-
dc.date.available2023-04-19T18:51:10Z-
dc.date.issued2022-10-05
dc.identifier.urihttps://wdg.biblio.udg.mx
dc.identifier.urihttps://hdl.handle.net/20.500.12104/92084-
dc.description.abstractEl cáncer de páncreas es una de las enfermedades más letales del mundo con una tasa de supervivencia muy baja, dicha enfermedad puede ser ocasionada por factores genéticos tanto hereditarios como somáticos, siendo más frecuentes los últimos, esta característica hace que sea difícil tener una adecuada prevención de la enfermedad, siendo comúnmente diagnosticada en estadios tardíos cuando el tratamiento ya suele ser ineficiente. Lo anterior, sumado a que el diagnóstico se sugiere en 2 partes, el preliminar y el confirmatorio, el primero puede ser realizado por técnicas de imagenología; sin embargo, el tratamiento requiere necesariamente el diagnóstico confirmatorio que es realizado mediante biopsia quirúrgica que es un método bastante invasivo y que requiere ya la confirmación de un tumor, lo que ocasiona que el diagnóstico suela ser tardío. Este es claramente un problema para lo cual se han propuesto varias alternativas, entre las cuales se encuentra realizar una biopsia líquida a las personas ya sea con síntomas prodrómicos o de forma universal a los individuos que se encuentran en una edad de riesgo. En dicha muestra se podrían identificar diversos marcadores sanguíneos y con ellos realizar el diagnóstico y en su caso determinar el estadio (si es primario o si existe metástasis); sin embargo, el uso de esta técnica presenta aún hoy en día varios inconvenientes, entre los más importantes es que no hay herramientas accesibles que permitan el screening poblacional en edad de riesgo y también que no existan tecnologías suficientemente robustas y confiables que permitan diagnosticar e identificar el estadio de dicho padecimiento.
dc.description.tableofcontentsRESUMEN vi DEDICATORIA viii AGRADECIMIENTOS ix ABREVIATURAS x ÍNDICE xi LISTA DE FIGURAS xiv LISTA DE TABLAS xv 1. INTRODUCCIÓN 1 2. ANTECEDENTES 3 2.1 Carcinogénesis 4 2.1.1 Mutaciones somáticas 6 2.1.2 Genes Driver y Passenger 6 2.2 Datos epidemiológicos mortalidad y morbilidad en Jalisco, México y el Mundo 6 2.3 Comorbilidades y factores de riesgo 7 2.4 Cuadro clínico 7 2.5 Diagnostico Diferencial (Guías clínicas) 8 2.5.1 Tomografía computarizada 8 2.5.2 Biopsias 8 2.5.3 Metodologías para la detección de mutaciones 9 2.6 Genes involucrados en cáncer somático de páncreas 10 2.7 Terapia farmacológica y pronostico 10 2.8 COSMIC 10 2.8.1 Licencia no comercial 11 2.8.2 Uso permitido 11 2.9 Machine Learning 11 2.9.1 Python 11 2.9.2 Pandas 12 2.9.3 Scikit Learn (sklearn) 12 2.9.4 Algoritmos de aprendizaje supervisados 12 2.9.4.1 Decision Tree 13 2.9.4.2 Random Forest 14 2.9.4.3 Support Vector Mechine 14 2.9.4.4 K Nearest Neighbor 16 2.9.4.5 Red Neuronal MPL 17 3. JUSTIFICACIÓN 19 4. HIPÓTESIS 20 5. OBJETIVOS 21 6. METODOLOGÍA 22 6.1 Tipo de estudio 22 6.2 Sede de estudio 22 6.3 Universo de estudio 22 6.4 Periodo de estudio 22 6.5 Criterio de selección 22 6.5.1 Criterios de inclusión 22 6.5.2 criterios de no inclusión 22 6.5.3 criterios de exclusión 22 6.6 Metodología general 22 6.7 Curación de datos 23 6.8 Filtrado de base datos 25 6.9 Codificación de base de datos 31 6.10 Procesamiento de base de datos 34 6.10.1 Random Forest 36 6.10.2 Support Vector Machine 36 6.10.3 K-Nearest Neighbor 36 6.10.4 Red neuronal 36 6.11 Análisis de resultados 37 6.11.1 puntaje de precisión (accuracy score) 37 6.11.2 Matriz de confusión (confusion matrix) 37 7. RESULTADOS Y DISCUSIÓN 40 7.1 Random Forest 40 7.1.1 dataframe A 40 7.1.2 dataframe B 41 7.2 Support Vector Machine 41 7.2.1 dataframe A 41 7.2.2 dataframe B 42 7.3 K-Nearest Neighbor 42 7.3.1 dataframe A 42 7.3.2 dataframe B 43 7.4 Red Neuronal 43 7.4.1 dataframe A 43 7.4.2 dataframe B 44 7.5 Comparación de resultados 44 7.5.1 Precisión 44 7.5.2 Recall 46 7.5.2 F1-score 48 7.6 Micro y Macropromedio 51 7.6.1 Random Forest 51 7.6.2 Support Vector Machine 52 7.6.3 K-Nearest Neighbor 54 7.6.4 Red neuronal 56 7.5 Discusión 59 8. CONCLUSIONES 66 BIBLIOGRAFÍA 67 ANEXO (Random Forest) 1 70 ANEXO (SVM) 2 74 ANEXO (K- Nearest Neighbor) 3 78 ANEXO (Red Neuronal) 4 81
dc.formatapplication/PDF
dc.language.isospa
dc.publisherBiblioteca Digital wdg.biblio
dc.publisherUniversidad de Guadalajara
dc.rights.urihttps://www.riudg.udg.mx/info/politicas.jsp
dc.titlePredicción de cáncer de páncreas de tipo somático con aprendizaje máquina (Machine learning) usando la base de datos COSMIC
dc.typeTesis de Licenciatura
dc.rights.holderUniversidad de Guadalajara
dc.rights.holderGutierrez Ricardo, Francisco Roman
dc.coverageGUADALAJARA, JALISCO.
dc.type.conacytbachelorThesis
dc.degree.nameLICENCIATURA EN QUIMICO FARMACEUTICOBIOLOGO
dc.degree.departmentCUCEI
dc.degree.grantorUniversidad de Guadalajara
dc.rights.accessopenAccess
dc.degree.creatorLICENCIADO EN QUIMICO FARMACEUTICOBIOLOGO
dc.contributor.directorCasillas Muñoz, Fidel Antonio Guadalupe
dc.contributor.codirectorMartínez Fernández, Diana Emília
Aparece en las colecciones:CUCEI

Ficheros en este ítem:
Fichero TamañoFormato 
LCUCEI10134FT.pdf1.99 MBAdobe PDFVisualizar/Abrir


Los ítems de RIUdeG están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.