Por favor, use este identificador para citar o enlazar este ítem:
https://hdl.handle.net/20.500.12104/92084
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.advisor | Carrillo Ballesteros, Francisco Josué | |
dc.contributor.author | Gutierrez Ricardo, Francisco Roman | |
dc.date.accessioned | 2023-04-19T18:51:10Z | - |
dc.date.available | 2023-04-19T18:51:10Z | - |
dc.date.issued | 2022-10-05 | |
dc.identifier.uri | https://wdg.biblio.udg.mx | |
dc.identifier.uri | https://hdl.handle.net/20.500.12104/92084 | - |
dc.description.abstract | El cáncer de páncreas es una de las enfermedades más letales del mundo con una tasa de supervivencia muy baja, dicha enfermedad puede ser ocasionada por factores genéticos tanto hereditarios como somáticos, siendo más frecuentes los últimos, esta característica hace que sea difícil tener una adecuada prevención de la enfermedad, siendo comúnmente diagnosticada en estadios tardíos cuando el tratamiento ya suele ser ineficiente. Lo anterior, sumado a que el diagnóstico se sugiere en 2 partes, el preliminar y el confirmatorio, el primero puede ser realizado por técnicas de imagenología; sin embargo, el tratamiento requiere necesariamente el diagnóstico confirmatorio que es realizado mediante biopsia quirúrgica que es un método bastante invasivo y que requiere ya la confirmación de un tumor, lo que ocasiona que el diagnóstico suela ser tardío. Este es claramente un problema para lo cual se han propuesto varias alternativas, entre las cuales se encuentra realizar una biopsia líquida a las personas ya sea con síntomas prodrómicos o de forma universal a los individuos que se encuentran en una edad de riesgo. En dicha muestra se podrían identificar diversos marcadores sanguíneos y con ellos realizar el diagnóstico y en su caso determinar el estadio (si es primario o si existe metástasis); sin embargo, el uso de esta técnica presenta aún hoy en día varios inconvenientes, entre los más importantes es que no hay herramientas accesibles que permitan el screening poblacional en edad de riesgo y también que no existan tecnologías suficientemente robustas y confiables que permitan diagnosticar e identificar el estadio de dicho padecimiento. | |
dc.description.tableofcontents | RESUMEN vi DEDICATORIA viii AGRADECIMIENTOS ix ABREVIATURAS x ÍNDICE xi LISTA DE FIGURAS xiv LISTA DE TABLAS xv 1. INTRODUCCIÓN 1 2. ANTECEDENTES 3 2.1 Carcinogénesis 4 2.1.1 Mutaciones somáticas 6 2.1.2 Genes Driver y Passenger 6 2.2 Datos epidemiológicos mortalidad y morbilidad en Jalisco, México y el Mundo 6 2.3 Comorbilidades y factores de riesgo 7 2.4 Cuadro clínico 7 2.5 Diagnostico Diferencial (Guías clínicas) 8 2.5.1 Tomografía computarizada 8 2.5.2 Biopsias 8 2.5.3 Metodologías para la detección de mutaciones 9 2.6 Genes involucrados en cáncer somático de páncreas 10 2.7 Terapia farmacológica y pronostico 10 2.8 COSMIC 10 2.8.1 Licencia no comercial 11 2.8.2 Uso permitido 11 2.9 Machine Learning 11 2.9.1 Python 11 2.9.2 Pandas 12 2.9.3 Scikit Learn (sklearn) 12 2.9.4 Algoritmos de aprendizaje supervisados 12 2.9.4.1 Decision Tree 13 2.9.4.2 Random Forest 14 2.9.4.3 Support Vector Mechine 14 2.9.4.4 K Nearest Neighbor 16 2.9.4.5 Red Neuronal MPL 17 3. JUSTIFICACIÓN 19 4. HIPÓTESIS 20 5. OBJETIVOS 21 6. METODOLOGÍA 22 6.1 Tipo de estudio 22 6.2 Sede de estudio 22 6.3 Universo de estudio 22 6.4 Periodo de estudio 22 6.5 Criterio de selección 22 6.5.1 Criterios de inclusión 22 6.5.2 criterios de no inclusión 22 6.5.3 criterios de exclusión 22 6.6 Metodología general 22 6.7 Curación de datos 23 6.8 Filtrado de base datos 25 6.9 Codificación de base de datos 31 6.10 Procesamiento de base de datos 34 6.10.1 Random Forest 36 6.10.2 Support Vector Machine 36 6.10.3 K-Nearest Neighbor 36 6.10.4 Red neuronal 36 6.11 Análisis de resultados 37 6.11.1 puntaje de precisión (accuracy score) 37 6.11.2 Matriz de confusión (confusion matrix) 37 7. RESULTADOS Y DISCUSIÓN 40 7.1 Random Forest 40 7.1.1 dataframe A 40 7.1.2 dataframe B 41 7.2 Support Vector Machine 41 7.2.1 dataframe A 41 7.2.2 dataframe B 42 7.3 K-Nearest Neighbor 42 7.3.1 dataframe A 42 7.3.2 dataframe B 43 7.4 Red Neuronal 43 7.4.1 dataframe A 43 7.4.2 dataframe B 44 7.5 Comparación de resultados 44 7.5.1 Precisión 44 7.5.2 Recall 46 7.5.2 F1-score 48 7.6 Micro y Macropromedio 51 7.6.1 Random Forest 51 7.6.2 Support Vector Machine 52 7.6.3 K-Nearest Neighbor 54 7.6.4 Red neuronal 56 7.5 Discusión 59 8. CONCLUSIONES 66 BIBLIOGRAFÍA 67 ANEXO (Random Forest) 1 70 ANEXO (SVM) 2 74 ANEXO (K- Nearest Neighbor) 3 78 ANEXO (Red Neuronal) 4 81 | |
dc.format | application/PDF | |
dc.language.iso | spa | |
dc.publisher | Biblioteca Digital wdg.biblio | |
dc.publisher | Universidad de Guadalajara | |
dc.rights.uri | https://www.riudg.udg.mx/info/politicas.jsp | |
dc.title | Predicción de cáncer de páncreas de tipo somático con aprendizaje máquina (Machine learning) usando la base de datos COSMIC | |
dc.type | Tesis de Licenciatura | |
dc.rights.holder | Universidad de Guadalajara | |
dc.rights.holder | Gutierrez Ricardo, Francisco Roman | |
dc.coverage | GUADALAJARA, JALISCO. | |
dc.type.conacyt | bachelorThesis | |
dc.degree.name | LICENCIATURA EN QUIMICO FARMACEUTICOBIOLOGO | |
dc.degree.department | CUCEI | |
dc.degree.grantor | Universidad de Guadalajara | |
dc.rights.access | openAccess | |
dc.degree.creator | LICENCIADO EN QUIMICO FARMACEUTICOBIOLOGO | |
dc.contributor.director | Casillas Muñoz, Fidel Antonio Guadalupe | |
dc.contributor.codirector | Martínez Fernández, Diana Emília | |
Aparece en las colecciones: | CUCEI |
Ficheros en este ítem:
Fichero | Tamaño | Formato | |
---|---|---|---|
LCUCEI10134FT.pdf | 1.99 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de RIUdeG están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.