Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12104/81215
Registro completo de metadatos
Campo DCValorLengua/Idioma
dc.contributor.advisorMorales Valencia, José Alejandro
dc.contributor.advisorMendizábal Ruíz, Eduardo Gerardo
dc.contributor.authorSantana Castolo, Manuel Humberto
dc.date.accessioned2020-07-26T18:50:00Z-
dc.date.available2020-07-26T18:50:00Z-
dc.date.issued2019-07-24
dc.identifier.urihttps://hdl.handle.net/20.500.12104/81215-
dc.identifier.urihttps://wdg.biblio.udg.mx
dc.description.abstractEl genoma humano es el conjunto de cadenas de DNA que contienen la información biológica para desarrollar un ser humano. Debido a esto, existe una noción intuitiva de que la información biológica del DNA es un conjunto de elementos altamente ordenados. Las secuencias ampliamente estudiadas en biología computacional son las secuencias de codificación. Estas secuencias son un claro ejemplo de esa noción porque los codones son las unidades de codificación de la expresión genética. Sin embargo, dentro del genoma hay otras porciones además de las secuencias de codificación que tienen funciones biológicas y, por lo tanto, información biológica. El estudio de las secuencias no codificantes es difícil, porque no hay unidades de codificación definidas similares a los codones, no muestran características de patrones simples y regulan la expresión de las secuencias codificantes. Además, sólo hay un puñado de bases de datos que describen las funciones biológicas de estas secuencias y su ubicación dentro del genoma. El estudio de los patrones de nucleótidos en la secuencia no codificante, es decir, las unidades de codificación complejas presentes en la secuencia no codificante, mejorará nuestra comprensión del genoma. El aprendizaje profundo (DL, por sus siglas en inglés) es un conjunto de algoritmos que pertenecen a la rama del aprendizaje maquina (ML, por sus siglas en inglés) y la inteligencia artificial. Actualmente tienen una variedad de aplicaciones que van desde la detección del cáncer de piel, descubrimiento de fármacos, hasta la segmentación de tumores cerebrales. DL permite aprender representaciones de los datos con diferentes niveles de abstracción, estos algoritmos están basados en redes neuronales compuestas de múltiples capas profundas. Existen diversos acercamientos a la clasificación de secuencias genómicas por su función con base en algoritmos de ML, donde una de sus características es que las funciones a clasificar son categorizadas en bi-clases; tampoco ha existido el acercamiento a algunas de las secuencias funcionales del genoma. Es por ello que un algoritmo de DL que pueda diferenciar entre secuencias codificantes y no codificantes y que prediga a que etiqueta funcional genómica pertenezca esa secuencia es de interés a la ciencia genómica.
dc.description.tableofcontents1. Introducción. 2. Justificación. 3. Hipótesis. 4. Objetivos. 5. Antecedentes. 5.1. Deep Learning. 5.2. Arquitecturas de Redes Neuronales. 5.3. Ciencias Ómicas. 5.3.1. Deep Genómica y Deep Proteómica. 5.3.2. Deep Transcriptómica. 6. Metodología 10 6.1. Minado de Genomas. 6.2. Preprocesamiento de Genomas. 6.3. Generación de modelo de DL. 6.3.1. Entrenamiento y prueba de modelo. 6.3.2. Métricas de evaluación. 6.3.3. Ajuste de Hiperparámetros. 6.4. Validación de algoritmos de DL. 6.4.1. Validación con organismos modelo. 6.4.2. Validación con bases de datos especializadas. 6.5. Recursos informáticos. 7. Resultados y Discusión. 7.1. Minado de base de datos genómicos. 7.1.1. Especies utilizadas. 7.2. Etiquetas funcionales. 7.2.1. Características seleccionadas. 7.3. Pre-procesamiento de Genomas. 7.4. Arquitectura de DL. 7.4.1. DNA-ResNet. 7.5. Generación de modelo de DL clasificador de etiquetas genómicas funcionales. 7.5.1. Modelo clasificador de etiquetas codificantes. 7.5.2. Modelo clasificador de etiquetas no codificantes. 7.5.3. Modelo clasificador de secuencias codificantes y no codificantes. 7.6. Validación de algoritmos de DL. 7.6.1. Validación con organismos modelo. 7.6.2. Caenorhabditis elegans. 7.6.3. Drosophila melanogaster. 7.6.4. Mus musculus. 7.6.5. Homo sapiens. 7.6.6. Validación con bases de datos especializadas. 8. Conclusiones. 9. Trabajo Futuro. Referencias.
dc.formatapplication/PDF
dc.language.isospa
dc.publisherBiblioteca Digital wdg.biblio
dc.publisherUniversidad de Guadalajara
dc.rights.urihttps://www.riudg.udg.mx/info/politicas.jsp
dc.subjectDeep Learning
dc.subjectRedes Neuronales
dc.subjectCiencias Omicas
dc.subjectGenomica
dc.subjectProteomica.
dc.titleModelo de aprendizaje profundo para clasificación de secuencias genómicas
dc.typeTesis de Doctorado
dc.rights.holderUniversidad de Guadalajara
dc.rights.holderSantana Castolo, Manuel Humberto
dc.coverageGUADALAJARA, JALISCO
dc.type.conacytDoctoralThesis-
dc.degree.nameDOCTORADO EN CIENCIAS DE LA ELECTRONICA Y LA COMPUTACION CON ORIENTACIONES-
dc.degree.departmentCUCEI-
dc.degree.grantorUniversidad de Guadalajara-
dc.rights.accessopenAccess-
dc.degree.creatorDOCTOR EN CIENCIAS DE LA ELECTRONICA Y LA COMPUTACION CON ORIENTACIONES-
Aparece en las colecciones:CUCEI

Ficheros en este ítem:
Fichero TamañoFormato 
DCUCEI10017.pdf
Acceso Restringido
285.9 kBAdobe PDFVisualizar/Abrir    Request a copy


Los ítems de RIUdeG están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.