Modelo de aprendizaje profundo para clasificación de secuencias genómicas

Santana Castolo, Manuel Humberto

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12104/81215

Título:	Modelo de aprendizaje profundo para clasificación de secuencias genómicas
Autor:	Santana Castolo, Manuel Humberto
Asesor:	Morales Valencia, José Alejandro Mendizábal Ruíz, Eduardo Gerardo
Palabras clave:	Deep Learning;Redes Neuronales;Ciencias Omicas;Genomica;Proteomica.
Fecha de titulación:	24-jul-2019
Editorial:	Biblioteca Digital wdg.biblio Universidad de Guadalajara
Resumen:	El genoma humano es el conjunto de cadenas de DNA que contienen la información biológica para desarrollar un ser humano. Debido a esto, existe una noción intuitiva de que la información biológica del DNA es un conjunto de elementos altamente ordenados. Las secuencias ampliamente estudiadas en biología computacional son las secuencias de codiﬁcación. Estas secuencias son un claro ejemplo de esa noción porque los codones son las unidades de codiﬁcación de la expresión genética. Sin embargo, dentro del genoma hay otras porciones además de las secuencias de codiﬁcación que tienen funciones biológicas y, por lo tanto, información biológica. El estudio de las secuencias no codiﬁcantes es difícil, porque no hay unidades de codiﬁcación deﬁnidas similares a los codones, no muestran características de patrones simples y regulan la expresión de las secuencias codiﬁcantes. Además, sólo hay un puñado de bases de datos que describen las funciones biológicas de estas secuencias y su ubicación dentro del genoma. El estudio de los patrones de nucleótidos en la secuencia no codiﬁcante, es decir, las unidades de codiﬁcación complejas presentes en la secuencia no codiﬁcante, mejorará nuestra comprensión del genoma. El aprendizaje profundo (DL, por sus siglas en inglés) es un conjunto de algoritmos que pertenecen a la rama del aprendizaje maquina (ML, por sus siglas en inglés) y la inteligencia artificial. Actualmente tienen una variedad de aplicaciones que van desde la detección del cáncer de piel, descubrimiento de fármacos, hasta la segmentación de tumores cerebrales. DL permite aprender representaciones de los datos con diferentes niveles de abstracción, estos algoritmos están basados en redes neuronales compuestas de múltiples capas profundas. Existen diversos acercamientos a la clasiﬁcación de secuencias genómicas por su función con base en algoritmos de ML, donde una de sus características es que las funciones a clasiﬁcar son categorizadas en bi-clases; tampoco ha existido el acercamiento a algunas de las secuencias funcionales del genoma. Es por ello que un algoritmo de DL que pueda diferenciar entre secuencias codiﬁcantes y no codiﬁcantes y que prediga a que etiqueta funcional genómica pertenezca esa secuencia es de interés a la ciencia genómica.
URI:	https://hdl.handle.net/20.500.12104/81215 https://wdg.biblio.udg.mx
Programa educativo:	DOCTORADO EN CIENCIAS DE LA ELECTRONICA Y LA COMPUTACION CON ORIENTACIONES
Aparece en las colecciones:	CUCEI

Ficheros en este ítem:

Fichero	Tamaño	Formato
DCUCEI10017.pdf Acceso Restringido	285.9 kB	Adobe PDF	Visualizar/Abrir Request a copy

Mostrar el registro Dublin Core completo del ítem