Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.12104/85125
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorRoman Godinez, Israel
dc.contributor.authorRamirez Lopez, Valeria
dc.date.accessioned2021-10-05T20:40:15Z-
dc.date.available2021-10-05T20:40:15Z-
dc.date.issued2019-12-17
dc.identifier.urihttps://wdg.biblio.udg.mx
dc.identifier.urihttps://hdl.handle.net/20.500.12104/85125-
dc.description.abstractComparar secuencias de ADN tiene como objetivo principal identificar subcadenas de nucleótidos que son comunes en dos o más secuencias. Dicho objetivo se puede lograr mediante diversos métodos, por ejemplo, el alineamiento de pares de secuencias [2] y el alineamiento múltiple. Una de las herramientas más comunes del aprendizaje no supervisado es el agrupamiento (clustering, en inglés), que es útil dentro del reconocimiento de patrones, análisis de datos estadísticos y en la minería de datos.
dc.description.tableofcontentsINTRODUCCIÓN ............................................................................................ 4 JUSTIFICACIÓN ............................................................................................. 6 OBJETIVO ................................................................................................... 7 3.1 Objetivos específicos ................................................................................. 7 HIPÓTESIS .................................................................................................... 8 MARCO TEÓRICO ......................................................................................... 9 5.1 Conceptos Biológicos................................................................................ 9 5.1.1 Ácido desoxirribonucleico (ADN) .......................................................... 9 5.1.2 Secuenciación de ADN ......................................................................... 10 5.2 Conceptos computacionales ...................................................................... 11 5.2.1 Archivo FASTA .................................................................................... 11 5.2.2 Señal genómica ................................................................................... 12 5.2.3 Caracterización ................................................................................... 17 5.2.4 Agrupamiento ...................................................................................... 18 5.2.5 Métricas de evaluación de agrupamiento .............................................. 20 METODOLOGÍA ........................................................................................ 23 6.1 Mapeo de secuencias de ADN .................................................................... 24 6.2 Caracterización de señales genómicas ........................................................ 25 6.3 Agrupamiento de señales genómicas .......................................................... 26 6.4 Evaluación de los grupos generados ........................................................... 26 PRUEBAS Y ANÁLISIS DE RESULTADOS .............................................. 28 7.1 Datos ................................................................................................... 28 7.2 Resultados ARI ........................................................................................ 30 7.3 Resultados de Silhouette ............................................................................ 33 CONCLUSIONES .......................................................................................... 37 REFERENCIAS .............................................................................................. 39
dc.formatapplication/PDF
dc.language.isospa
dc.publisherBiblioteca Digital wdg.biblio
dc.publisherUniversidad de Guadalajara
dc.rights.urihttps://www.riudg.udg.mx/info/politicas.jsp
dc.titleANALISIS DE REPRESENTACIONES NUMERICAS DE SECUENCIAS DE ADN USANDO K-means
dc.typeTesis de Licenciatura
dc.rights.holderUniversidad de Guadalajara
dc.rights.holderRamirez Lopez, Valeria
dc.coverageGUADALAJARA, JALISCO.
dc.type.conacytbachelorThesis
dc.degree.nameLICENCIATURA EN INGENIERIA EN COMPUTACION
dc.degree.departmentCUCEI
dc.degree.grantorUniversidad de Guadalajara
dc.rights.accessopenAccess
dc.degree.creatorLICENCIADO EN INGENIERIA EN COMPUTACION
dc.contributor.directorTorres Ramos, Sulema
Appears in Collections:CUCEI

Files in This Item:
File SizeFormat 
LCUCEI10046FT.pdf7.73 MBAdobe PDFView/Open


Items in RIUdeG are protected by copyright, with all rights reserved, unless otherwise indicated.