Please use this identifier to cite or link to this item:
https://hdl.handle.net/20.500.12104/91106
Title: | Relación de desempeño entre algoritmos para reconocimiento de entidades nombradas y vectores de palabras específicos de dominio biológico |
Author: | Ramos Vargas, Rigo Eslí |
metadata.dc.contributor.director: | Torres Ramos, Sulema |
Issue Date: | 28-May-2021 |
Publisher: | Biblioteca Digital wdg.biblio Universidad de Guadalajara |
Abstract: | El creciente interés por el uso de vectores de palabras como característica para el reconocimiento de entidades nombradas biológicas (BioNER) ha resaltado la necesidad de evaluaciones que ayuden a seleccionar los mejores vectores de palabras. Un criterio común para su selección es el tipo de fuente de donde provienen; esto es, general o específica. La mayoría de estudios se han enfocado en mejorar el rendimiento de BioNER, ya sea combinando múltiples características o probando diferentes algoritmos del estado del arte, lo cual impide observar el desempeño real de los vectores de palabras. Por esta razón, esta tesis evalúa los vectores de palabras Common Crawl y Pyysalo PM + PMC (generales y específicos, respectivamente) de forma extrínseca e intrínseca. De forma extrínseca usando tres algoritmos de NER (CRF, BiLSTM y BiLSTM-CRF) en los corpus DrugBank y MedLine, y de manera intrínseca observando su cohesión semántica y correlación con respecto a cuatro gold standard: Pedersen’s, Hliaoutakis’s, MayoSRS y UMNSRS. Los resultados muestran que no existe una relación de desempeño entre los vectores de palabras específicos y los algoritmos de NER, sorprendentemente, también muestran que los vectores de palabras generales son una buena opción para ser usados como características en BioNER a pesar de tener menor cobertura y menor relación semántica intrínseca que los vectores de palabras específicos. |
URI: | https://wdg.biblio.udg.mx https://hdl.handle.net/20.500.12104/91106 |
metadata.dc.degree.name: | MAESTRIA EN CIENCIAS EN BIOINGENIERIA Y COMPUTO INTELIGENTE |
Appears in Collections: | CUCEI |
Files in This Item:
File | Size | Format | |
---|---|---|---|
MCUCEI10419FT.pdf | 9.99 MB | Adobe PDF | View/Open |
Items in RIUdeG are protected by copyright, with all rights reserved, unless otherwise indicated.