Saltar apartados

Research Project

Reconocedor de entidades multilingüe (español, valenciano, inglés)

Reference: GV04B/268
Funding: Consellería de Cultura, Educación y Deporte
Period: from 01/01/2004 to 31/12/2005
Project Leader: Muñoz Guillena, Rafael
Members: Ferrández Rodríguez, Antonio
Llopis Pascual, Fernando
Muñoz Terol, Rafael
Peral Cortés, Jesús
Saquete Boró, Estela
Toral Ruiz, Antonio
Summary of the project:
El objetivo principal de este proyecto es construir un reconocedor de entidades con nombres para el español, inglés y valenciano. Este reconocedor tratará de forma automática un texto escrito en español, valenciano o inglés identificando, clasificando y desambigüando las entidades que en él aparecen. Se entiende por entidades con nombres aquellas porciones de textos que hacen referencias a personas, empresas, lugares o expresiones temporales o numéricas.
Áreas como la Recuperación de Información (RI), extracción de Información (EI) y Búsqueda de Respuestas (BR), en particular, y en general aplicaciones de Procesamiento de Lenguaje Natural, necesitan de un módulo que les proporcione información acerca de las entidades con nombres para mejorar la eficiencia de sus sistemas. Este proyecto pretende llenar un vacío que existe en la comunidad científica española para permitir aumentar la eficiencia de los sistemas anteriormente citados.
El objetivo principal científico y tecnológico del proyecto se centra en el campo de investigación denominado reconocimiento de entidades (conocido en inglés, Named Entity Task (NE)). En términos generales, el reconocimiento de entidades consiste en asociar una categoría (persona, organización, lugar, expresión temporal, expresión numérica) a una palabra dada o un conjunto de palabras de un texto, lo que permite distinguirla de otros posibles categorías de esa palabra. Entrando más en detalle, el reconocedor de entidades consistiría en preprocesar un texto no restringido en cualquier lengua con el fin de extraer un conjunto de características (pistas o indicios), para posteriormente usarlas para asignar a cada palabra o conjunto de palabras del texto la categoría más probable, adecuada y eficiente. En un reconocedor de entidades se distinguen las siguientes etapas: identificación de la entidad, clasificación de la entidad y desambiguación de la entidad.

Departament of Software and Computing Systems


University of Alicante, carretera San Vicente s/n

03690 San Vicente del Raspeig, Alicante (Spain)

Tel: (+34) 96 590 3772 | Fax: (+34) 96 590 9326

Follow us on:
[Twitter] [Facebook]