Exploring unsupervised features in Conditional Random Fields for Spanish Named Entity Recognition

Jenny Copara; Jose Ochoa; Camilo Thorne; Goran Glavas

doi:10.1235/bracis.vi.102

PDF

Published Dec 14, 2016

DOI: https://doi.org/10.1235/bracis.vi.102

Jenny Copara Jose Ochoa Camilo Thorne Goran Glavas

Abstract

Unsupervised features such as word representations mostly given by word embeddings have been shown significantly improve semi supervised Named Entity Recognition (NER) for English language. In this work we investigate whether unsupervised features can boost (semi) supervised NER in Spanish. To do so, we use word representations and collocations as additional features in a linear chain Conditional Random Field (CRF) classifier. Experimental results (82.44% F-score on the CoNLL- 2002 corpus and 65.72% F-score on Ancora Corpus) show that our approach is comparable to some state-of-art Deep Learning approaches for Spanish, in particular when using cross-lingual Word Representations.

How to Cite

COPARA, Jenny et al. Exploring unsupervised features in Conditional Random Fields for Spanish Named Entity Recognition. BRACIS, [S.l.], dec. 2016. Available at: <http://250154.o0gct.group/index.php/bracis/article/view/102>. Date accessed: 28 nov. 2024. doi: https://doi.org/10.1235/bracis.vi.102.

ABNT APA BibTeX CBE EndNote - EndNote format (Macintosh & Windows) MLA ProCite - RIS format (Macintosh & Windows) RefWorks Reference Manager - RIS format (Windows only) Turabian

Issue

2016: BRACIS

Section

Artigos

Article Sidebar

Main Article Content

Abstract

Article Details