Linguakit inclui o reconhecedor de entidades

  • 23 Junho, 2014
  • Linguakit
  • 0 Comments

As novas tecnologias da informação estão cada vez mais presentes na nossa vida diária. Poucos são os âmbitos que não estejam integrados com a informática. Contudo, existe um segmento menos explorado pelas TIC: o da linguagem humana. Por este motivo, a equipa de Cilenis e o grupo de investigação da USC, ProLNat, trabalhamos conjuntamente para oferecer-vos uma plataforma única, resultado da combinação de linguagem humana e informática: Linguakit.

Hoje estreamos o Reconhecedor de Entidades (em inglês: Named Entity Recognition, NER). Esta ferramenta permite extrair de um texto os nomes de pessoa, de lugar, de organizações, quantidades e datas; de modo totalmente automático. É dizer, introduzindo um texto podemos saber sobre quem (pessoa ou organização), onde, quando e quanto informa o texto. O Reconhecedor de Entidades de Linguakit está disponível para inglês, espanhol, português e galego, tal e como a maioria dos desenvolvimentos de Cilenis.

O funcionamento do Reconhecedor de Entidades está baseado num modelo no que se combinam algoritmos de aprendizagem automática com uma análise morfossintática. Assim, segundo o tipo de palavra, o contexto, a posição gramatical, o algoritmo do NER é capaz de encontrar as entidades que aparecem num texto escrito e classificá-las (NEC) segundo se trate de pessoas, organizações, lugares, datas e quantidades. E, como todos os módulos de Linguakit, está disponível para as empresas em CilenisAPI, o que permite aplicar o NER de modo maciço a grandes grupos de informação textual, o chamado Big Data.

Descobre as vantagens de empregar o Reconhecedor de Entidades. Ganharás tempo e informação.

Linguakit.com

0 Comments