Linguakit inclúe o recoñecedor de entidades

  • 23 Xuño, 2014
  • Linguakit
  • 0 Comentarios

As novas tecnoloxías da información están cada vez máis presentes na nosa vida diaria. Poucos son os ámbitos que non estean integrados coa informática. Sen embargo, existe un segmento que apenas foi explorado polas TIC: o da linguaxe humana. Por este motivo, o equipo de Cilenis e o grupo de investigación ProLNat da USC traballamos conxuntamente para ofrecervos unha plataforma única, resultado da combinación de linguaxe humana e informática: Linguakit.

Hoxe estreamos o Recoñecedor de Entidades (en inglés: Named Entity Recognition, NER). Esta ferramenta permite extraer dun texto os nomes de persoa, de lugar, de organización, cantidades e datas; de xeito totalmente automático. É dicir, que introducindo un texto podemos saber automáticamente de quen se trata, de onde se trata, de que organización se trata, cando pasou e que cantidades hai no texto. O Recoñecedor de Entidades de Linguakit está dispoñible para inglés, español, portugués e galego; como a maioría dos desenvolvementos de Cilenis.

O funcionamento do Recoñecedor de Entidades está baseado nun modelo no que se combinan algoritmos de aprendizaxe automática cunha análise morfosintáctica, así, segundo o tipo de palabra, o contexto, a posición gramatical, o algoritmo do NER é capaz de atopar as entidades que aparecen nun texto escrito e ademais pode clasificalas (NEC) segundo se trate de persoas, organizacións, lugares, datas e cantidades. E como todos os módulos en Linguakit, está dispoñible para as empresas en CilenisAPI que permite aplicar o NER de xeito masivo a grandes grupos de información textual, o chamado Big Data.

Non perdas máis tempo e descubre as vantaxes de empregar o Recoñecedor de Entidades. Gañarás tempo e información.

Linguakit.com

0 Comments