Linguakit e os extractores de palabras chave

  • 27 Xuño, 2014
  • Linguakit
  • 0 Comentarios

Linguakit segue a expandirse.

Dende Cilenis continuamos esmerándonos por facer de Linguakit o portal preferido por expertos lingüistas, xornalistas, editores, publicistas, profesores, alumnos ou calquera usuario da linguaxe. Por iso, hoxe Linguakit integra dúas ferramentas lingüísticas máis: o extractor de palabras chave e o extractor multipalabra, unha ferramenta única e pouco común neste campo. Con eles podes obter a información máis relevante dun texto escrito.

Ao introducir un texto no extractor de palabras chave ou no extractor multipalabra de Linguakitobterás de forma automática as palabras ou grupo de palabras máis destacadas, clasificadas en orde descendente segundo o seu grao de relevancia. Ademais, estas palabras aparecerán resaltadas no propio texto, complementando a extracción cunha visualización dos termos.

Como funcionan estas ferramentas?

Para poder realizar esta clasificación, o extractor de palabras chave baséase nun modelo de frecuencias observadas e frecuencias estimadas. Así, o sistema calcula o peso dos vocábulos no texto, mediante test estatísticos cos que realiza unha comparación entre a frecuencia observada das palabras do texto coa frecuencia estimada, é dicir, coa frecuencia que deberían ter esas palabras no corpus ideal ou corpus de referencia.

Para o caso do extractor multipalabra, a estratexia é diferente. Integra dous procesos nos que, en primeiro lugar, identifica os “candidatos” a termos multipalabra, que deben pertencer a un padrón gramatical: nome-preposición-nome, adxectivo-nome, nome-adxectivo; e en segundo lugar, ordena de maior a menor relevancia seguindo medidas de asociación estatísticas.

Así mesmo, outra diferenza entre ámbolos dous extractores é a saída de información que o sistema che proporciona. Ao introducir un texto no extractor de palabras chave o primeiro que che vai devolver o sistema é unha nube construída coas palabras máis destacadas do texto, resaltadas en diferentes cores e tamaños segundo o seu grao de relevancia. Ti elixes o número de palabras que aparecerán nesta nube.

Linguakit Keyword extractor

Para que serven estes extractores?

Estas dúas ferramentas lingüísticas resultan moi útiles para a detección de tema dunha forma rápida e automática, o que facilita enormemente a clasificación documental e a etiquetaxe. Incluso, se precisas ampliar a procura de palabras chave a termos e temas que precisan de máis dunha palabra para expresarse, podes facelo co extractor multipalabra. Polo tanto, coa combinación destes dous instrumentos o resultado obtido é moito máis potente.

Linguakit é xa, un extractor de palabras chave ademais dun conxugador, un analizador de sentimento e un identificador de idioma. Optimiza os teus recursos converténdote nun usuario de Linguakit.

Comeza a gozar dos beneficios de empregar este portal.

Linguakit.com

0 Comments