Linguakit y los extractores de palabras clave

  • 27 Junio, 2014
  • Linguakit
  • 0 Comments

Linguakit continúa expandiéndose.

Desde Cilenis continuamos esforzándonos por hacer de Linguakit el portal preferido por expertos lingüistas, periodistas, editores, publicistas, profesores, alumnos o cualquier usuario del lenguaje. Por eso, hoy Linguakit integra dos herramientas lingüísticas más: el extractor de palabras clave y el extractor multipalabra, una herramienta única y poco común en este campo. Con ellos puedes obtener la información más relevante de un texto escrito.

Al introducir un texto en el extractor de palabras clave o en el extractor multipalabra de Linguakit obtendrás de forma automática las palabras o grupo de palabras más destacadas, clasificadas en orden descendente según su grado de relevancia. Además, estas palabras aparecerán destacadas en el propio texto, complementando la extracción con una visualización de los términos.

¿Cómo funcionan estas herramientas?

Para poder realizar esta clasificación, el extractor de palabras clave se basa en un modelo de frecuencias observadas y frecuencias estimadas. Así, el sistema calcula el peso de los vocablos en el texto, mediante test estadísticos con los que realiza una comparación entre la frecuencia observada de las palabras del texto con la frecuencia estimada, es decir, con la frecuencia que deberían tener esas palabras en el corpus ideal o corpus de referencia.

Para el caso del extractor multipalabra, la estrategia es diferente. Integra dos procesos en los que, en primer lugar, identifica los “candidatos” a términos multipalabra, que deben pertenecer a un patrón gramatical: nombre-preposición-nombre, adjetivo-nombre, nombre-adjetivo; y en segundo lugar, ordena de mayor a menor relevancia siguiendo medidas de asociación estadísticas.

Asimismo, otra diferencia entre ambos extractores es la salida de información que el sistema te proporciona. Al introducir un texto en el extractor de palabras clave lo primero que te va a devolver el sistema es una nube construida con las palabras más destacadas del texto, resaltadas en diferentes colores y tamaños de acuerdo a su grado de relevancia. Tú eliges el número de palabras que aparecerán en esta nube.

Linguakit Keyword extractor ES

¿Para qué sirven estos extractores?

Estas dos herramientas lingüísticas resultan muy útiles para la detección de tema de una forma rápida y automática, lo que facilita enormemente la clasificación documental y el etiquetado. Incluso, si necesitas ampliar la búsqueda de palabras clave a términos y temas que precisan de más de una palabra para expresarse, puedes hacerlo con el extractor multipalabra. Por lo tanto, con la combinación de estos dos instrumentos el resultado obtenido es mucho más potente.

Linguakit es ya, un extractor de palabras clave además de un conjugador, un analizador de sentimiento y un identificador de idioma. Optimiza tus recursos convirtiéndote en un usuario de Linguakit.

Empieza a disfrutar de los beneficios de utilizar este portal.

Linguakit.com

0 Comments