Linguakit e os extratores de palavras-chave

  • 27 Junho, 2014
  • Linguakit
  • 0 Comments

Linguakit continua a expandir-se.

Queremos fazer de Linguakit o portal preferido por linguistas, jornalistas, editores, publicistas, professores, alunos ou qualquer utente da linguagem. Por isso, hoje Linguakit integra mais duas ferramentas linguísticas: o extrator de palavras-chave e o extrator multipalavra, uma ferramenta única e pouco comum neste campo. Com eles podes obter a informação mais relevante de um texto escrito.

Ao introduzir um texto no extrator de palavras-chave ou no extrator multipalabra de Linguakit obterás de forma automática as palavras ou grupo de palavras mais destacadas, classificadas em ordem descendente segundo o seu grau de relevância. Ademais, estas palavras aparecerão destacadas no próprio texto, complementando a extração com uma visualização dos termos.

Como é que funcionam estas ferramentas?

Para poder realizar esta classificação, o extrator de palavras-chave basea-se num modelo de frequências observadas e frequências estimadas. Assim, o sistema calcula o peso dos vocábulos no texto, mediante teste estatísticos com os que realiza uma comparação entre a frequência observada das palavras do texto com a frequência estimada, é dizer, com a frequência que deveriam ter essas palavras no corpus ideal ou corpus de referência.

Para o caso do extrator multipalavra, a estratégia é diferente. Integra dois processos nos que, em primeiro lugar, identifica “os candidatos” a termos multipalavra, que devem pertencer a um padrão gramatical: nome-preposição-nome, adjetivo-nome, nome-adjetivo; e em segundo lugar, ordena de maior a menor relevância seguindo medidas de associação estatísticas.

Assim mesmo, outra diferença entre os dois extratores é a saída de informação que o sistema proporciona. Ao introduzir um texto no extrator de palavras-chave o primeiro que vai devolver o sistema é uma nuvem construída com as palavras mais destacadas do texto, destacadas em diferentes cores e tamanhos segundo o seu grau de relevância. Tu escolhes o número de palavras que aparecerão nesta nuvem.

Linguakit keyword extractor PT

Para que é que servem estes extratores?

Estas duas ferramentas linguísticas resultam muito úteis para a deteção de tema de uma forma rápida e automática, o que facilita enormemente a classificação documental e a etiquetagem. Mas, se precisares de alargar a procura de palavras-chave a termos e temas que precisam de mais de uma palavra para expressar-se, podes fazer com o extrator multipalavra. Portanto, com a combinação destes dois instrumentos o resultado obtido é bem mais potente.

Linguakit é agora um extrator de palavras-chave além de um conjugador, um analisador de sentimento e um identificador de idioma. Optimiza os teus recursos convertendo-te num usuário de Linguakit.

Começa a desfrutar dos benefícios de empregar este portal.

Linguakit.com

0 Comments