Pós-processamento do Texto

São destinadas a melhorar a qualidade do texto e compreendem ferramentas para checagem de estilo, corretores ortográficos e gramaticais, ferramentas estatísticas, corretores de erros mecânicos e avaliadores da inteligibilidade de textos para um dado público alvo. Além disso, há várias ferramentas que avaliam a estrutura de um texto já pronto, por exemplo, um resumo, indicando os componentes deste, para o usuário checar com a estrutura esperada para o texto.

AntConc3.3.0w

Ferramenta para manipulação de um corpus de textos de uma dada área para levantamento de concordâncias de uma dada expressão ou palavras, lista de frequências, palavras chave, que ajudam na escrita científica, durante a fase de composição e pós-processamento do texto, pois mostra os padrões do corpus quanto a verbos, marcadores discursivos e outros elementos da linguagem.

Fonte:
Anthony, L. (2006). Developing a Freeware, Multiplatform Corpus Analysis Toolkit for the Technical Writing Classroom. IEEE Transactions on Professional Communication Vol. 49:3, pp. 275-286.
Pecorari, D. (2008). Repeated Language in Academic Discourse: The Case of Biology Background Statements, Nordic Journal of English Studies, vol. 7 No. 3, 2008, pp. 9-33v

Site: http://www.antlab.sci.waseda.ac.jp/antconc_index.html
Custo: Gratuito

Coh-Metrix

Coh-Metrix – desenvolvida por pesquisadores da Universidade de Memphis – calcula a coerência de textos, usando 60 medidas. Ele troca a análise da inteligibilidade de textos, via fórmulas simples e superficiais de inteligibilidade como os Índices Flesch Reading Ease, Flesch–Kincaid Grade Level, Gunning fog por medidas da área de linguística computacional (ou processamento de línguas naturais) e psicolinguística.

Fonte:
Graesser, A.C., McNamara, D.S., Louwerse, M.M., Cai, Z. (2004). Coh-Metrix: Analysis of text on cohesion and language. In Behavioral Research Methods, Instruments, and Computers, V. 36, pp. 193-202.

Site: http://cohmetrix.com/
Custo: Gratuito

Coh-Metrix-Port

Coh-Metrix-Port é uma adaptação de métricas da ferramenta Coh-Metrix para o português do Brasil. A ferramenta Coh-Metrix calcula índices que avaliam a coesão, a coerência e a dificuldade de compreensão de um texto, usando vários níveis de análise lingüística: léxico, sintático, discursivo e conceitual.
Para todas essas métricas, vários recursos de processamento de línguas naturais são utilizados.
A versão 1.0 do Coh-Metrix-Port apresenta 34 métricas das 60 disponíveis na versão livre da ferramenta.
O sistema solicita registro, pois cria uma área para cada novo usuário.

Fonte:
Scarton, C.E., Aluísio, S.M. (2010) Análise da Inteligibilidade de textos via ferramentas de Processamento de Língua Natural: adaptando as métricas do Coh-Metrix para o Português. Linguamática, v2 n1, pp. 45-61.

Site: www.nilc.icmc.usp.br/coh-metrix-port
Custo: Gratuito

Corpus of Contemporary American English (COCA)

Este corpus foi recentemente (abril de 2012) aumentado com textos em inglês do gênero acadêmico e técnico, compondo um corpus anotado que pode ser analisado via ferramentas de busca. São 85 milhões de palavras de revistas acadêmicas e 25 milhões de palavras de textos técnicos, vindos de revistas de divulgação científica. Permite-se fazer download de listas contendo palavras usadas em textos acadêmicos, agrupadas por famílias gramaticais, bem como listas usadas comumente em todo texto acadêmico. Além disso, pode-se listar palavras técnicas de nove subdomínios acadêmicos (História, Educação, Ciências Sociais, Ciências Jurídicas, Literatura, Filosofia, Ciências Biomédicas, e Administração), com suas frequências de ocorrências e palavras que aparecem junto (colocados).

Site: http://corpus.byu.edu/coca/
Preço: Gratuito

Grammarly

Grammarly é uma plataforma para correção gramatical e detecção de plagiarismo desenvolvida pela Grammarly, Inc. em 2009. Checa mais 250 tópicos da gramática do inglês, lista os erros encontrados no texto do usuário e sugere formas de correção. Analisa os seguintes gêneros/tipos de escrita: acadêmico, técnico, criativo, relacionado a negócios e geral. Possui um corretor ortográfico acoplado para detecção de erros ortográficos. O Plug-in para Microsoft Office permite seu uso no Microsoft Word.

Site: https://www.grammarly.com/
Custo: Gratuito

Mover

MOVER é uma ferramenta genérica que detecta componentes retóricos em textos escritos em qualquer língua. É baseada em um classificador que usa aprendizado de máquina com um conjunto de informações estatísticas, sendo assim independente de língua e de dominio. Precisa de um conjunto de textos anotados, com uma estrutura para aprender a tarefa e pode aprender com seus erros, melhorando seu desempenho se o usuário informar a classificação errada de uma oração. É bem flexível, pois admite parametrizar a estrutura, e precisa de um conjunto pequeno de textos anotados em ela para aprender a classificação. Só atribui um classe a cada oração.

Fonte:
Anthony, L., Lashkia, G. (2003). Mover: A machine learning tool to assist in the reading and writing of technical papers. IEEE Transactions on Professional Communication, 46(3), pp.185–193.

Site: http://www.antlab.sci.waseda.ac.jp/software.html
User Guide: http://www.antlab.sci.waseda.ac.jp/software/AntMover0.9_User_Guide.pdf
Custo: Gratuito

StyleWriter

O StyleWriter também auxilia autores na criação de textos que sigam as recomendações da Plain Language. Funciona integrado ao MS Word e avisa ao usuário sobre erros gramaticais comuns em inglês, destaca sentenças grandes que requeiram redução de tamanho, sugere a troca de sentenças na voz passiva por ativa, entre outros tratamentos. Outro recurso útil da ferramenta é um avaliador da complexidade do texto, que mostra ao usuário uma índice de complexidade do texto.

Site: http://www.editorsoftware.com/StyleWriter.html
Custo: Pago

WordNet e WordNet.Br

WordNet é uma grande base lexical de nomes, verbos, adjetivos e advérbios em inglês agrupados em conjuntos de sinônimos cognitivos (chamados de synsets), cada um expressando um conceito distinto. Usada na escrita, principalmente, como um tesaurus, pois permite utilizar sinônimos de palavras e assim aprender novas ou garantir a variação da língua. Pode ser navegada e é acessada com ajuda de um browser para o qual se fornece a palavra desejada. Além do sinônimo, há outras informações disponíveis como frequência e uso em contexto.

Fonte:
Miller, G.A., Beckwith, R., Fellbaum, C., Gross, D., Miller, K. (1993) Introduction to WordNet: An On-line Lexical Database. Disponível em <http://wordnetcode.princeton.edu/5papers.pdf>

Site: http://wordnetweb.princeton.edu/perl/webwn
Custo: Gratuito

Site: WordNet.Br 1.0 – Base de verbos http://www.nilc.icmc.usp.br/wordnetbr/
Custo: Gratuito

Comments are closed.