Como o CoGrOO Funciona?

PLN

O CoGrOO é, internamente, um analisador e anotador de textos. Ele é uma ferramenta que se enquadra no ramo da computação conhecido como Processamento de Linguagens Naturais (PLN, ou no inglês, NLP - Natural Language Processing).

É muito fácil encontrar artigos sobre PLN na internet, portanto, para entender mais sobre o assunto, pesquise. O que podemos dizer é que o CoGrOO faz utiliza processamento estatístico de texto. Ele usa basicamente o algoritmo Máxima Entropia (Maxent) da biblioteca OpenNLP .

Análise Visual

Você pode entender como o CoGrOO funciona através do CoGrOO Comunidade: http://ccsl.ime.usp.br/cogroo/comunidade/grammar

Ao analisar um texto, você pode verificar desde a separação de sentenças até análise sintática:

Separação de Sentenças

O módulo de separação de sentenças é responsável por decidir se um símbolo separador realmente separa sentença no contexto. Por exemplo numa abreviatura.

Separação de Tokens

Nomes próprios

Etiquetador morfológico

Chunker e Shallow Parser

Erros

http://localhost:8080/ruleList

!!

sent.png (22,2 KB) William Colen, 01/04/2011 12:51 hs

chunk.png (18,9 KB) William Colen, 01/04/2011 12:51 hs

nome.png (37,3 KB) William Colen, 01/04/2011 12:51 hs

tag.png (38,1 KB) William Colen, 01/04/2011 12:51 hs

tok.png (36,6 KB) William Colen, 01/04/2011 12:51 hs

rule.png (39,9 KB) William Colen, 01/04/2011 12:58 hs