O processo de revisão gramatical com CoGrOO está divido em uma série de fases que constituem os módulos da aplicação, onde a entrada inicial é o texto digitado pelo usuário e as saídas de cada módulo são os dados de entrada dos módulos seguintes. Ao final, o texto processado contém as anotações dos erros gramaticais encontrados e as sugestões para a sua correção.
Módulos CoGrOO compatíveis com UIMA
Sentdetect
- Entrada: Texto.
- Saída: Início e fim de cada sentença.
- Requerimentos: SentDetectModel, InducedAbbreviationsDictionary, CogrooSDContextGenerator
Versão em Inglês e Português
Tokenize
- Entrada: Uma sentença.
- Saída: Início e fim de cada token.
- Requerimentos: TokenizeModel, InducedAbbreviationsDictionary, LexicalDictionary, TokContextGenerator.
Versão em Inglês e Português
Namefind
- Entrada: Lista de tokens.
- Saída: Lista de tokens com nomes agrupados.
- Requerimentos: NamefindModel, LexicalDictionary, CogrooNameContextGenerator.
Contraction
(não é OpenNLP)
- Entrada: Lista de tokens.
- Saída: Lista de tokens com contrações expandidas.
Pretagger
- Entrada: Lista de tokens
- Saida: Lista de CogrooTokens com nomes proprios e contrações expandidas
Postag
- Entrada: Lista de CogrooTokens.
- Saída: lista de etiquetas morfológicas associadas aos tokens.
- Dados: PostagModel, LexicalDictionary, CogrooPOSContextGenerator.
Rulesapplier
(não é OpenNLP)
- Entrada: Lista de CogrooTokens
- Saída: Lista de erros.
- Dados: Arquivo de regras.