Você está aqui

Estrutura

O processo de revisão gramatical com CoGrOO está divido em uma série de fases que constituem os módulos da aplicação, onde a entrada inicial é o texto digitado pelo usuário e as saídas de cada módulo são os dados de entrada dos módulos seguintes. Ao final, o texto processado contém as anotações dos erros gramaticais encontrados e as sugestões para a sua correção.

Módulos CoGrOO compatíveis com UIMA

Sentdetect

  1. Entrada: Texto.
  2. Saída: Início e fim de cada sentença.
  3. Requerimentos: SentDetectModel, InducedAbbreviationsDictionary, CogrooSDContextGenerator

Versão em Inglês e Português

Tokenize

  1. Entrada: Uma sentença.
  2. Saída: Início e fim de cada token.
  3. Requerimentos: TokenizeModel, InducedAbbreviationsDictionary, LexicalDictionary, TokContextGenerator.

Versão em Inglês e Português

Namefind

  1. Entrada: Lista de tokens.
  2. Saída: Lista de tokens com nomes agrupados.
  3. Requerimentos: NamefindModel, LexicalDictionary, CogrooNameContextGenerator.

Contraction

(não é OpenNLP)

  1. Entrada: Lista de tokens.
  2. Saída: Lista de tokens com contrações expandidas.

Pretagger

  1. Entrada: Lista de tokens
  2. Saida: Lista de CogrooTokens com nomes proprios e contrações expandidas

Postag

  1. Entrada: Lista de CogrooTokens.
  2. Saída: lista de etiquetas morfológicas associadas aos tokens.
  3. Dados: PostagModel, LexicalDictionary, CogrooPOSContextGenerator.

Rulesapplier

(não é OpenNLP)

  1. Entrada: Lista de CogrooTokens
  2. Saída: Lista de erros.
  3. Dados: Arquivo de regras.