Reconhecimento de voz
O objetivo geral da linha de pesquisa é usar o reconhecimento de voz na interação homem/maquina. Usar a voz em combinação com os métodos convencionais de entrada e saída de dados pode reduzir a atenção do usuário no uso de sistema, e permitir uma interação mais natural. A voz também pode ser usada para melhorar a coleta de dados em ambientes onde não é fácil usar métodos convencionais.
A nossa primeira tarefa é o desenvolvimento de esquemas inteligentes de navegação em dispositivos móveis usando comandos de voz e interfaces multimodais. Um esquema de navegação inteligente permitirá aos profissionais da saúde ter mais tempo durante um encontro domiciliar e assim, focar-se nas necessidades do paciente. O dispositivo móvel incluirá um sistema embarcado de reconhecimento de voz com um vocabulário reduzido para a navegação.
A nossa segunda tarefa é o suporte na miração de dados. Historicamente, os registros são feitos a mão em papel. A coleta eletrônica de registros e histórias detalhadas usando o sistema móvel Borboleta, permite a conversão de voz para texto e assim, melhorar a entrada de dados para mineração. Implementaremos um sistema de reconhecimento de voz com um vocabulário extenso, com suporte para terminologia médica.
Os desafios incluem:
- Os dispositivos móveis tem capacidade de processamento limitada, por tanto, sistemas com vocabulários reduzidos são melhores. Para a coleta de histórias, o dispositivo só requer capacidade de gravação e armazenamento do arquivo, depois, este será processado em um computador de maior capacidade com um vocabulário mais robusto.
- Os ruídos do ambiente podem afetar a coleta de dados, isto pode ser tratado com telas de retroalimentação, microfones e tecnologias de processamento de sinais.
- A coleta de dados formais para Português Brasileiro tem sido relativamente pouca, esta é necessária para o treinamento dos modelos estatísticos acústicos e de linguagem. Nossos esforços podem incluir uma nova coleta de dados e melhoramentos dos atuais, para fazer uso deles.
Arquivos
- Corpus de comandos para o Borboleta (tar.gz)
- SpeechMe: código hospedado em https://projects.forum.nokia.com/speechme, e distribuído sob licença BSD. Para baixar o código pode-se usar o comando:
hg clone https://anonymous@projects.forum.nokia.com/hg/speechme
- Sentece recorder: Aplicação para coleta de arquivos de voz. (SentenceRecorder.jad - SentenceRecorder.jar)