Busca avançada
Ano de início
Entree

SpeechTera Ltda: desenvolvimento de recursos computacionais para tecnologias de fala

Processo: 16/08355-0
Linha de fomento:Auxílio à Pesquisa - Pesquisa Inovativa em Pequenas Empresas - PIPE
Vigência: 01 de abril de 2017 - 31 de março de 2019
Área do conhecimento:Interdisciplinar
Pesquisador responsável:Vanessa Marquiafável Serrani
Beneficiário:Vanessa Marquiafável Serrani
Empresa:SpeechTera Desenvolvimento de Programas para Computadores Ltda
Município: Araras
Vinculado ao auxílio:14/21750-0 - Speech Tera Ltda: desenvolvimento de recursos computacionais para tecnologias de fala, AP.PIPE
Bolsa(s) vinculada(s):18/06601-0 - SpeechTera Ltda: desenvolvimento de recursos computacionais para tecnologias de fala, BP.TT
18/06738-5 - SpeechTera Ltda: desenvolvimento de recursos computacionais para tecnologias de fala, BP.TT
18/02617-9 - SpeechTera Ltda: desenvolvimento de recursos computacionais para tecnologias de fala, BP.TT
+ mais bolsas vinculadas 17/15730-5 - SpeechTera Ltda: desenvolvimento de recursos computacionais para tecnologias de fala, BP.TT
17/16989-2 - SpeechTera Ltda: desenvolvimento de recursos computacionais para tecnologias de fala, BP.TT
17/16725-5 - SpeechTera Ltda: desenvolvimento de recursos computacionais para tecnologias de fala, BP.TT
17/09581-7 - SpeechTera Ltda: desenvolvimento de recursos computacionais para tecnologias de fala, BP.TT
17/05688-1 - SpeechTera Ltda: desenvolvimento de recursos computacionais para tecnologias de fala, BP.TT
17/07371-5 - SpeechTera Ltda: desenvolvimento de recursos computacionais para tecnologias de fala, BP.PIPE - menos bolsas vinculadas
Assunto(s):Aprendizado computacional  Inteligência artificial  Processamento de linguagem natural  Reconhecimento de voz  Síntese de fala 

Resumo

Este projeto visa à criação de recursos computacionais para o desenvolvimento de Tecnologias de Fala, voltadas para o Português Brasileiro (Português Brasileiro). Com o desenvolvimento de algoritmos robustos para tratar bases de dados de fala, aplicações envolvendo reconhecimento ou síntese de fala, respectivamente, ASR (do inglês Automatic Speech Recognition) e TTS (do inglês Text-to-Speech), têm ganhado mais espaço em nosso cotidiano e se tornado cada vez mais precisas. No entanto, apesar de o Português Brasileiro ser a sexta língua mais falada no mundo, os recursos disponíveis para desenvolver tecnologias de fala para esse idioma ainda são escassos: há poucas bases de dados, conversores grafema-fonema e modelos acústicos ou de pronúncia. Este projeto busca, justamente, atuar nessa lacuna. Nosso propósito é desenvolver recursos computacionais de modo a incitar o desenvolvimento de tecnologias de fala para o Português Brasileiro, na indústria e na academia. Propõe-se a elaboração de quatro tipos de produtos: i) corpora de fala, ii) modelos acústicos, iii) modelos de pronúncia e iv) conversores grafema-fonema. Sobre os corpora de fala, propomos métodos de coleta e anotação de dados baseada em crawling e crowd-sourcing, que possibilitarão o desenvolvimento de recursos de fala a preços mais competitivos e acessíveis que os existentes atualmente no mercado. Técnicas do estado da arte serão empregadas na elaboração dos modelos acústicos, a exemplo de Deep Neural Networks; e dos conversores grafema-fonema, como modelos híbridos, baseados em regras manuais e aprendizado de máquina (SVM, CART, MARS). O modelo de negócio proposto centra-se em uma abordagem business-to-business (B2B), voltada para empresas de Tecnologia da Informação, Processamento de Fala e Processamento de Linguagem Natural, pensando, especialmente, no nicho de startups. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Startup desenvolve recursos computacionais para tecnologias de fala 
Matéria(s) publicada(s) no blog Pesquisa para Inovação FAPESP sobre o auxílio:
Startup desenvolve recursos computacionais para tecnologias de fala