Busca avançada

Desenvolvimento de técnicas para buscas por similaridade em sistemas de gerenciamento de bases de dados complexos relacionais

Processo: 14/26678-6
Linha de fomento:Auxílio à Pesquisa - Regular
Vigência: 01 de maio de 2015 - 30 de abril de 2017
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Sistemas de Computação
Pesquisador responsável:Caetano Traina Junior
Beneficiário:
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos, SP, Brasil
Pesq. associados:Agma Juci Machado Traina ; Elaine Parros Machado de Sousa ; José Fernando Rodrigues Júnior ; Luciana Alvim Santos Romani ; Paulo Mazzoncini de Azevedo Marques ; Robson Leonardo Ferreira Cordeiro
Assunto(s):Banco de dados relacionais  Álgebra relacional  Operadores de pesquisa  Agrupamento de dados  Consultas por similaridade 

Resumo

Os Sistemas de Gerenciamento de Bases de Dados (SGBD) baseados na Teoria Relacional foram desenvolvidos para atender às necessidades de armazenagem e recuperação de grandes volumes de dados representados por valores numéricos, datas e pequenas cadeias de caracteres, chamados genericamente ``dados escalares''. Com a evolução da tecnologia da informação, vem se tornando necessário organizar, armazenar e recuperar outros tipos de dados, a que nos referimos como ``dados complexos'', tais como imagens, vídeo, séries temporais, sequências genômicas, etc. As consultas por identidade ou por relação de ordem (RO), úteis para dados escalares, não são adequadas para dados complexos. Para eles, as consultas por similaridade têm sido a opção mais estudada, mas a sua disponibilidade em SGBD é ainda bastante restrita. Este projeto visa abordar a incorporação de recursos para recuperação de dados complexos por similaridade em SGBD Relacionais, desenvolvendo técnicas que cubram de maneira abrangente as principais necessidades dos módulos que constituem um SGBD, incluindo: a) integração da representação de consultas por similaridade em uma extensão da linguagem SQL; b) definição unificada dos operadores algébricos por similaridade segundo a teoria relacional, como operadores interoperáveis com os tradicionais; c) desenvolvimento de técnicas para otimização lógica e física dos planos de execução de consultas, e d:) desenvolvimento de técnicas para indexação e recuperação eficiente combinando operações de busca por similaridade, por identidade e por RO. O conhecimento e a tecnologia gerados poderão ser aplicados a muitas áreas de atividade humana, mas no projeto serão validadas em aplicações de apoio ao diagnóstico em medicina e em estudos de modelos climáticos, dando continuidade às atividades que já vem sendo realizadas pelo GBdI. Assim, além do grande potencial de inovação em tecnologia da informação inerente ao projeto, sua aplicação nessas áreas trará benefícios imediatos a toda a população. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Nanotecnologia e big data poderão compor sistema de apoio ao diagnóstico médico