Busca avançada

Aprendizado não supervisionado multidescrição em agrupamento hierárquico e incremental de textos

Processo: 10/20564-8
Linha de fomento:Bolsas no Brasil - Doutorado
Vigência (Início): 01 de junho de 2011
Vigência (Término): 28 de fevereiro de 2013
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Sistemas de Computação
Pesquisador responsável:Solange Oliveira Rezende
Beneficiário:
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos, SP, Brasil
Assunto(s):Inteligência computacional   Mineração de texto   Aprendizado computacional   Algoritmos   Agrupamento incremental de documentos

Resumo

Métodos de agrupamento hieráquico e incremental de textos são úteis para organização não supervisionada de coleções textuais dinâmicas em grupos, sumarizando o conhecimento implícito nos textos. Nestes métodos, o agrupamento resultante é disposto de maneira hierárquica, em que grupos e subgrupos representam um tópico de conhecimento da coleção, provendo um meio intuitivo para explorar o conhecimento. Ainda, eles possiblitam a incorporação de novo conhecimento sem reprocessamento redundante, uma vez que apenas informações inseridas, removidas ou atualizadas são consideradas, ou seja, o agrupamento é realizado de maneira incremental. No entanto, as abordagens existentes para agrupamento hierárquico e incremental possuem limitações que afetam a qualidade dos resultados. Entre as limitações, um problema relevante ocorre durante a tarefa incremental: quando novos documentos apresentados ao agrupamento são alocados em grupos errados, este erro é propagado para as próximas iterações e faz com que o modelo final tenha seu desempenho degradado. Esse problema é típico em agrupamento incremental e explorar formas de solucioná-lo é útil e necessário para diversas aplicações relacionadas à organização de informação. Ainda, as coleções de textos podem ser representadas por diferentes meios, no qual conjuntos de informações diferentes se referem ao mesmo documento, e cada conjunto de informação é capaz de descrever de maneira independente o documento de interesse. Assim, uma direção importante de pesquisa, denominada aprendizado multidescrição, foca em usar as diferentes descrições dos textos para aumentar a confiança de uma tarefa de aprendizado, porém, é uma tema em aberto e não explorado em agrupamento incremental. Desta forma, o presente projeto de doutorado visa investigar o uso de aprendizado multidescricão em tarefas de agrupamento hierárquico e incremental, com foco em coleções de textos dinâmicas e, assim, explorar de maneira efetiva as várias descrições dos textos para aumentar a qualidade do agrupamento hierárquico incremental. A ideia se baseia no princípio de maximização do consenso entre múltiplas hipóteses, que considera que o aprendizado é melhorado utilizando o consenso de todas descrições do conjunto de dados. Com isto, espera-se oferecer uma nova abordagem para agrupamento hierárquico e incremental de textos capaz de manter a representação do conhecimento sempre válida e atualizada e permitindo a descoberta de conhecimento nos cenários atuais, caracterizados pela alta frequência de publicação e atualização das informações (AU)

Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
RICARDO MARCONDES MARCACINI. Aprendizado de máquina com informação privilegiada: abordagens para agrupamento hierárquico de textos. 2014. Tese de Doutorado - Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação São Carlos.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.