Busca avançada

Incorporação da semântica na construção de websensors

Processo: 13/14757-6
Linha de fomento:Bolsas no Brasil - Doutorado
Vigência (Início): 01 de dezembro de 2013
Vigência (Término): 31 de maio de 2018
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Solange Oliveira Rezende
Beneficiário:
Instituição-sede : Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos, SP, Brasil
Bolsa(s) vinculada(s):16/07620-2 - Representação semântica para classificação de textos, BE.EP.DR
Assunto(s):Inteligência artificial   Semântica   Agrupamento de dados   Banco de dados textuais   Web semântica   Mineração de texto

Resumo

Com o aumento da quantidade e variedade de textos em formato digital, seja em redes sociais, web ou internamente nas organizações, as técnicas de Mineração de Textos tornam-se essenciais no apoio à extração de conhecimento. Pesquisas e aplicações têm sido desenvolvidas visando utilizar a web como um poderoso sensor social. Nesse contexto, surgem os websensors, sensores que monitoram a publicação de textos e mantêm uma série temporal da atividade de determinados tópicos. A aplicabilidade dos websensors é ampla. De acordo com os textos monitorados, a atividade de um websensor pode ajudar a entender, explicar ou predizer determinado fato. Os websensors podem ser construídos a partir do agrupamento de textos, evitando assim a necessidade de um grande volume de dados rotulados ou do intenso esforço de um especialista do domínio para definir os parâmetros dos sensores. No entanto, os aspectos semânticos dos textos podem ser decisivos na qualidade e no uso efetivo do agrupamento obtido. Para o aprendizado de bons websensors pode ser necessária, por exemplo, uma organização dos textos que diferencie documentos que, apesar de utilizarem o mesmo vocabulário, apresentem ideias diferentes sobre um mesmo assunto. Pesquisas em Mineração de Textos têm apresentado diversos avanços nos últimos anos, porém a incorporação da semântica ainda é um desafio a ser superado. Motivado por essa lacuna, este projeto de doutorado visa explorar a incorporação de semântica na construção de websensors, buscando uma organização mais refinada, que considere ideias expressas nos documentos. Visando representar diferentes aspectos semânticos, será desenvolvido um novo formato de representação de dados textuais. Além disso, algoritmos de agrupamento serão desenvolvidos ou adaptados para utilizar essa nova representação de maneira efetiva. Vale ressaltar que, apesar do foco deste trabalho ser a incorporação da semântica no agrupamento de textos para construção de websensors, os resultados obtidos poderão posteriormente ser expandidos para outras tarefas da Mineração de Textos, como a classificação automática de documentos e a análise de sentimentos. (AU)