Busca avançada

(Referência obtida automaticamente do Web of Science, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores.)

Mining unstructured content for recommender systems: an ensemble approach

Texto completo
Autor(es): Manzato, Marcelo G. [1] ; Domingues, Marcos A. [2] ; Fortes, Arthur C. [1] ; Sundermann, Camila V. [1] ; D'Addio, Rafael M. [1] ; Conrado, Merley S. [1] ; Rezende, Solange O. [1] ; Pimentel, Maria G. C. [1]
Afiliação do(s) autor(es):
[1] Univ Sao Paulo, Inst Math & Comp Sci, Sao Carlos, SP - Brazil
[2] Univ Estadual Maringa, Dept Informat, Maringa, Parana - Brazil
Tipo de documento: Artigo Científico
Fonte: INFORMATION RETRIEVAL JOURNAL; v. 19, n. 4, p. 378-415, AUG 2016.
Citações Web of Science: 0

Recommendation of textual documents requires indexing mechanisms to extract structured metadata for attribute-aware recommender systems. Applying a variety of text mining algorithms has the advantage of capturing different aspects of unstructured content, resulting in richer descriptions. However, it is difficult to integrate them into a unique model so that these descriptions can efficiently improve recommendation accuracy. This article proposes a generic model based on ensemble learning that combines simple text mining methods in a post-processing approach. After executing each text mining technique, each set of metadata of a particular type is applied to the recommender module, which generates attribute-specific rankings. Then, the resulting recommendations are ensembled to generate a final personalized ranking to the user. We evaluated our ensemble technique with two attribute-aware collaborative recommenders (k-Nearest Neighbors and BPR-Mapping) and we demonstrate its generality by means of comparisons among different types of ensembles. We used two datasets from different domains, the first is from the Brazilian Embrapa Agency of Technology Information website, whose documents are written in Portuguese language, and the second is the HetRec MovieLens 2k, published by the GroupLens Research Group, whose movies' storylines are written in English. The experiments show that, particularly to the k-NN recommender, better accuracy can be obtained when multiple metadata types are combined. The proposed approach is extensible and flexible to new indexing and recommendation techniques. (AU)

Processo FAPESP: 13/16039-3 - Exploração de técnicas de mineração de textos para aquisição automática de informação contextual para sistemas de recomendações sensíveis ao contexto
Beneficiário:Camila Vaccari Sundermann
Linha de fomento: Bolsas no Brasil - Mestrado
Processo FAPESP: 14/08996-0 - Aprendizado de máquina para WebSensors: algoritmos e aplicações
Beneficiário:Solange Oliveira Rezende
Linha de fomento: Auxílio à Pesquisa - Regular
Processo FAPESP: 12/13830-9 - Aquisição automática de informação contextual para sistemas de recomendação sensíveis ao contexto
Beneficiário:Marcos Aurelio Domingues
Linha de fomento: Bolsas no Brasil - Pós-Doutorado
Processo FAPESP: 13/10756-5 - Filtragem baseada em conteúdo auxiliada por métodos de indexação colaborativa
Beneficiário:Rafael Martins Daddio
Linha de fomento: Bolsas no Brasil - Mestrado
Processo FAPESP: 13/22547-1 - Explorando anotações colaborativas em sistemas de recomendação híbridos
Beneficiário:Marcelo Garcia Manzato
Linha de fomento: Auxílio à Pesquisa - Regular