Resumo: "Geralmente, escolhemos apenas uma modalidade de informação nas tarefas de Aprendizado de Máquina. Com o crescimento exponencial de conjuntos de dados multimídia, surge a necessidade de combinar múltiplas representações de dados para criar espaços vetoriais "conceituais" a fim de utilizar todas as fontes de informação disponíveis. Em nosso trabalho, investigamos os efeitos de diferentes combinações de representações textuais para realizar tarefas de classificação em um conjunto de dados multilíngües composto por notícias internacionais em português e inglês, analisando as diferenças entre as combinações e demonstrando como essas representações funcionam em um pequeno conjunto de dados multimodal."


