ISSN: 2165- 7866
Mgbeafulike IJ e Christopher Ejiofor
Apesar da crescente disponibilidade de documentos em formato eletrónico e da disponibilidade de software de editoração eletrónica, os resumos continuam a ser produzidos manualmente. O objetivo do CONDENZA é desenvolver um sistema para extração abstrata de um determinado documento fonte. CONDENZA descreve um sistema de métodos automáticos de obtenção de resumos. A justificação dos resumos é facilitar a identificação rápida e precisa do tema dos artigos publicados. A ideia é poupar tempo e esforço ao potencial leitor para encontrar informações úteis num determinado artigo ou relatório. O sistema gera uma versão mais curta de uma determinada frase enquanto tenta preservar o seu significado. Esta tarefa é realizada utilizando técnicas de resumo. CONDENZA implementa um método que combina algoritmo a priori para deteção de frequência de palavras-chave com abordagem baseada em clusters para agrupar frases semelhantes. O resultado do sistema mostra que a nossa abordagem ajuda a resumir os documentos de texto de forma eficiente, evitando a redundância entre as palavras do documento e garantindo a maior relevância para o texto de entrada. Os fatores orientadores dos nossos resultados são a proporção entre frases de entrada e saída após a sumarização.