Revista de Tecnologia da Informação e Engenharia de Software

Revista de Tecnologia da Informação e Engenharia de Software
Acesso livre

ISSN: 2165- 7866

Abstrato

Resumo de texto amárico para notícias publicadas nas redes sociais

Abaynew Guadie*, Debela Tesfaye, Teferi Kebebew

Este artigo apresenta o resumo de texto amárico para notícias publicadas nas redes sociais, para resumir as notícias publicadas em textos amáricos e documentos publicados nas redes sociais no Twitter e no Facebook; Os principais problemas dos textos publicados nas redes sociais são que a maioria das pessoas provavelmente leria que foram publicados em textos amáricos com documentos publicados duplicados. No entanto, para encontrar a informação que o utilizador procura, encontre textos resumidos publicados e leia partes importantes das publicações como documentos amáricos para extrair a informação desejada nas redes sociais. A sumarização está a lidar com a sobrecarga de informação, apresentando e publicando um documento de texto para a representação da hora atual dos documentos publicados para resumir. A nossa abordagem proposta tem três componentes principais: Em primeiro lugar, calcule a semelhança entre cada documento publicado dentro dos dois pares de frases. Segundo, o agrupamento com base nos resultados de similaridade dos documentos para os agrupar utilizando o algoritmo Kmeans. Terceiro, resumir o documento publicado agrupado individualmente utilizando algoritmos TF-IDF que envolvem encontrar formas estatísticas para os termos frequentes classificarem os documentos. Aplicámos a técnica de sumarização, uma abordagem de sumarização extrativa à qual é atribuído um extrato das frases com as frases mais bem classificadas nos documentos colocados para formar os resumos e o tamanho do resumo pode ser identificado pelo utilizador. Na experiência um, a pontuação mais elevada da medida F é de 87,07% para uma taxa de extração de 30%, no grupo agrupado de publicações de protesto. Na segunda experiência, a pontuação mais elevada da medida F é de 84% para uma taxa de extração de 30%, nos grupos pós-secas. Na terceira experiência, a pontuação mais elevada da medida F é de 91,37% para uma taxa de extração de 30%, nos grupos de pós-desporto e também na quarta experiência a pontuação mais elevada da medida F é de 93,52% para taxa de extração de 30% para gerar o resumo publicar textos. Se o sistema para gerar o tamanho do resumo for aumentado, a taxa de extração também aumenta nos textos colocados. Para isso, o sistema de avaliação tem apresentado resultados muito bons para resumir os textos colocados nas redes sociais.

Isenção de responsabilidade: Este resumo foi traduzido com recurso a ferramentas de inteligência artificial e ainda não foi revisto ou verificado.
Top