ISSN: 2165- 7866
Óscar Marbán e Javier Segovia
Os modelos de processos de Data Mining existentes propõem uma forma ou outra de desenvolver projetos de forma estruturada, tentando reduzir a sua complexidade através de uma gestão eficaz de projetos. É bem conhecido em qualquer ambiente de engenharia que uma das tarefas de gestão que ajuda a reduzir os problemas do projeto é a documentação sistemática do projeto, mas poucos dos processos de Data Mining existentes propõem a sua documentação. Além disso, estes poucos comentam a necessidade de produzir documentação em cada fase como input para a seguinte, mas não mostram como o fazer. Por outro lado, na literatura existem exemplos de extensões UML para projetos de data mining, mas focam-se sempre no lado da implementação do modelo e não têm em conta o resto do processo. Neste artigo, apresentamos uma extensão da linguagem de modelação UML para projetos de data mining (DM-UML) cobrindo todas as necessidades de documentação de um projeto em conformidade com um processo padrão, nomeadamente o CRISP-DM, desde a compreensão do negócio até à implantação. Mostramos também um exemplo de aplicação real da modelação DM-UML proposta. O resultado desta abordagem é que, para além das vantagens de ter uma forma padronizada de produzir a documentação, constitui claramente uma ferramenta muito útil e transparente para modelar e conectar a fase de compreensão do negócio ou modelação com o restante projeto até à implementação. , bem como uma forma de facilitar a comunicação com as partes interessadas não técnicas envolvidas no projeto, problemas que sempre foram uma questão em aberto na mineração de dados.