|
DESCRIÇÃO
A área da Descoberta de Conhecimento em Bases de Dados e do Data Mining encontra-se em progressiva expansão. A todo o momento, surgem resultados e artigos de investigações em novos e diversos domínios (e.g., MobiMine, Clinical Data Mining, BiblioMining, TextMining, WebMining), novos modelos e técnicas, ferramentas e tecnologias, tornando a escolha e o desenvolvimento de projectos num problema difícil de contornar. Este livro pretende contribuir para a familiarização com a área de Data Mining através de um documento único que agregue os conceitos mais relevantes para esta temática.
A presente obra destina-se a estudantes das disciplinas das diferentes licenciaturas e cursos de pós-graduação, onde se pretenda criar competências na área da Descoberta de Conhecimento em Bases de Dados e Data Mining. Os profissionais que pretendam introduzir-se e desenvolver projectos na área da Descoberta de Conhecimento em Bases de Dados e Data Mining encontrarão igualmente neste livro uma fonte de estudo e um meio de orientação.
PRINCIPAIS TÓPICOS
Ao longo dos seus capítulos são abrangidos os seguintes aspectos:
- Data Mining e Descoberta de Conhecimento em Base de Dados: definição e conceitos relacionados com o Data Mining;
- Metodologias e Especificações: descrição das principais metodologias e especificações existentes;
- Modelos e Técnicas: os principais modelos e técnicas;
- Ferramentas e Tecnologias: levantamento e caracterização das ferramentas e tecnologias mais utilizadas;
- Domínios de aplicação: utilização do Data Mining na resolução de problemas específicos;
- Instrumento de Suporte ao Desenvolvimento de Projectos de Data Mining: aspectos técnicos e práticos inerentes à aplicação e implementação do processo de Data Mining, incluindo um exemplo de aplicação;
- Mitos e Armadilhas: são desmontados alguns mitos e armadilhas associados aos projectos desta área;
- Referencial de Data Mining: enumera os principais grupos de investigação, conferências, seminários, revistas, jornais científicos e projectos relacionados.
PÚBLICO ALVO
Obra destinada a estudantes de licenciaturas e cursos de pós-graduação em Informática e Sistemas de Informação, relacionados com a área da Descoberta de Conhecimento em Bases de Dados e Data Mining, e a profissionais que pretendam introduzir-se e desenvolver projectos nesta mesma área.
O(S) AUTOR(ES)
Manuel Filipe Santos
Professor Auxiliar no Departamento de Sistemas de Informação, da Escola de Engenharia da Universidade do Minho, doutorado em Informática ramo Inteligência Artificial.
Carla Sousa Azevedo
Técnica Superior de Informática, no Gabinete de Informática e Sistemas de Informação do Instituto Superior da Maia, mestre em Sistemas de Informação.
ÍNDICE
1. INTRODUÇÃO
1.1 Objectivos do livro
1.2 Organização do livro
1.3 Destinatários
2. DATA MINING E DESCOBERTA DE CONHECIMENTO EM BASES DE DADOS
2.1 Data Mining
2.2 Definição de Data Mining
2.3 Áreas relacionadas com o Data Mining
2.4 Abordagens do Data Mining
2.5 Objectivos do Data Mining
2.5.1 Classificação
2.5.2 Previsão
2.5.3 Regressão Linear
2.5.4 Segmentação (Clustering)
2.5.5 Associação ou Dependência
2.5.6 Sumarização
2.5.7 Visualização
2.5.8 Detecção de Desvios
2.6 Descoberta de conhecimento em base de dados
2.6.1 Selecção
2.6.2 Pré- Processamento
2.6.3 Transformação
2.6.4 Data Mining
2.6.5 Interpretação e Avaliação
2.7 Problemas inerentes ao processo de DCBD
3. METODOLOGIAS E ESPECIFICAÇÕES
3.1 Metodologia CRISP-DM
3.1.1 Estudo do negócio
3.1.2 Estudo dos dados
3.1.3 Preparação dos dados
3.1.4 Modelação
3.1.5 Avaliação
3.1.6 Implementação
3.2 Metodologia SEMMA
3.2.1 Amostragem (Sample)
3.2.2 Exploração (Explore)
3.2.3 Modificação (Modify)
3.2.4 Modelação (Model)
3.2.5 Avaliação (Assessment)
3.3 Especificação PMML
3.4 Conclusão
4. MODELOS E TÉCNICAS
4.1 Árvores de decisão
4.2 Redes neuronais artificiais
4.2.1 Arquitecturas das RNA
4.2.2 Métodos de aprendizagem
4.3 Algoritmos genéticos
4.3.1 Estrutura de algoritmos genéticos
4.3.2 Operadores genéticos
4.4 Indução de regras
4.5 Conjuntos difusos
4.6 Conjuntos aproximados
4.7 Redes de Bayes
4.8 Sistemas de classificação
4.9 Avaliação de algoritmos
4.9.1 Métodos de amostragem
4.10 Avaliação de modelos
4.10.1 Matriz de confusão
4.10.2 Custo de erro
4.10.3 Curva ROC
4.10.4 Regressão
5. FERRAMENTAS E TECNOLOGIAS
5.1 Data Mining embebido em sistemas de gestão de bases de dados
6. DOMÍNIOS DE APLICAÇÃO
6.1 CRM
6.1.1 Database marketing
6.1.2 Churn
6.2 Suporte à decisão
6.3 Clinical Data Mining
6.4 Finanças
6.5 Investigação científica
6.6 Text Mining
6.7 Web Mining
6.8 BiblioMining
6.9 MobiMine
6.10 Data Mining multimédia
7. SUPORTE AO DESENVOLVIMENTO DE PROJECTOS DE DATA MINING
7.1 Meta-etapas
7.2 Instrumento de suporte ao desenvolvimento de projectos de data mining
7.2.1 Selecção da metodologia
7.2.2 Domínio de aplicação
7.2.3 Preparação dos dados
7.2.4 Selecção da ferramenta orientada ao domínio
7.2.5 Definição de objectivos de Data Mining
7.2.6 Selecção de modelos e técnicas
7.2.7 Implementação
7.3 Exemplo de aplicação
8. CONCLUSÕES
8.1 Mitos e armadilhas sobre Data Mining
8.1.1 Mito 1 - Data Mining resume-se aos algoritmos
8.1.2 Mito 2 - Data Mining resume-se à acuidade dos modelos
8.1.3 Mito 3 - Data Mining requer um Data Warehouse
8.1.4 Mito 4 - Data Mining resume-se a grandes quantidades de dados
8.1.5 Mito 5 - Data Mining deve ser realizado por um perito em tecnologia
8.1.6 Mito 6 - As redes neuronais são modelos opacos e, consequentemente, inúteis
8.1.7 Armadilha 1 - Assoberbado em montanhas de dados
8.1.8 Armadilha 2 - O terabyte misteriosamente desaparecido
8.1.9 Armadilha 3 - Insuficiente conhecimento de domínio
8.1.10 Armadilha 4 - Insuficiente conhecimento sobre os dados
8.1.11 Armadilha 5 - Pressupostos errados, a cortesia dos especialistas
8.1.12 Armadilha 6 - Incompatibilidades entre ferramentas de Data Mining
8.1.13 Armadilha 7 - Prisioneiro dos dados
8.1.14 Armadilha 8 - Data Mining desorganizado
9. EXERCÍCIOS
Exercício 1
Exercício 2
Exercício 3
Exercício 4
Exercício 5
Exercício 6
Exercício 7
Exercício 8
Exercício 9
Exercício 10
Exercício 11
Exercício 12
Exercício 13
Exercício 14
Exercício 15
Exercício 16
Exercício 17
Exercício 18
Exercício 19
Exercício 20
APÊNDICE - ENDEREÇO DA INTERNET DAS FERRAMENTAS
GLOSSÁRIO
REFERENCIAL DE DATA MINING
BIBLIOGRAFIA
ÍNDICE REMISSIVO
|