Engenharia Inteligente de Dados
2024/2 - Turma 0615
Ementa
Conceitos de Data Warehouse e Data Mart. Processo ETL (Extract, Transform, Load) e ferramentas OLAP. Descoberta de Conhecimentos em Base de Dados. Data Mining. Modelos KDD e CRISP-DM. Aplicações e Desenvolvimento de Estudos de Casos.
Competências
Ao final da disciplina, o aluno deverá estar apto a:
- compreender o papel de um Data Warehouse dentro das organizações;
- projetar um Data Warehouse;
- saber os conceitos e aplicações acerca do processo ETL e de ferramentas OLAP;
- compreender processos de conhecimento em base de dados;
- conhecer e escolher as técnicas e os métodos de Data Mining mais apropriados para o problema que desejar solucionar.
Objetivos
- compreender e saber aplicar os conceitos de Data Warehouse, processo ETL e ferramentas OLAP;
- saber em quais situações um processo de conhecimento em base de dados pode ser utilizado;
- compreender as etapas do processo de extração de conhecimento em base de dados e saber colocá-las em prática;
- compreender problemas e projetar soluções com Data Mining utilizando os conceitos do KDD e/ou CRISP-DM;
Programa
1. Introdução a Engenharia Inteligente de Dados;
2.Data Warehouse: definição, características, aplicações e projeto;
2.1 Processo ETL e OLTP;
2.2 Ferramentas OLAP;
3.Data Mart: definição, características e aplicações;
4. Processo de extração de conhecimento em bases de dados;
4.1 Data Mining;
4.2 KDD;
4.3 CRISP-DM;
5. Interpretação dos resultados do processo de extração de conhecimento;
5.1 Ferramentas de visualização de Dados;
6. Associações possíveis do Data Warehouse com o modelo CRISP-DM.
Metodologia
O Aporte Teórico-metodológico de Competências da disciplina envolverá aulas expositivas dialogadas, por meio de slides e vídeos, nas quais os alunos podem discutir os assuntos abordados e contribuir com experiências. São previstos trabalhos individuais e em grupo, com a elaboração de trabalhos escritos e apresentações orais. A disciplina também será trabalhada por meio da problematização, ou seja, serão apresentados ou solicitados problemas, bem como sua solução dos mesmos tendo como base o conteúdo abordado na disciplina.
O Trabalho Discente Efetivo se dará, em cada aula, por meio de questionários, testes, mapas conceituais, além do apropriamento dos conceitos e fundamentos oferecidos pelos conteúdos estudados. Nestas atividades os alunos deverão se aprofundar no assunto com o apoio do material indicado e seguindo as instruções passadas pelo(a) professor(a), compartilhar com a sua equipe ou com a classe o conhecimento obtido.
A organização metodológica explicita um conjunto de intencionalidades e estratégias pedagógicas diferenciadas onde a sala de aula passa a ser um espaço privilegiado de discussões, marcado pela interação entre os seus protagonistas, professor e alunos. Pressupõe acolher a investigação como princípio pedagógico norteador, a dúvida como mote fomentador para a construção de uma aprendizagem significativa e transformadora e a mutualidade como princípio fundante deste processo.
Avaliação
A avaliação da aprendizagem do aluno é expressa numericamente numa escala de zero (0) a dez (10) e será realizada ao longo do semestre letivo dividida em duas avaliações de grau (G1 e G2). A avaliação será continuada através de trabalhos, seminários, listas de exercícios e provas no decorrer do semestre.
Valores das avaliações:
Avaliação G1
• Atividades individuais e em grupo (4,0)
• Prova (6,0)
Avaliação G2
• Atividades individuais e em grupo, projeto da disciplina (4,0)
• Prova (6,0)
A Média Parcial (MP) é o resultado da média ponderada entre G1, com peso um, e G2, com peso dois. Calculada da seguinte forma: MP = (G1 + (G2 x 2))/3.
Serão aprovados os alunos que atingirem, no mínimo, 6,0 (seis) pontos na MP.
Os alunos que atingirem, no mínimo, 75% de frequência poderão realizar a prova de Exame Final (EF). Nesse caso, a Média Final (MF) será o resultado da média ponderada entre Média Parcial (MP), com peso um, e Exame Final (EF), com peso dois. Calculada da seguinte forma: MF = (MP + (EF x 2))/3.
Qualquer aluno que tenha atingido a frequência mínima tem direito a realizar a prova de EF para aumentar a sua média, independente de aprovação.
Critérios de avaliação:
• Compreensão dos conceitos e termos técnicos;
• Participação e execução das atividades propostas em sala de aula;
• Organização do pensamento e dos conceitos apresentados;
• Resolução de problemas e questões;
• Trabalhos:
**Conteúdo claro e abrangente;
**Criatividade;
**Apresentação.
Bibliografia
Básica
LAUDON, Kenneth C.; LAUDON, Jane P. Sistemas de informação gerenciais. Tradução de Célia Taniwaki; revisão técnica de Belmiro do Nascimento João. 11. ed. São Paulo: Pearson, 2015. E-book. [BV Pearson]. Disponível em: https://plataforma.bvirtual.com.br/Acervo/Publicacao/22448 . Acesso em: 25 out. 2019.
SINGH, Harry S. Data Warehouse: conceitos, tecnologias, implementação e gerenciamento. São Paulo: Makron, 2001.
TAN, Pang-Ning. Introdução ao DATAMINING: mineração de dados Rio de Janeiro: Ciência Moderna, 2009.
Complementar
GONÇALVES, Márcio. Extração de dados para data Warehouse. Rio de Janeiro: Axcel, 2003.
INMAN, William H. Como construir o Data Warehouse. Rio de Janeiro: Campus, 1997.
KIMBALL, Ralph. Data Warehouse Toolkit. São Paulo: Makron Books, 1998.
POLLONI, Enrico G. F. Administrando sistemas de informação: estudo de viabilidade 2. ed. São Paulo: Futura, 2001.
TAURION, CESAR. Big Data. Rio de Janeiro: Brasport, 2013. E-book. [BV Pearson]. Disponível em: https://plataforma.bvirtual.com.br/Acervo/Publicacao/160676. Acesso em: 4 mar. 2022.
Material Digital
O Processo ETL em Sistemas Data Warehouse: https://www.researchgate.net/publication/265195317_O_Processo_ETL_em_Sistemas_Data_Warehouse
Mineração de Dados e Big Data na Educação: https://www.revistageminis.ufscar.br/index.php/geminis/article/view/365