Engenharia Inteligente de Dados

2024/2 - Turma 0615

Ementa

Conceitos de Data Warehouse e Data Mart. Processo ETL (Extract, Transform, Load) e ferramentas OLAP. Descoberta de Conhecimentos em Base de Dados. Data Mining. Modelos KDD e CRISP-DM. Aplicações e Desenvolvimento de Estudos de Casos.

Competências

Ao final da disciplina, o aluno deverá estar apto a:
- compreender o papel de um Data Warehouse dentro das organizações;
- projetar um Data Warehouse;
- saber os conceitos e aplicações acerca do processo ETL e de ferramentas OLAP;
- compreender processos de conhecimento em base de dados;
- conhecer e escolher as técnicas e os métodos de Data Mining mais apropriados para o problema que desejar solucionar.

Objetivos

- compreender e saber aplicar os conceitos de Data Warehouse, processo ETL e ferramentas OLAP;
- saber em quais situações um processo de conhecimento em base de dados pode ser utilizado;
- compreender as etapas do processo de extração de conhecimento em base de dados e saber colocá-las em prática;
- compreender problemas e projetar soluções com Data Mining utilizando os conceitos do KDD e/ou CRISP-DM;

Programa

1. Introdução a Engenharia Inteligente de Dados;
2.Data Warehouse: definição, características, aplicações e projeto;
      2.1 Processo ETL e OLTP;
      2.2 Ferramentas OLAP;
3.Data Mart: definição, características e aplicações;
4. Processo de extração de conhecimento em bases de dados;
      4.1 Data Mining;
      4.2 KDD;
      4.3 CRISP-DM;
5. Interpretação dos resultados do processo de extração de conhecimento;
      5.1 Ferramentas de visualização de Dados;
6. Associações possíveis do Data Warehouse com o modelo CRISP-DM.

Metodologia

O Aporte Teórico-metodológico de Competências da disciplina envolverá aulas expositivas dialogadas, por meio de slides e vídeos, nas quais os alunos podem discutir os assuntos abordados e contribuir com experiências. São previstos trabalhos individuais e em grupo, com a elaboração de trabalhos escritos e apresentações orais. A disciplina também será trabalhada por meio da problematização, ou seja, serão apresentados ou solicitados problemas, bem como sua solução dos mesmos tendo como base o conteúdo abordado na disciplina.

O Trabalho Discente Efetivo se dará, em cada aula, por meio de questionários, testes, mapas conceituais, além do apropriamento dos conceitos e fundamentos oferecidos pelos conteúdos estudados. Nestas atividades os alunos deverão se aprofundar no assunto com o apoio do material indicado e seguindo as instruções passadas pelo(a) professor(a), compartilhar com a sua equipe ou com a classe o conhecimento obtido.

A organização metodológica explicita um conjunto de intencionalidades e estratégias pedagógicas diferenciadas onde a sala de aula passa a ser um espaço privilegiado de discussões, marcado pela interação entre os seus protagonistas, professor e alunos. Pressupõe acolher a investigação como princípio pedagógico norteador, a dúvida como mote fomentador para a construção de uma aprendizagem significativa e transformadora e a mutualidade como princípio fundante deste processo.

Avaliação

A avaliação da aprendizagem do aluno é expressa numericamente numa escala de zero (0) a dez (10) e será realizada ao longo do semestre letivo dividida em duas avaliações de grau (G1 e G2). A avaliação será continuada através de trabalhos, seminários, listas de exercícios e provas no decorrer do semestre.

Valores das avaliações:
Avaliação G1
• Atividades individuais e em grupo (4,0)
• Prova (6,0)
Avaliação G2
• Atividades individuais e em grupo, projeto da disciplina (4,0)
• Prova (6,0)

A Média Parcial (MP) é o resultado da média ponderada entre G1, com peso um, e G2, com peso dois. Calculada da seguinte forma: MP = (G1 + (G2 x 2))/3.

Serão aprovados os alunos que atingirem, no mínimo, 6,0 (seis) pontos na MP.

Os alunos que atingirem, no mínimo, 75% de frequência poderão realizar a prova de Exame Final (EF). Nesse caso, a Média Final (MF) será o resultado da média ponderada entre Média Parcial (MP), com peso um, e Exame Final (EF), com peso dois. Calculada da seguinte forma: MF = (MP + (EF x 2))/3.

Qualquer aluno que tenha atingido a frequência mínima tem direito a realizar a prova de EF para aumentar a sua média, independente de aprovação.

Critérios de avaliação:
• Compreensão dos conceitos e termos técnicos;
• Participação e execução das atividades propostas em sala de aula;
• Organização do pensamento e dos conceitos apresentados;
• Resolução de problemas e questões;
• Trabalhos:
**Conteúdo claro e abrangente;
**Criatividade;
**Apresentação.

Bibliografia

Básica

LAUDON, Kenneth C.; LAUDON, Jane P. Sistemas de informação gerenciais. Tradução de Célia Taniwaki; revisão técnica de Belmiro do Nascimento João. 11. ed. São Paulo: Pearson, 2015. E-book. [BV Pearson]. Disponível em: https://plataforma.bvirtual.com.br/Acervo/Publicacao/22448 . Acesso em: 25 out. 2019.

SINGH, Harry S. Data Warehouse: conceitos, tecnologias, implementação e gerenciamento. São Paulo: Makron, 2001.

TAN, Pang-Ning. Introdução ao DATAMINING: mineração de dados Rio de Janeiro: Ciência Moderna, 2009.

Complementar

GONÇALVES, Márcio. Extração de dados para data Warehouse. Rio de Janeiro: Axcel, 2003.

INMAN, William H. Como construir o Data Warehouse. Rio de Janeiro: Campus, 1997.

KIMBALL, Ralph. Data Warehouse Toolkit. São Paulo: Makron Books, 1998.

POLLONI, Enrico G. F. Administrando sistemas de informação: estudo de viabilidade 2. ed. São Paulo: Futura, 2001.

TAURION, CESAR. Big Data. Rio de Janeiro: Brasport, 2013. E-book. [BV Pearson]. Disponível em: https://plataforma.bvirtual.com.br/Acervo/Publicacao/160676. Acesso em: 4 mar. 2022.

Material Digital

O Processo ETL em Sistemas Data Warehouse: https://www.researchgate.net/publication/265195317_O_Processo_ETL_em_Sistemas_Data_Warehouse

Mineração de Dados e Big Data na Educação: https://www.revistageminis.ufscar.br/index.php/geminis/article/view/365

Informações da Turma
Curso
Engenharia de Software
Período: 5
Carga Horária: 76h
Horário: 4N
Sala: Labin V -