Fundamentos de Ciência de Dados
2024/2 - Turma 0611
Ementa
Introdução à Ciência de Dados, estatística descritiva (medidas de tendência central, medidas de dispersão, gráficos e tabelas), amostragem e inferência estatística (amostragem aleatória simples, intervalos de confiança e testes de hipóteses), análise exploratória de dados (visualização de dados, técnicas de clustering e segmentação e análise de componentes principais), modelagem de dados (modelos de regressão linear e não linear e modelos de séries temporais) e ética em Ciência de Dados.
Competências
Capacidade de coletar, organizar e interpretar dados de forma eficaz, utilizando técnicas estatísticas para extrair insights significativos e tomar decisões informadas a partir de conjuntos de dados reais.
Habilidade para criar representações gráficas claras e informativas de dados, utilizando diferentes tipos de gráficos e visualizações para comunicar de maneira eficaz as tendências, padrões e relações encontradas na análise estatística.
Aptidão para aplicar métodos de inferência estatística, incluindo testes de hipóteses e intervalos de confiança, para extrapolar informações a partir de amostras para populações, fundamentando decisões com base em análises estatísticas sólidas.
Capacidade de compreender, construir e aplicar modelos estatísticos para previsão de comportamentos futuros, utilizando técnicas de regressão simples e entendendo as limitações e aplicações práticas desses modelos na tomada de decisões.
Objetivos
Desenvolver a compreensão sobre os conceitos essenciais da ciência de dados e estatística, permitindo perceber a relevância da estatística na análise de dados e a classificação de diferentes tipos de dados por níveis de medição.
Dominar a estatística descritiva no contexto da coleta, organização e resumo dos dados de forma eficaz, com o cálculo de medidas centrais e de dispersão e a criação de visualizações gráficas para representação clara de dados.
Compreender a estatística inferencial, entendendo populações, amostras e distribuições amostrais e familiarizando-se com testes de hipóteses e intervalos de confiança para tomar decisões informadas com base em dados.
Aplicar estatística na análise de dados do mundo real, aplicando estatística descritiva e inferencial para explorar conjuntos de dados, identificar tendências, padrões e relações.
Explorar estatística preditiva, compreendendo modelos estatísticos para prever comportamentos futuros a partir de padrões observados.
Programa
1 Introdução à Ciência de Dados e Estatística
Introdução à Estatística e suas Aplicações na Ciência de Dados
Tipos de Dados e Níveis de Medição
2 Estatística Descritiva
Coleta e Organização de Dados
Medidas de Tendência Central
Medidas de Dispersão ou Variabilidades
Correlação e Regressão Simples
Gráficos e Visualizações de Dados
3 Estatística Inferencial
Populações, Amostras e Distribuições Amostrais
Testes de Hipóteses
Intervalos de Confiança
Análises de Dados
4 Estatística Preditiva
Metodologia
O Aporte Teórico metodológico de Competências será oferecido por meio de aulas expositivas, discussões em grupos e em classe, apresentação e debate de materiais de apoio ao conteúdo (artigos, capítulos de livros).
O Trabalho Discente Efetivo se dará, em cada aula, por meio de questionários, testes, mapas conceituais. Nestas atividades os alunos deverão se aprofundar no assunto com o apoio do material indicado e seguindo as instruções passadas pelo professor, compartilhar com a sua equipe ou com a classe o conhecimento obtido construindo, em conjunto, propostas de resolução dos problemas ou questões apresentados, mapas conceituais, slides, vídeos, protótipos, dentre outras possibilidades de produção discente.
Durante o semestre, os alunos terão acesso a WebAulas na plataforma Conecta: 03 aulas online serão disponibilizadas em um sistema web, compostas por recursos didáticos - como textos, apresentações e vídeos - e atividades individuais ou em grupo, seguindo as determinações da Portaria MEC nº 2.117, de 06 de dezembro de 2019.
Avaliação
O processo avaliativo considerará as etapas de trabalho discutidas na metodologia. Assim, tem-se:
• A avaliação parcial 1 (AP1 – valor 1,5)
• A avaliação parcial 2 (AP2 – valor 2,5)
• A avaliação semestral (AS – valor 6,0)
A Pontuação do Semestre (PS) será a soma destas avaliações. Caso o aluno não obtenha conceito mínimo 6,0 na PS e tenha no mínimo 75% de frequência ele poderá realizar a Avaliação Final (AF) com valor 10,0. A Pontuação Final (PF) será a maior entre as pontuações obtidas na PS e na AS.
Bibliografia
Básica
GRUS, Joel. Data Science do Zero. Rio de Janeiro: Editora Alta Books, 2021. Disponível em: https://integrada.minhabiblioteca.com.br/#/books/9788550816463/.
BEHRMAN, Kennedy R. Fundamentos de Python para ciência de dados. Porto Alegre: Bookman, 2023. Disponível em: https://integrada.minhabiblioteca.com.br/#/books/9788582605974/
NETTO, Amilcar; MACIEL, Francisco. Python para Data Science e Machine Learning Descomplicado. Rio de Janeiro: Editora Alta Books, 2021. Disponível em: https://integrada.minhabiblioteca.com.br/#/books/9786555203172/.
Complementar
BASSO, Douglas Eduardo. Big Data. Curitiba: Contentus, 2020. Disponível em: https://plataforma.bvirtual.com.br/Leitor/Publicacao/186460/pdf/0
GUILHON, André et al (Orgs.). Jornada Python. Rio de Janaiero: Brasport, 2022. Disponível em: https://plataforma.bvirtual.com.br/Leitor/Publicacao/198716/epub/0
FILATRO, Andrea C. Data science da educação. São Paulo: Editora Saraiva, 2020. Disponível em: https://integrada.minhabiblioteca.com.br/#/books/9786587958446/.
FOREMAN, John W. Data Smart: usando Data Science para transformar informação em insight. Rio de Janeiro: Editora Alta Books, 2016.Disponível em: https://integrada.minhabiblioteca.com.br/#/books/9788555084330/.
MUELLER, John P.; MASSARON, Luca. Python Para Data Science Para Leigos. Rio de Janeiro: Editora Alta Books, 202.. Disponível em: https://integrada.minhabiblioteca.com.br/#/books/9786555201512/.