- Descrição
- Currículo
- Comentários
Este curso apresenta o uso da linguagem Python para análise de dados destinado a todas áreas do conhecimento que necessitam manipular dados de forma rápida, eficiente e com qualidade, principalmente para Ciência de Dados e Machine Learning. O curso aborda alguns conceitos de Machine Learning com o objetivo de demonstrar algumas aplicações de Python em Machine Learning.
Todas as aulas são explicadas passo a passo, aumentando o nível de dificuldade gradativamente e utilizando projetos reais para exemplificar as análises dos dados com profundidade, portanto, o curso é destinado tanto para iniciantes como para pessoas com conhecimentos prévios na linguagem Python e em análise de dados. Os projetos são trabalhados desde a aquisição dos conjuntos de dados no repositório de dados, até análises estatísticas descritivas detalhadas e criações de gráficos estruturados no Matplotlib, Seaborn e Plotly.
O curso é dividido basicamente em quatro partes:
1) Domínio do uso da linguagem Python, com o Google Colaboratory, desde os conceitos fundamentais até conceitos mais avançados para análise e manipulação de dados.
2) Desenvolvimento de uma análise de um projeto real focado na limpeza, organização, estruturação, manipulação dos dados e análises estatísticas.
3) Desenvolvimento de uma análise de outro projeto real focado na análise e criação de gráficos, aplicando anteriormente todo o tratamento aprendido no primeiro projeto.
4) Conceitos básicos e criação de dois algoritmos simples de Machine Learning no Google Colaboratory.
São disponibilizados todos os slides das aulas teóricas, todos os scripts das aulas práticas no Python e todos os arquivos com os datasets.
É um curso riquíssimo em informações e com explicações claras e objetivas, ilustrando o fantástico mundo da Linguagem Python para Análises de Dados. Uma observação importante: o curso não é Estático, isto é, qualquer necessidade apontada pelos alunos poderá ser acrescida ao curso e, sempre que tiver alguma alteração, atualização ou inclusão de conteúdo, todos serão comunicados por email.
-
3A Linguagem Python
-
4Conhecendo o Google Colaboratory
-
5Instalação do Anaconda Python
-
6Conhecendo o Jupyter Notebook
-
7Primeiros passos no Python com o Google Colaboratory
-
8Operadores Matemáticos
-
9Importações de bibliotecas e pacotes
-
10Estrutura condicional
-
11Estrutura de Repetição
-
12Listas, Tuplas e Dicionários
-
13Criação de Funções
-
14Funções Lambda e Map
-
15List Comprehensions
-
16Vetores e matrizes
-
17Extração do DataFrame
-
18Importação do DataFrame
-
19Importação do DataFrame (arquivo Excel)
-
20Importação do DataFrame pelo Jupyter Notebook
-
21Importação de um DataFrame através de uma url
-
22Importação de Datasets das bibliotecas Python
-
23Renomeando e excluindo variáveis (colunas)
-
24Criando e alterando valores das colunas. Concatenação (união) de dois Dataframes
-
25Contagem dos registros e seleção das colunas por índices
-
26Excluindo, filtrando e substituindo linhas (registros)
-
27Análise de valores missing
-
28Análise e alteração dos tipos de atributos. Exportação do DataFrame tratado.
-
29Exercício desafio
-
30Resolução do exercício desafio
-
31Exploração dos dados: importação e filtragem
-
32Distribuição de frequências: Teoria
-
33Medidas de Tendência central: Teoria
-
34Medidas de centralidade no Python
-
35Distribuição de frequência: Histograma
-
36Medidas de posição e dispersão: Teoria
-
37Análise de Outliers: teoria
-
38Medidas de posição: Quartis, mínimo e máximo
-
39Box Plot e outliers
-
40Medidas de dispersão
-
41Tipos de Variáveis e Distribuição Normal (teoria)
-
42Testes de normalidade no Python
-
43Correlação/regressão Linear (teoria)
-
44Correlação Linear no Python
-
45Introdução à Regressão Linear Simples com StatsModels