Atividades — Aula 0¶
Exercícios para fixar os conceitos da introdução. Não há código aqui — o objetivo é garantir que os fundamentos conceituais estejam sólidos antes de avançar.
Agora as questões são interativas: responda, clique em Enviar e use Mudar resposta sempre que quiser tentar de novo.
1. ML vs. Programação Tradicional¶
Um desenvolvedor precisa construir um sistema que identifica se uma transação bancária é fraudulenta ou não. Ele tem acesso a 2 milhões de transações históricas, cada uma já classificada como fraude ou legítima.
Qual é a melhor justificativa para usar Machine Learning nesse caso?
2. Classificando tipos de aprendizado¶
Considere as situações abaixo:
- a) Um e-commerce quer agrupar clientes em perfis de compra sem definir os grupos antes.
- b) Um hospital quer prever diabetes com prontuários já rotulados.
- c) Uma empresa quer treinar um robô para navegar desviando de obstáculos.
- d) Uma plataforma de streaming quer encontrar músicas parecidas para montar playlists.
Qual alternativa classifica corretamente os quatro casos?
3. Regressão ou Classificação?¶
Considere os problemas abaixo:
- a) Prever o preço de uma ação amanhã.
- b) Identificar se um tumor é maligno ou benigno.
- c) Estimar quantos dias um paciente ficará internado.
- d) Determinar qual dígito (0–9) está escrito numa imagem.
- e) Decidir se um e-mail vai para a caixa de entrada ou para o spam.
Qual alternativa classifica corretamente todos os problemas?
4. O pipeline na prática¶
Um cientista de dados recebeu a tarefa de construir um modelo que prevê o valor de aluguel de apartamentos em São Paulo. Considere as etapas abaixo e identifique a sequência correta do pipeline:
- Avaliar o modelo com dados que ele nunca viu
- Definir a métrica de sucesso
- Coletar dados de aluguéis anunciados
- Retreinar com dados mais recentes se a performance cair
- Tratar valores ausentes e criar features relevantes
- Escolher e treinar um modelo de regressão
- Explorar distribuições, correlações e outliers
Qual alternativa coloca essas etapas na ordem correta?
5. Identificando etapas pelo sintoma¶
Considere os sintomas abaixo e associe cada um à etapa do pipeline em que o problema apareceu:
- a) O modelo vai muito bem no treino, mas falha em produção.
- b) Os dados misturavam reais e dólares sem conversão.
- c) O modelo de spam dizia "não spam" para tudo e mesmo assim tinha 95% de acurácia.
- d) Seis meses após o deploy, a performance caiu muito sem mudança no código.
Qual alternativa identifica corretamente a etapa problemática em cada caso?
6. Fixando com Quiz¶
Machine Learning e Inteligência Artificial são a mesma coisa.
Um modelo de regressão prevê uma categoria discreta como saída.
Qual etapa do pipeline consome mais tempo em projetos reais?
No aprendizado supervisionado, o modelo aprende a partir de dados sem rótulos.
Retreinar o modelo com dados novos faz parte do pipeline de ML.
Aprendizado por reforço é o tipo mais usado em problemas de previsão de preços e classificação de e-mails.