Fundamentos do Aprendizado de Máquina: Conceitos Essenciais

Classificado em Tecnologia

Escrito em em português com um tamanho de 2,83 KB

Aprendizado por Reforço (Reinforcement Learning)

No **Aprendizado por Reforço**, o agente recebe uma série de reforços, como recompensas ou punições. Não fornecemos a “resposta correta” ao sistema. Em vez disso, o sistema formula uma hipótese e determina se essa hipótese foi boa ou ruim. *Cabe ao agente reconhecer quais ações anteriores ao reforço foram as maiores responsáveis por esse resultado.* Por exemplo, a ausência de uma gorjeta no final do percurso dá ao agente taxista uma indicação de que algo foi feito de forma inadequada.



Aprendizado Supervisionado (Supervised Learning)

No **Aprendizado Supervisionado**, observamos pares de exemplos de entrada e saída para aprender uma função que mapeia a entrada para a saída. Fornecemos ao sistema a “resposta correta” durante o processo de treinamento. É **útil para**:
  • Classificação
  • Regressão
  • Estimação de probabilidade condicional
**Exemplo**: Imagine um agente sendo treinado para se tornar um motorista de táxi. Toda vez que o instrutor grita "Freio!", o agente pode aprender uma condição para quando deve frear.


Exemplos Positivos e Negativos

**Exemplos Positivos** são aqueles que levam a uma resposta afirmativa. Por exemplo, se a condição é "Há uma árvore" e a pergunta é "Vai esperar?", a resposta é "Sim".
**Exemplos Negativos** são aqueles que levam a uma resposta negativa. Para o mesmo exemplo, "Vai esperar?", a resposta é "Não".


KNN (K-Nearest Neighbor)

O **KNN (K-Nearest Neighbor)** é um algoritmo que se enquadra no aprendizado supervisionado, utilizado para classificar objetos com base em exemplos de treinamento que estão mais próximos no espaço de características.

Requisitos para Usar o KNN:

  • Um conjunto de exemplos de treinamento.
  • Definição de uma métrica para calcular a distância entre os exemplos de treinamento.
  • Definição do valor de *K* (número de vizinhos mais próximos que serão considerados pelo algoritmo).


Processo de Classificação com KNN:

  • Calcula a distância entre o exemplo desconhecido e os outros exemplos do conjunto de treinamento.
  • Identifica os *K* vizinhos mais próximos.
  • Utiliza o rótulo da classe dos vizinhos mais próximos para determinar o rótulo de classe do exemplo desconhecido (por votação majoritária).



Variável de Folga (Soft Margin)

A **Variável de Folga (Soft Margin)** serve para flexibilizar as restrições de otimização. Elas são utilizadas para medir o grau de classificação errônea no conjunto de treinamento e indicam onde as amostras se encontram em relação às margens de separação.

Entradas relacionadas: