Curso Learning from Data - Exemplo de Perceptron

Tabela de conteúdos

Machine Learning - Este artigo faz parte de uma série de artigos.

Parte 1: Curso Learning from Data - Caltech

Parte 2: Esse Artigo

Continuando os estudos do curso Learning from Data, hoje vamos estudar o exemplo de Perceptron.

Perceptron
#

Voltando ao nosso exemplo anterior, de um banco que quer classificar seus clientes em bons ou maus pagadores, temos os dados de entrada, ou as características dos clientes, sendo

$$X = (x_1,...x_d)$$

, onde cada $x_i$ representa um atributo diferente do cliente(idade, renda, histórico de crédito, etc.) e $d$ o número de atributos.

Sendo assim, a formula do perceptron é dada por:

Aprova o crédito se: $$\sum_{i=1}^{d} w_i x_i > limite$$
Recusa o crédito se: $$\sum_{i=1}^{d} w_i x_i < limite$$

Olhando com cuidado para formula, vemos que temos um novo conjunto de parâmetros, os pesos $w_i$ e o limite, que são os parâmetros a serem aprendidos tendo em vista que os valores de $x_i$ são os dados já existentes.

Os pesos $w_i$ indicam a importância de cada atributo $x_i$, quanto maior o peso mais importante o atributo, por exemplo, de repente o salário mensal do cliente terá um peso maior do que outros atributos.

Dito isso, a formula linear $h \in H $, ou seja, um possível modelo de hipótese, é dada por:

$$h(x) = sign(\sum_{i=1}^{d} w_i x_i - limite)$$

sendo $sign$ a função que retorna 1 se o valor for positivo e -1 se for negativo. Positivo significa que o cliente é um bom pagador, e negativo significa que o cliente é um mau pagador.

Para facilitar a notação, vamos chamar o limite de $w_0$ e adicionar um atributo $x_0$ que é sempre igual a 1, ou seja, $x_0 = 1$. Assim, a formula do perceptron fica:

$$h(x) = sign(\sum_{i=0}^{d} w_i x_i)$$

O Resultado é o mesmo do que a notação anterior, porem fica mais simples de escrever.

O Algoritmo de Aprendizado
#

Relembrando o diagrama que comentamos no artigo anterior, temos no nossos Dados, as hipóteses, que acabamos de ver do perceptron, porem esses dois se juntam no algoritmo de aprendizado, que é o processo de encontrar os melhores pesos $w_i$ para a função $h$ do perceptron.

graph LR
    A["$$f$$"] --> B["$$\text{Dados: } (x_1, y_1), ..., (x_N, y_N)$$"]
    B --> C["$$\text{Algoritmo de Aprendizado: } \mathcal{A}$$"]
    C --> D["$$g \approx f$$"]
    E["$$\text{Hipóteses: } \mathcal{H}$$"] --> C
    classDef green fill:#b7e4c7,stroke:#2d6a4f,color:#081c15;
    class B,E green;

Sendo assim, o algoritmo irá de maneira arbitrária, gerar valores de $w_i$ e testar a função $h$, comparando o resultado com os dados de resposta $y$, e tendo em vista que o resultado é linear, toda vez que temos os valores de $w_i$ alterados, na verdade temos uma reta $L$ desenhada no espaço de $x$, como vemos na imagem abaixo.

Imagem: Wikipedia Commons

Essa iteração acontece varias vezes até que encontre os melhores pesos para a função, sempre olhando os erros através da função

$$Erro(h) = \frac{1}{N} \sum_{i=1}^{N} [h(x_i) \neq y_i]$$

Resumo
#

Aprendemos nesse artigo um exemplo de modelo de hipótese, o perceptron, e como o algoritmo de aprendizado funciona para encontrar os melhores pesos $w_i$ para a função $h$.

No próximo artigo, vamos falar dos tipos de aprendizado, como o aprendizado supervisionado, não supervisionado e por reforço.

Se inscreva na newsletter para receber alertas para os próximos artigos sobre o assunto.

Referências
#

Machine Learning - Este artigo faz parte de uma série de artigos.

Parte 1: Curso Learning from Data - Caltech

Parte 2: Esse Artigo

Compartilhe

Perceptron#

O Algoritmo de Aprendizado#

Resumo#

Referências#

Perceptron
#

O Algoritmo de Aprendizado
#

Resumo
#

Referências
#