Um dos tópicos que estou revisando esse ano é probabilidade, principalmente para aplicações em Machine Learning.
Probabilidade de um Evento#
De maneira simplificada, probabilidade é uma área da matemática que estuda a chance de eventos ocorrerem. Como em Machine Learning lidamos com dados e incertezas, a probabilidade é importante para entender como ler os resultados de modelos, e entender como metrifica-los.
Vou buscar escrever os notações matemáticas também, pois para os que estudam e trabalham com Machine Learning, é importante entender a notação para ler artigos científicos e livros da área.
Um exemplo simples de probabilidade é, partindo do suposto que tenho 10 alunos em uma sala e 3 deles conhecem futebol, qual a probabilidade de um aluno escolhido aleatoriamente jogar futebol?
$$P(\text{futebol}) = \frac{\text{evento}}{\text{espaço amostral}} = \frac{\text{n alunos futebol}}{\text{n total alunos}} = \frac{3}{10} = 0,3$$Então em um experimento aleatório, a probabilidade de escolher um aluno que joga futebol é 30%. Probabilidade sempre varia entre 0 e 1, ou 0 e 100%.
Vamos representar isso graficamente, usando o diagrama de Venn, que é uma representação visual de conjuntos e suas relações:
graph TD
subgraph Omega ["Ω - Espaço Amostral (10 Alunos)"]
F(("Jogam Futebol:
30% - 3 Alunos"))
end
classDef omegaBox fill:#f4f9f4,stroke:#27ae60,stroke-width:2px,color:#27ae60,font-weight:bold
classDef bola fill:#fff,stroke:#333,stroke-width:2px,color:#000,font-weight:bold
class Omega omegaBox
class F bola
Em notação matemática, ficaríamos assim:
Espaço Amostral (pode-se usar a notação S ou Ω):
$$n(\Omega) = 10$$Evento A (Alunos que jogam futebol):
$$n(A) = 3$$Probabilidade:
$$P(A) = \frac{n(A)}{n(\Omega)} = \frac{3}{10} = 0,3$$Evento Complementar#
O complementar de um evento é a probabilidade do evento não acontecer. Tendo em vista que nosso espaço amostral \(n(\Omega)\) possui todos os eventos possíveis, no nosso exemplo o numero de alunos, e que a probabilidade é sempre um valor entre 0 e 1, entao o resultado do evento complementar é 1 menos a probabilidade do evento acontecer.
\(P(A^c) = 1 - P(A)\) tal que \(A \cup A^c = \Omega\)
No nosso exemplo, a probabilidade de escolher um aluno que não joga futebol é 70%:
$$P(\text{não futebol}) = 1 - P(\text{futebol}) = 1 - 0,3 = 0,7$$Resumo#
Neste post, revisamos o conceito de probabilidade, que é a chance de eventos ocorrerem, e sua importância para Machine Learning. Usamos um exemplo simples de uma sala com 10 alunos, onde 3 jogam futebol, para calcular a probabilidade de escolher um aluno que joga futebol (30%) e o evento complementar (70%). Também representamos isso graficamente usando um diagrama de Venn. A probabilidade é fundamental para entender os resultados de modelos de Machine Learning e suas métricas.
Escreverei uma série de artigos conforme meus estudos vão progredindo, então fique atento para os próximos posts sobre probabilidade, estatística e outros tópicos relacionados a Machine Learning e Inteligência Artificial.

