Que es la distribucion de Poisson en estadística y ciencia de datos
En el campo de la Data Science, es una necesidad aprender los conceptos de Estadística y Probabilidad porque sin él tampoco podemos realizar las operaciones más simples
Necesitamos pensar en cada momento en qué ecuación estadística encajar para que nuestro trabajo sea más fácil y presentable frente al público. La probabilidad y las estadísticas no solo juegan un papel fundamental en la ciencia de datos, sino también en nuestro día a día, como estimar el costo de un producto, lanzar una moneda, jugar a las cartas y estimar la probabilidad de obtener un as de diamantes, etc. los términos están conectados de alguna manera con nosotros.
Ahora, para un científico de datos, es de suma importancia jugar con la base de datos que se le proporciona y ayudar a guiar a cualquier organización a obtener información significativa de la base de datos, ya sea trazando gráficos, creando tableros interactivos o muchos más. Además, la probabilidad juega un papel importante a la hora de obtener los detalles de los datos y cómo se distribuyen. Existen numerosas formas de obtener la distribución de nuestros datos con la ayuda de la probabilidad y se denominan distribuciones de probabilidad. Algunas distribuciones de probabilidad son la distribución binomial, la distribución normal, la distribución normal estándar, la distribución de Poisson, etc. Hoy en día, el meollo del tema se centra en la distribución de Poisson. Entonces, profundicemos y entendamos el significado de este término
La distribución de Poisson es un tipo de distribución de probabilidad que se parece mucho a la distribución binomial, es decir, se aplica a una variable aleatoria discreta que tiene algunos valores. Se emplea para describir eventos aleatorios que ocurren raramente en un continuo de espacio o tiempo. Por ejemplo, supongamos que tenemos un evento A y nos interesa determinar el número de ocurrencias del evento A en un período particular t, entonces aplicaremos la distribución de Poisson. Aquí el tiempo se puede dividir en n intervalos iguales, cada uno con la longitud de t / n. Estos n intervalos también se denominan ensayos de Bernoulli.
Ahora, el problema surge al calcular la probabilidad del evento porque los intervalos en los que se divide el tiempo tienen un valor muy inferior y, por lo tanto, no podemos aplicar la Distribución de Poisson, ya que no podemos decir que una vez que el evento ocurrió en un intervalo de tiempo particular no puede volver a ocurrir en ese momento.
Entonces, para superar este problema, aumentamos la duración del intervalo de tiempo en la medida de lo posible, de modo que el evento no se repita en ese período de tiempo. La fórmula para calcular la función de masa de probabilidad para la distribución de Poisson viene dada por:
P (x) = e -m .m x / x !, donde e se llama la base naperiana que tiene un valor de 2.183, x es el no. de veces que ocurre el evento, y m es la media de la variable aleatoria dada por m = np (número de intentos. probabilidad de éxito).
El valor de e -m se puede obtener de tablas matemáticas. Además, una cosa importante a tener en cuenta aquí es que la distribución de Poisson nunca tiene en cuenta la probabilidad de falla, es decir, 1-p = q, si aquí solo nos preocupamos por el éxito y la media del conjunto de datos. Además, la media y la varianza en la distribución de Poisson son iguales y están dadas por la misma fórmula
¿Te es util este articulo?. ¿Tienes una opinion relacionada con este articulo?. ¿Te has entretenido con nosotros?.
Si la respuesta es afirmativa, dejanos un comentario :) y como no Gracias por vernos