El coeficiente de correlación de Pearson es una medida estadística que se utiliza para determinar la relación lineal entre dos variables. Es una medida que va desde -1 hasta 1, donde -1 indica una correlación negativa perfecta, 0 indica que no hay correlación y 1 indica una correlación positiva perfecta.
Existen diferentes formas de calcular el coeficiente de correlación de Pearson, pero todas ellas se basan en la covarianza y las desviaciones estándar de las variables.
Fórmula general
La fórmula general para calcular el coeficiente de correlación de Pearson es la siguiente:
ρX,Y = σXY / (σX * σY)
Donde:
– ρX,Y es el coeficiente de correlación de Pearson entre las variables X e Y.
– σXY es la covarianza entre X e Y.
– σX es la desviación estándar de X.
– σY es la desviación estándar de Y.
Usando desviación estándar
Una forma de calcular el coeficiente de correlación de Pearson es utilizando las desviaciones estándar de las variables. La fórmula es la siguiente:
ρX,Y = Cov(X,Y) / (σX * σY)
Donde:
– Cov(X,Y) es la covarianza entre X e Y.
– σX es la desviación estándar de X.
– σY es la desviación estándar de Y.
La covarianza se calcula como la suma de los productos de las desviaciones de cada variable con respecto a sus medias, dividido por el número de observaciones menos 1.
La desviación estándar se calcula como la raíz cuadrada de la varianza de cada variable.
Usando covarianza
Otra forma de calcular el coeficiente de correlación de Pearson es utilizando la covarianza entre las variables. La fórmula es la siguiente:
ρX,Y = Cov(X,Y) / (Var(X) * Var(Y))
Donde:
– Cov(X,Y) es la covarianza entre X e Y.
– Var(X) es la varianza de X.
– Var(Y) es la varianza de Y.
La covarianza se calcula de la misma manera que en la fórmula anterior.
La varianza se calcula como la suma de los cuadrados de las desviaciones de cada variable con respecto a su media, dividido por el número de observaciones menos 1.
Usando medias y sumatorias
También es posible calcular el coeficiente de correlación de Pearson utilizando las medias y sumatorias de las variables. La fórmula es la siguiente:
rxy = (∑(xi – x̄)(yi – ȳ)) / (√(∑(xi – x̄)2) * √(∑(yi – ȳ)2))
Donde:
– rxy es el coeficiente de correlación de Pearson entre las variables x e y.
– xi y yi son los valores de las variables x e y, respectivamente.
– x̄ y ȳ son las medias de las variables x e y, respectivamente.
En esta fórmula, se calcula la suma de los productos de las desviaciones de cada valor con respecto a su media, y se divide por el producto de las desviaciones estándar de cada variable.
El coeficiente de correlación de Pearson se puede calcular utilizando diferentes fórmulas, todas basadas en la covarianza y las desviaciones estándar de las variables. Estas fórmulas permiten determinar la relación lineal entre dos variables y su fuerza. Es una herramienta útil en el análisis de datos y en la toma de decisiones basada en la relación entre variables.