Lesson Video: Correlación | Nagwa Lesson Video: Correlación | Nagwa

Lesson Video: Correlación

En este vídeo vamos a aprender el significado de correlación lineal y cómo identificar los distintos tipos de correlación.

11:32

Video Transcript

En este vídeo vamos a aprender el significado de correlación lineal y cómo identificar los distintos tipos de correlación. Veamos lo que pasa cuando dibujamos un diagrama de dispersión. Podemos usar un diagrama de dispersión para representar datos bivariados, donde los datos de un conjunto están emparejados con los datos de otro conjunto. Por ejemplo, podemos representar gráficamente la precipitación diaria en la ciudad de Nueva York frente a las ventas de pollo frito en libras. Si nos fijamos en el diagrama de dispersión, vemos que hay una pauta o tendencia. En este caso, a medida que aumentan las precipitaciones diarias, también aumentan las ventas de pollo frito. Por lo tanto, decimos que estos dos conjuntos de datos tienen una correlación, lo que significa que existe algún tipo de relación entre ellos.

No obstante, es importante tener claro que, aunque haya correlación, eso no significa necesariamente que exista una relación de causalidad entre ellos. Es decir, no podemos asumir que las precipitaciones diarias sean necesariamente la causa del aumento en las ventas de pollo frito.

Dicho esto, vamos a definir el concepto de correlación. Decimos que dos conjuntos de datos están correlacionados cuando parece haber una relación entre ellos. Y, para identificar si existe esta correlación, usamos un diagrama de dispersión. Más específicamente, si representamos nuestros datos en un diagrama de dispersión y los puntos se agrupan alrededor y a lo largo de una línea recta, entonces decimos que están correlacionados linealmente. Análogamente, si los puntos se agrupan alrededor y a lo largo de una línea que no es recta, como una parábola o una curva exponencial, entonces decimos que están correlacionados de forma no lineal. Y, si los puntos no se agrupan alrededor y a lo largo de una línea, entonces decimos que no hay correlación.

Considera la correlación lineal de la que acabamos de hablar. Una nube de puntos que corresponde a dos variables que están correlacionadas linealmente puede ser así. Aunque puede ser también así. En cualquier caso, los puntos se han de hallar cercanos y a lo largo de una línea recta. En nuestro segundo ejemplo, los puntos tienen esta forma. En este caso, la línea de mejor ajuste es una curva. Por último, si no hay correlación, nuestro diagrama de dispersión tendrá este aspecto. En cada uno de estos casos, hemos considerado si podemos trazar una línea que se ajuste a la nube de puntos. La forma de la línea de mejor ajuste nos da información sobre el tipo de correlación, si la hay.

Sabiendo esto, veamos cómo comparar una recta de mejor ajuste con los datos de un diagrama de dispersión. Esto nos ayudará a determinar si los datos están correlacionados linealmente.

¿Podemos usar la recta de mejor ajuste para describir la tendencia de los datos? ¿Por qué?

Se nos presenta un gráfico de dispersión con una recta de mejor ajuste trazada. Imaginemos que esta supuesta recta de mejor ajuste no está dibujada en el gráfico. ¿Cómo dibujaríamos nuestra propia línea de mejor ajuste? ¿Cómo podemos hallar una línea que se ajuste con mayor precisión a la pauta mostrada por los puntos azules? Puede que tenga este aspecto. En efecto, podemos ver que, cuando los valores de 𝑥 aumentan, los valores de 𝑦 también aumentan. Pero vemos que esto no ocurre formando una línea recta. Esto significa que existe una correlación entre 𝑥 e 𝑦. Pero no tienen una correlación lineal. La línea de mejor ajuste no es una línea recta.

Así que en este caso no es la mejor opción para describir la tendencia de los datos. Por lo que no vamos a usar esta recta de mejor ajuste para hacer predicciones o estimaciones basadas en los datos que se nos dan, pues estos datos no están correlacionados linealmente. No determinan una línea recta.

Ahora bien, aunque esta no sería una recta de mejor ajuste razonable para describir la pauta de los datos, hemos dicho que tanto la recta de mejor ajuste como la pauta aparente de los datos muestran que a medida que los valores de 𝑥 aumentan, los valores de 𝑦 también parecen aumentar. Podemos describir este hecho usando diferentes frases. Decimos que dos conjuntos de datos tienen una correlación positiva, o directa, si los valores de uno de los conjuntos de datos aumentan a medida que aumentan los valores del otro. En el caso de una correlación lineal positiva, los datos pueden tener este aspecto. Si los conjuntos de datos tienen una correlación negativa o inversa, entonces a medida que los valores de uno de los conjuntos aumentan, los valores del otro conjunto disminuirán, y viceversa. En el caso de dos conjuntos de datos que tienen una correlación lineal negativa, los puntos parecen seguir una recta de pendiente negativa, como se muestra.

Dicho esto, vamos a determinar, usando una recta de mejor ajuste, si los datos tienen una correlación positiva o una correlación negativa o ninguna correlación.

¿Qué tipo de correlación existe entre las dos variables en el siguiente gráfico de dispersión?

Cuando pensamos en la correlación, pensamos en la correlación lineal, es decir, en puntos que siguen aproximadamente una línea recta, y cuando hablamos de correlación no lineal, nos referimos a puntos que siguen un tipo diferente de pauta, es decir, siguen aproximadamente una línea curva. Y si los datos están correlacionados linealmente, decimos que pueden tener una correlación lineal positiva o una correlación lineal negativa, dependiendo de la dirección de la recta de mejor ajuste. Consideremos, pues, el gráfico que se nos ha dado y veamos si podemos trazar una recta de mejor ajuste.

No es necesario que la recta de mejor ajuste pase por el origen, el punto cero, cero, aunque aquí parece que sí lo hace. Y esa recta de mejor ajuste debe seguir aproximadamente la pauta de nuestros puntos. Es obvio que la recta de mejor ajuste estará inclinada hacia arriba. Es decir, tendrá una pendiente positiva. Esto significa que, a medida que los valores de 𝑥 aumentan, también lo hacen los valores de 𝑦. Entonces, en este caso las variables 𝑥 e 𝑦 tienen una correlación positiva. Y como estos puntos siguen aproximadamente una línea recta, decimos que la correlación es lineal. Así que ya hemos resuelto nuestro problema. El tipo de correlación que existe es una correlación lineal positiva.

En este problema se nos dio un diagrama de dispersión de un conjunto de datos. Pero puede que este no sea siempre el caso. En su lugar, se nos puede dar una descripción del tipo de variables. Como veremos ahora, vamos a tener que hacer uso de nuestro conocimiento de cómo las variables se relacionan entre sí para determinar si tienen una correlación positiva, una correlación negativa o ninguna correlación.

Supongamos que la variable 𝑥 es el número de horas que trabajas y la variable 𝑦 es el dinero que ganas. Intuyes que, cuantas más horas trabajas, más dinero ganas ¿Sigue esto una correlación positiva, una correlación negativa o ninguna correlación?

Se nos dice que la variable 𝑥 es el número de horas trabajadas, y que la variable 𝑦 es el dinero que ganas. Y queremos hallar qué tipo de relación existe, en caso de que la haya, entre estas dos variables. Intuimos que cuantas más horas trabajas, mayor es tu salario. Así que vamos a representar esta información en un gráfico de dispersión. La variable 𝑥 es el número de horas trabajadas, mientras que 𝑦 es el dinero ingresado, así que podemos nombrar nuestros ejes. Propongamos algunas cantidades para comenzar. Supongamos que, si trabajas 15 horas a la semana, ganas 20.000 libras al año. Entonces, si trabajas 30 horas a la semana, tendrás un salario anual de 40 000 libras esterlinas. Suponiendo que cuantas más horas trabajes, mayor será tu salario, añadimos algunos puntos adicionales a nuestro gráfico de dispersión, como se muestra.

Observamos que los puntos trazados siguen una recta aproximadamente y que esta recta tiene una pendiente positiva. Está inclinada hacia arriba. Como esta recta está inclinada hacia arriba, eso significa que las dos variables 𝑥 e 𝑦 tienen una correlación positiva. Ahora bien, también hemos asumido que se trata de una correlación lineal positiva, pero puede que este no sea el caso. Solo sabemos que cuanto mayor es el número de horas trabajadas, mayor es el salario, lo que significa que este es un ejemplo de correlación positiva.

En este ejemplo hemos graficado nuestros datos como si estuvieran muy cerca de una línea recta. La distancia a la que se encuentran los datos de la recta de mejor ajuste describe el grado de la correlación. Por ejemplo, supongamos que estamos interesados en correlación lineal positiva. Si todos los puntos se encuentran muy cerca de la recta de mejor ajuste, como en este ejemplo, podemos decir que es un ejemplo de correlación fuerte. Sin embargo, si los puntos están bastante lejos de la recta de mejor ajuste, como en este otro ejemplo, decimos que hay una correlación débil. Al final, esta correlación débil desaparece pasando a haber una ausencia de correlación según los puntos se van alejando más y más entre sí. Teniendo esto en cuenta, vamos a determinar la fuerza de la correlación en nuestro siguiente ejemplo.

Indica cuál de los siguientes diagramas de dispersión muestra datos bivariados con la correlación más fuerte.

Se nos dan dos diagramas. Recuerda que, cuando pensamos en la fuerza de una correlación, estamos pensando en la distancia a la que se encuentran los puntos de la recta de mejor ajuste. Cuanto más cerca estén los puntos de la recta, más fuerte será la correlación. Así que vamos a comenzar dibujando la recta de mejor ajuste en ambos diagramas. La recta de mejor ajuste en el primer diagrama será así. Los puntos siguen aproximadamente una línea recta, por lo que existe una correlación lineal. Específicamente cuando la variable 𝑥 aumenta, también lo hace la variable 𝑦. Así que las variables 𝑥 e 𝑦 tienen una correlación lineal positiva.

En el segundo gráfico, nuestra recta de mejor ajuste es bastante parecida. Pero vemos que todos los puntos están bastante más alejados de la recta. Esto significa que en el segundo gráfico la correlación es menos fuerte. Podríamos decir que es débil. Así que la respuesta es el diagrama uno. El diagrama de dispersión uno muestra datos bivariados con una correlación más fuerte.

Hemos visto cómo dos variables distintas pueden estar relacionadas y qué significa que tengan una relación lineal o no lineal. También hemos aprendido cómo describir la relación entre las variables en términos de correlación positiva, correlación negativa o ausencia de correlación. Y hemos visto como describir la fuerza de la correlación entre las variables en función de su distancia a la recta de mejor ajuste. Veamos los puntos clave que hemos visto en este vídeo.

En este vídeo, hemos aprendido que, si dos variables siguen una pauta de algún tipo, se dice que están correlacionadas. Y que, si graficamos estos puntos en un diagrama de dispersión y parecen seguir aproximadamente una línea recta, entonces existe una correlación lineal. Y que, si la recta de mejor ajuste trazada está inclinada hacia arriba, es decir, tiene una pendiente positiva, entonces las variables tienen una correlación positiva. Y si esa recta de mejor ajuste está inclinada hacia abajo, es decir, tiene una pendiente negativa, entonces se dice que las variables tienen una correlación negativa. Pero, si nada de lo anterior se cumple, es decir, si no se puede trazar una recta de mejor ajuste, entonces decimos que no hay correlación o que la correlación es nula. Por último, hemos visto que podemos determinar el grado o intensidad de la correlación considerando la distancia a la que se encuentran todos los puntos de la recta de mejor ajuste.

Join Nagwa Classes

Attend live sessions on Nagwa Classes to boost your learning with guidance and advice from an expert teacher!

  • Interactive Sessions
  • Chat & Messaging
  • Realistic Exam Questions

Nagwa uses cookies to ensure you get the best experience on our website. Learn more about our Privacy Policy