Lesson Video: Diagrama de cajas y bigotes | Nagwa Lesson Video: Diagrama de cajas y bigotes | Nagwa

Lesson Video: Diagrama de cajas y bigotes

En este vídeo vamos a aprender cómo dibujar y cómo interpretar un diagrama de cajas y bigotes.

17:59

Video Transcript

En esta lección vamos a aprender cómo construir un diagrama de cajas y bigotes para un conjunto de datos cuantitativos cualquiera. Cuando tenemos un conjunto de datos cuantitativos, una forma eficaz de representar la distribución de estos datos es mediante un diagrama de caja y bigotes. Como ya sabes, un conjunto de datos cuantitativos es aquel donde los valores son medidas tales como la altura, el peso o la edad. La variable, lo que estamos midiendo, la altura, por ejemplo, toma valores numéricos. Para mejor aprovechar este vídeo conviene que repasemos algunos términos importantes antes de ver y resolver ejercicios de diagramas de cajas y bigotes.

Vamos a ver ocho términos importantes a la hora de considerar un diagrama de caja y bigotes. El «mínimo» de un conjunto de datos es el valor más pequeño del conjunto de datos. El «máximo» de un conjunto de datos es el valor más grande del conjunto de datos. El «rango» de un conjunto de datos es el valor máximo menos el valor mínimo. Es la diferencia entre los dos valores.

El «primer cuartil», o «𝑄 uno», es el valor en un conjunto de datos por debajo del cual se encuentra el 25 por ciento de los datos. También se conoce como cuartil inferior. La «mediana», o «segundo cuartil», de un conjunto de datos es el valor en el centro de los datos. Por lo tanto, el 50 por ciento de los datos se encuentran por debajo de la mediana. Esto significa también que el otro 50 por ciento se encuentra por encima de la mediana. El «tercer cuartil», o «𝑄 tres», es el valor de un conjunto de datos por debajo del cual se encuentra el 75 por ciento de los datos. Esto también se conoce como cuartil superior. El 25 por ciento de los datos se encuentra por encima de este punto.

El «rango intercuartílico», o «RI», para abreviar, de un conjunto de datos viene dado por 𝑄 tres menos 𝑄 uno, y comprende el 50 por ciento de los datos. Esto significa que el 50 por ciento de los datos se encuentra entre el primer cuartil y el tercer cuartil. Un «valor atípico» es un valor que es mucho más pequeño o mucho más grande que la mayoría de los otros valores de un conjunto de datos. Este tipo de valor también se conoce como valor extremo o valor anómalo. A continuación vamos a ver cómo estos elementos nos permiten elaborar un diagrama de cajas y bigotes.

Es conveniente explicar primero lo que es un diagrama de cajas y bigotes. Un diagrama de caja y bigotes, o simplemente diagrama de caja, es un gráfico que ilustra la distribución de un conjunto de datos cuantitativos utilizando cinco números del conjunto de datos. Estos son el máximo, el mínimo, el primer cuartil, la mediana y el tercer cuartil. Comenzamos dibujando un eje horizontal que ha de abarcar todos los valores posibles de datos. Podemos dibujarlo verticalmente de manera ocasional, aunque en la gran mayoría de los casos será horizontal. La parte de la caja de un diagrama de caja y bigotes abarca el 50 por ciento de los valores del conjunto de datos. Y cada uno de los bigotes abarca el 25 por ciento de los datos.

El bigote inferior incluye todos los datos desde el mínimo hasta 𝑄 uno. Es decir, el 25 por ciento inferior de los datos. El bigote superior abarca todos los datos entre 𝑄 tres y el valor máximo. Esto es el 25 por ciento más alto de los datos. La mediana está dentro de la caja y representa el centro de los datos. El 50 por ciento de los valores se encuentra por encima de la mediana, y el otro 50 por ciento se encuentra por debajo. En suma, podemos ver que el 25 por ciento de los datos se encuentra entre cada dos de los valores clave consecutivos.

Normalmente, los valores atípicos, o valores anómalos, de un conjunto de datos en un diagrama de cajas y bigotes son señalados con un asterisco. Si hay uno o más valores atípicos en un conjunto de datos, entonces, para construir un diagrama de cajas y bigotes, los valores mínimo y máximo de los datos se determinan excluyendo los valores atípicos. Ahora veremos una serie de ejemplos. En el primer ejemplo vamos a dibujar y a interpretar un diagrama de caja y bigotes para un conjunto de datos específico.

Francisco ha obtenido, a partir de un conjunto de datos, la siguiente información sobre las edades de las personas que fueron a una piscina el sábado por la mañana. El valor mínimo fue siete. El cuartil inferior 10. La mediana fue 15, el cuartil superior, 22, y el máximo, 31. Esta cuestión se compone de cuatro partes. Parte a): Dibuja un diagrama de cajas y bigotes usando la información que ha obtenido Francisco a partir del conjunto de datos. Parte b): ¿Cuál es el rango de edad de los nadadores? Parte c): ¿Qué porcentaje de los nadadores tenían entre siete y 22 años de edad? Parte d) Calcula e interpreta el porcentaje de nadadores que abarca la caja.

Comencemos con la parte a): Dibuja un diagrama de cajas y bigotes. Lo primero que tenemos que hacer es dibujar un eje horizontal o de las 𝑥. De esta forma podremos mostrar las edades de los nadadores. Este eje debe ir un poco por debajo del valor más bajo y un poco por encima del valor más alto, en este caso, por debajo de siete y por encima de 31. Los cinco valores clave que necesitamos para dibujar el diagrama de cajas y bigotes son siete, 10, 15, 22 y 31. Los marcamos en el eje horizontal. En primer lugar, el valor más bajo o mínimo, es siete. El cuartil inferior, o 𝑄 uno, es 10. La mediana de los nadadores es 15. 𝑄 tres, o el cuartil superior, es 22. Y, por último, 31 es el valor máximo o el más alto. Esta es la edad del nadador de más edad.

Ahora vamos a usar estos cinco valores para dibujar la caja y los bigotes. La caja va de 𝑄 uno a 𝑄 tres, del cuartil inferior al superior. Comenzamos dibujando tres rayas verticales en 𝑄 uno, en la mediana y en 𝑄 tres. Y completamos la caja dibujando dos rayas horizontales. No importa tanto cuán por encima del eje dibujemos la caja. Pero debe estar lo suficientemente cerca del eje para que podamos leer los valores fácilmente. A continuación tenemos que dibujar los bigotes. Estos deben bajar hasta el valor mínimo y subir hasta el valor máximo. Al añadir estas rayas hemos completado el diagrama de cajas y bigotes. Tenemos un valor mínimo de siete, un cuartil inferior o 𝑄 uno de 10, una mediana de 15, un cuartil superior o 𝑄 tres de 22 y un valor máximo de 31. Veamos ahora las partes b), c) y d).

La parte b) de la pregunta dice lo siguiente: ¿Cuál es el rango de las edades de los nadadores? El rango de cualquier conjunto de datos puede calcularse restando el valor mínimo del valor máximo. En este problema, el valor máximo era 31 y el mínimo 7. Así que tenemos que restar siete de 31. Y obtenemos 24. Por lo tanto, el rango de edad de los nadadores que acudieron a la piscina el sábado por la mañana era 24.

La tercera parte de la pregunta, la parte c), dice lo siguiente. ¿Qué porcentaje de los nadadores tenían entre siete y 22 años de edad? Sabemos que cada sección del gráfico de caja y bigotes representa el 25 por ciento de los datos. El 25 por ciento se encuentra entre el mínimo y 𝑄 uno. Otro 25 por ciento se encuentra entre 𝑄 uno y la mediana. Hay un 25 por ciento entre la mediana y 𝑄 tres. Y, por último, otro 25 por ciento de los datos se encuentra entre 𝑄 tres y el valor máximo.

El valor mínimo, o edad mínima, era siete. Y 𝑄 tres era igual a 22. Tenemos que averiguar cuál es el porcentaje que se encuentra entre el valor mínimo y 𝑄 tres. 25 por ciento más 25 por ciento más 25 por ciento es 75 por ciento. Por lo tanto, el 75 por ciento de los datos se encuentra entre el valor mínimo y 𝑄 tres. También podríamos haber obtenido esta respuesta a partir de la definición que dice que el 75 por ciento de cualquier conjunto de datos se encuentra por debajo de 𝑄 tres. En este problema, el 75 por ciento de los nadadores tenía entre siete y 22 años.

Hagamos ahora la parte final del ejercicio, la parte d). Calcula e interpreta el porcentaje de nadadores situado en la caja que hubo el sábado por la mañana. La caja incluye todos los valores entre 𝑄 uno y 𝑄 tres. El 25 por ciento de los valores está entre 𝑄 uno y la mediana. Y el 25 por ciento está entre la mediana y 𝑄 tres. Como 25 más 25 es 50, entonces el 50 por ciento de los valores está entre 𝑄 uno y 𝑄 tres. También sabemos esto a partir de la definición. Y como la caja va desde 𝑄 uno hasta 𝑄 tres, debe abarcar el 50 por ciento de los datos. La respuesta correcta para la parte d) es 50 por ciento.

En el próximo ejemplo vamos a aprender cómo interpretar un diagrama de caja y bigotes. Vamos a interpretar un diagrama de caja y bigotes para identificar el enunciado correcto. El problema dice lo siguiente.

Observa el diagrama de caja y bigotes. Explica por qué la raya que está dentro de la caja está descentrada hacia la derecha. ¿Es A): la mediana está más cerca de 𝑄 tres que de 𝑄 uno? ¿B): la media es aproximadamente 49? ¿C): la persona que elaboró el gráfico cometió un error? O ¿D): la moda es 49?

Comencemos marcando los cinco elementos clave del diagrama. El punto que está más a la izquierda es el valor mínimo. Está entre 30 y 35, y está más cerca de 35. El punto que está más a la derecha es el valor máximo. Está entre 55 y 60. El lado izquierdo de la caja es el cuartil inferior, o 𝑄 uno. El lado derecho de la caja es 𝑄 tres. Que también se conoce como cuartil superior. En última instancia, la raya que está entre 𝑄 uno y 𝑄 tres es la mediana. En este problema, la mediana es 49. Veamos ahora las cuatro opciones que se nos han dado.

Las opciones B) y D) incluyen el número 49. Pero mencionan la media y la moda. Y de un diagrama de caja y bigotes solo podemos obtener el valor de la mediana, no el de la moda ni el de la media. Así que descartamos las opciones B) y D). En la parte de la caja del diagrama vemos que la mediana está más cerca del lado derecho que del izquierdo. Como el lado derecho representa 𝑄 tres y el izquierdo representa 𝑄 uno, entonces la opción A) es la correcta. La mediana está más cerca de 𝑄 tres que de 𝑄 uno.

No podemos saber si la persona que hizo el diagrama se equivocó o no. Pero es más probable que la raya sobre la mediana esté descentrada, es decir, más cerca de la derecha o de la izquierda de la caja. Esto quiere decir que, en esta cuestión, la opción C) también es incorrecta. La razón por la que la raya está descentrada hacia la derecha es porque la mediana está más cerca de 𝑄 tres que de 𝑄 uno.

Ahora veremos un ejemplo más en el que tendremos que interpretar un diagrama de cajas y bigotes. Esta cuestión utiliza la palabra «diagrama de caja», que es un nombre alternativo para «diagrama de caja y bigotes».

El diagrama de caja muestra las temperaturas diarias en un recinto playero durante el mes de agosto. Hay siete partes en este ejercicio. Se nos pide que calculemos la mediana, el máximo, el mínimo, el cuartil inferior, el cuartil superior, el rango intercuartílico y el rango de las temperaturas.

Para resolver este ejercicio vamos a comenzar señalando los elementos clave. El punto al principio del bigote izquierdo es el valor mínimo. Y el punto al final del bigote derecho es el valor máximo. El lado izquierdo de la caja se conoce como 𝑄 uno o cuartil inferior. El lado derecho de la caja es 𝑄 tres. Que también se denomina cuartil superior. Y la raya que está entre 𝑄 uno y 𝑄 tres es la mediana. Ahora ya podemos hallar los valores clave para resolver las siete partes del ejercicio.

Los valores 18 a 32 a lo largo del eje horizontal son las temperaturas en grados centígrados. En la parte A) se nos pide que calculemos la mediana, y esta es 24 grados centígrados. En la parte B) se nos pide hallar la temperatura máxima. Este es el punto más alejado a la derecha. Así que la temperatura máxima es 31 grados centígrados. La parte C) nos pedía la temperatura mínima, o la más baja. Este es el punto más alejado hacia la izquierda, que es 18 grados centígrados.

En la parte D) se nos pide que calculemos el cuartil inferior. Este es el valor 𝑄 uno y es igual a 22 grados centígrados. En la parte E) se nos pide hallar la temperatura del cuartil superior. Este es el valor de 𝑄 tres, que es 28 grados centígrados. La parte F) nos pide que calculemos el rango intercuartílico. Podemos calcular el rango intercuartílico, o RI, restando el cuartil uno del cuartil tres. El cuartil superior es 28. Y el cuartil inferior es 22. Tenemos que restar 22 de 28. Y obtenemos seis. De esta forma hemos obtenido que el rango intercuartílico de las temperaturas es seis grados centígrados.

En la última parte, la G), se nos pide que calculemos el rango de las temperaturas. El rango de cualquier conjunto de valores es el valor máximo menos el valor mínimo. En este problema tenemos que restar la temperatura más baja, o sea, 18, de la temperatura más alta, o sea, 31. 31 menos 18 es 13. Por lo tanto, el rango de las temperaturas es de 13 grados centígrados. Las respuestas a las siete partes de la pregunta son 24, 31, 18, 22, 28, 6 y 13 grados centígrados, respectivamente.

Para concluir con este vídeo vamos a repasar las características principales de un diagrama de caja y bigotes. En primer lugar, la parte de la caja de un diagrama de caja y bigotes abarca el 50% del conjunto de datos. Cada uno de los bigotes abarca el 25 por ciento de los datos. El bigote inferior incluye todos los datos desde el valor mínimo hasta 𝑄 uno, o el cuartil inferior. Este es el 25 por ciento más bajo de los datos. El bigote superior abarca todos los datos entre 𝑄 tres, o el cuartil superior, y el valor máximo. Este es el 25 por ciento más alto de los datos. La mediana se encuentra dentro de la caja y representa el centro de los datos. El 50 por ciento de los valores se encuentra por encima de la mediana y el otro 50 por ciento por debajo.

Join Nagwa Classes

Attend live sessions on Nagwa Classes to boost your learning with guidance and advice from an expert teacher!

  • Interactive Sessions
  • Chat & Messaging
  • Realistic Exam Questions

Nagwa uses cookies to ensure you get the best experience on our website. Learn more about our Privacy Policy