Transcripción del vídeo
En este video, vamos a aprender cómo tratar el concepto de probabilidad condicionada usando frecuencias conjuntas presentadas en tablas de doble entrada.
Pero ¿qué queremos decir con probabilidad condicional? Se define como la probabilidad de que ocurra un suceso si es conocida la ocurrencia anterior de otro suceso. Por ejemplo, el suceso A es que está lloviendo y el suceso B es que el tren está retrasado. En probabilidad condicional, observamos estos sucesos juntos y hacemos preguntas como, ¿cuál es la probabilidad de que el tren se retrase si sabemos que está lloviendo? Escribimos esto como se muestra aquí, y esta raya, que es vertical u oblicua, se lee «dado».
Una forma que tenemos de registrar los resultados de tales eventos es en una tabla de doble entrada. Es una tabla que muestra la frecuencia de dos variables. Necesitamos poder completar tablas de doble entrada y calcular probabilidades a partir de ellas. Así que veamos cómo se hace esto.
Un sitio web de aficionados a la serie de ciencia ficción A Maze in Space recopila datos sobre el número de nuevas especies alienígenas encontradas por dos naves espaciales en cada temporada del programa. Los datos de las temporadas primera, segunda y séptima se muestran en la siguiente tabla, divididos entre las dos naves estelares Zeta y Geoda. Halla la probabilidad de que una nueva especie alienígena elegida al azar haya sido encontrada por la nave espacial Geoda. Redondea la respuesta a tres cifras decimales.
Queremos hallar la probabilidad de que una nueva especie exótica elegida al azar haya sido hallada por la nave espacial Geoda. Esto no especifica en qué temporada estamos interesados, así que vamos a usar el total. Comenzamos recordando que la probabilidad de que ocurra un suceso se halla dividiendo el número de formas en que ese suceso puede ocurrir por el número total de resultados posibles, que es la regla de Laplace. En este caso, vamos a hallar la cantidad de especies alienígenas encontradas en total por la nave espacial Geoda. Y luego dividimos este número por el número total de especies alienígenas encontradas.
Mirando los totales, vemos que la nave espacial Geoda descubrió 72 especies exóticas. Y el total fue 83. Por lo tanto, la probabilidad de que la nave espacial Geoda haya encontrado una nueva especie alienígena elegida al azar se obtiene dividiendo 72 por 83, que es 0.8674 etcétera. Redondeado a tres cifras decimales, eso es 0.867.
Así es como calculamos una probabilidad simple a partir de una tabla de doble entrada. Veamos ahora cómo hallar probabilidades condicionales a partir de estas tablas.
Sabiendo que la nueva especie alienígena fue encontrada en la séptima temporada, calcula la probabilidad de que fuera hallada por la nave espacial Geoda. Da la respuesta con tres cifras decimales.
La frase «sabiendo que» es una indicación de que vamos a calcular la probabilidad condicional. Llamemos ahora A el suceso de que la nave espacial Geoda haya encontrado la especie alienígena y llamemos B el suceso de que esto sucedió en la séptima temporada. Luego usamos esta línea vertical para expresar «sabiendo que». Estamos hallando la probabilidad de que A ocurra sabiendo que B ha ocurrido. Ahora bien, la frase «sabiendo que» esencialmente reduce el espacio muestral a una parte. Nos dicen que la especie alienígena fue encontrada en la séptima temporada. Así que solo estamos interesados en estos tres datos. En esta lista vemos que el número de especies alienígenas encontradas por la nave espacial Geoda es ocho.
Por supuesto, la probabilidad se halla dividiendo el número de formas en que ese suceso puede ocurrir por el número total de resultados. Y el número total aquí es 13. Así que la probabilidad de que suceda A si B ha sucedido es ocho dividido por 13, que es 0.61538 etcétera. Con tres cifras decimales, vemos que, sabiendo que la nueva especie alienígena fue encontrada en la séptima temporada, la probabilidad de que fuera hallada por la nave espacial Geoda es de 0.615.
Veamos otro ejemplo de cómo hallar probabilidades a partir de tablas de doble entrada.
La siguiente tabla contiene datos de una encuesta entre jugadores de videojuegos a los que se les preguntó si su plataforma de juego preferida era el teléfono móvil, la consola o la computadora. Los jugadores están divididos por género. Halla la probabilidad de que un jugador elegido al azar prefiera usar una consola. Da la respuesta con tres cifras decimales. Sabiendo que un jugador prefiere jugar usando una consola, halla la probabilidad de que sea varón. Da la respuesta con tres cifras decimales.
En primer lugar, recordemos que, para hallar la probabilidad de que ocurra un suceso, dividimos el número de formas en que ese suceso puede ocurrir por el número total de resultados del experimento. Y la primera parte de esta cuestión nos pide hallar la probabilidad de que un jugador elegido al azar prefiera usar una consola. Ahora bien, no especifican si estamos interesados en jugadores masculinos o femeninos. Así que, de hecho, vamos a calcular los totales.
Comenzamos calculando el número total de jugadores que prefieren usar un teléfono móvil. Eso es 52 más 48, que es 100. Del mismo modo, para calcular el número total de jugadores que prefirieron la consola, sumamos 37 y 23, para obtener 60. Finalmente, el número total de jugadores que prefieren usar la computadora es 48 más 35, que es 83. El número total de jugadores encuestados se halla sumando todos los valores en esta columna. Eso es 100 más 60 más 83, que es 243.
Recuerda, estamos buscando la probabilidad de que el jugador elegido al azar prefiera usar una consola. Así que esa es esta segunda fila. El número total de resultados o el número total de jugadores aquí que calculamos es 243. Por lo tanto, la probabilidad de que un jugador elegido al azar prefiera usar una consola es 60 dividido por 243, que es 0.2469 etcétera. Eso es 0.247.
La segunda parte de esta cuestión nos pide que, sabiendo que un jugador prefiere jugar usando una consola, hallemos la probabilidad de que sea un hombre. Esta frase «sabiendo que» es una indicación de que vamos a usar probabilidad condicional. Llamando A al suceso de que el jugador elegido sea un hombre y llamando B el el suceso de que prefiera usar una consola, usamos la notación con la barra para mostrar que estamos tratando de hallar la probabilidad de que A ocurra sabiendo que B ha ocurrido. Y lo que esto hace es reducir un poco los datos que nos interesan.
Nos dicen que el jugador prefiere jugar usando una consola. Por lo tanto, podemos reducir nuestro espacio muestral a aquellas personas que prefieren jugar usando una consola. Y queremos hallar la probabilidad de que sean hombres. Así que tenemos que dividir el número de jugadores varones que dijeron que preferían usar una consola entre el número total de jugadores que dijeron que preferían usar una consola. Eso es 37 dividido por 60. Eso es 0.61666 y así sucesivamente, que con tres cifras decimales es 0.617. Por lo tanto, la probabilidad de que un jugador sea un hombre si prefiere jugar con consola es de 0.617.
En nuestro siguiente ejemplo, vamos a discutir y a aprender cómo usar una fórmula de probabilidad condicional.
Daniel y Jennifer se han postulado en la elección para la presidencia de la Unión de Estudiantes en su escuela. Los votos que recibieron de cada una de las tres clases se muestran en la tabla. ¿Cuál es la probabilidad de que un alumno haya votado por Jennifer sabiendo que está en la clase B?
Recuerda, la expresión «sabiendo que» indica que estamos trabajando con probabilidad condicional. Supongamos que el suceso A es que un alumno votó por Jennifer. Y que el suceso B es que el alumno está en la clase B. Esta raya vertical significa «sabiendo que». Estamos hallando la probabilidad de que A ocurra sabiendo que B ocurrió. Y una forma en que podemos hacer esto es reducir la tabla según la información que nos han dado.
Nos dicen que ese alumno está en la clase B, así que lo reducimos todo a la clase B. En este caso, estamos interesados en la cantidad de alumnos que votaron por Jennifer. Eso es 195. Y recuerda, para hallar la probabilidad de que ocurra un suceso, dividimos el número de formas en que ese suceso puede ocurrir por el número total de resultados. Aquí, el número total de resultados posibles es el número total de alumnos en la clase B. Eso es 169 más 195, que es 364. Por lo tanto, la probabilidad de que un alumno haya votado por Jennifer, sabiendo que está en la clase B, es 195 sobre 364, lo que se simplifica a 15 sobre 28.
De hecho, este es un método perfectamente válido para responder esta cuestión. Pero hay una fórmula que podemos usar. Decimos que, para hallar la probabilidad de A dado B, dividimos la probabilidad de A intersección B —en otras palabras, A y B — por la probabilidad de B. En este caso, ¿qué es A intersección B? Bien, A fue el número de alumnos que votaron por Jennifer y B fue el número de alumnos en la clase B. Estamos buscando la intersección, los alumnos que votaron por Jennifer y están en la clase B. Hay 195 de ellos.
La probabilidad de elegir uno de estos al azar se halla dividiendo 195 por el número total de alumnos preguntados. Eso es 507 más 494. Eso nos da un total de 1001. Así que la probabilidad de A intersección B, en otras palabras, la probabilidad de que un estudiante haya votado por Jennifer y esté en la clase B, es 195 sobre 1001. ¿Y qué hay de la probabilidad de B, en otras palabras, la probabilidad de que estén en la clase B? Vimos que hay 364 alumnos en la clase B. Así que la probabilidad de que ocurra B es 364 dividido por 1001. Y, si aplicamos la fórmula, obtenemos 195 sobre 1001 dividido por 364 sobre 1001. Y te darás cuenta de que esto nos da exactamente la misma respuesta que antes, 195 sobre 364, que se simplifica a 15 sobre 28.
En nuestro último ejemplo, vamos a ver cómo podemos usar información de tablas de doble entrada para determinar si dos sucesos son independientes.
Se recopilan datos del programa de televisión A Maze in Space sobre el número de nuevas especies alienígenas con las que se hace el primer contacto. Los datos de la nave espacial Zeta en las temporadas uno, dos y siete se muestran en la tabla a continuación. Los datos también han sido clasificados según si el miembro de la tripulación que hizo el primer contacto era hombre o mujer. En la tabla, halla la probabilidad de que el primer contacto con una nueva especie alienígena haya sido hecho por una mujer miembro de la tripulación. Da la respuesta con tres cifras decimales.
Queremos hallar la probabilidad de que una mujer miembro de la tripulación haya hecho el primer contacto. Llamemos a eso 𝑃 de F, donde F es el suceso de que una fémina miembro de la tripulación fue la persona que hizo el primer contacto. Y sabemos que para hallar la probabilidad de que ocurra un suceso, dividimos el número de formas en que ese suceso puede ocurrir por el número total de resultados. La información sobre las tripulantes es esta segunda fila. Y sabemos que hay un total de 37 primeros contactos hechos por miembros de la tripulación mujeres.
El número total de resultados es el número total de primeros contactos hechos con una nueva especie alienígena; eso es 72. Por lo tanto, la probabilidad de que una mujer miembro de la tripulación haya hecho el primer contacto con una nueva especie alienígena es 37 dividido por 72. Eso es 0.5138 etcétera, que con tres cifras decimales es 0.514.
Ahora vamos a pasar a la segunda parte de esta cuestión.
La segunda parte de esta cuestión dice, halla la probabilidad de que el primer contacto fue hecho en la primera temporada y por una mujer miembro de la tripulación. Da la respuesta con tres cifras decimales.
Esta vez, no solo estamos interesados en que sea una mujer miembro de la tripulación quien haga el primer contacto, sino que esto debe ocurrir en la primera temporada. Si F es el suceso de que el miembro de la tripulación sea una mujer y S uno es el suceso de que el primer contacto ocurrió en la primera temporada, queremos hallar la probabilidad de S uno intersección F. Recuerda, eso simplemente significa S uno y F. Así que comencemos por hallar el número de primeros contactos hechos en la primera temporada por una mujer miembro del equipo. Eso es 16. El número total de primeros contactos realizados sigue siendo 72. Por lo tanto, la probabilidad de que el primer contacto fuera en la primera temporada y lo hiciera una tripulante es 16 dividido por 72. Eso es 0.2 periódico, que es 0.222 correcto a tres cifras decimales.
Veamos ahora la tercera parte de esta cuestión.
Sabiendo que el primer contacto con una especie alienígena elegida al azar se hizo en la primera temporada, halla la probabilidad de que una mujer miembro de la tripulación hiciera el primer contacto. Da la respuesta con tres cifras decimales.
Esta frase «sabiendo que» es realmente útil porque nos dice que estamos trabajando con probabilidad condicional. Y podemos reducir nuestro conjunto de datos. Nos dicen que el primer contacto con una especie alienígena elegida al azar se hizo en la primera temporada. Así que reducimos los datos a los resultados de la primera temporada. Usamos esta línea vertical para representar «sabiendo eso». Y vemos que queremos hallar la probabilidad de que el primer contacto lo haya hecho una miembro de la tripulación sabiendo que sucedió en la primera temporada.
En la primera temporada, 16 mujeres miembros de la tripulación hicieron el primer contacto. Eso es de un total de 28. Así que la probabilidad de que esto suceda es 16 dividido por 28, que es 0.5714 y así sucesivamente. Correcto a tres cifras decimales, eso es 0.571.
Veamos ahora la cuarta y última parte de esta cuestión.
¿Son independientes el suceso S uno, que el primer contacto fuera realizado en la primera temporada, y el suceso que fuera realizado por mujeres?
Recuerda, dos sucesos son independientes si uno de ellos no afecta la probabilidad de que ocurra el otro. Y, aunque probablemente aquí podríamos usar un poco de sentido común, hay varias fórmulas que podemos usar. La primera fórmula es para dos sucesos A y B. Y dice que, si estos sucesos son independientes, entonces la probabilidad de A intersección B es igual a la probabilidad de A multiplicada por la probabilidad de B. En otras palabras, la probabilidad de A y B será igual al producto de sus dos probabilidades respectivas.
Alternativamente, podemos usar que, si dos sucesos A y B son independientes, entonces la probabilidad de que ocurra A dado B es igual a la probabilidad de A. Por lo tanto, podemos decir que, si nuestros sucesos son independientes, la probabilidad de que el miembro de la tripulación sea una mujer sabiendo que el primer contacto se realiza en la primera temporada es igual a la probabilidad de que sea una mujer. Veamos si esto es cierto.
Hemos calculado anteriormente en el video que la probabilidad de que sea una mujer sabiendo que el primer contacto se hizo en la primera temporada es de 0.571. Y calculamos que la probabilidad de que fuera realizado por una mujer en cualquier temporada era de 0.514. Y, bueno, estos dos números no son iguales. Así que podemos decir que no, que estos sucesos no son independientes. Y de manera similar, podemos usar la otra fórmula. Ya hemos calculado la probabilidad de que fueran mujeres. Y que el primer contacto fuera en la primera temporada y vale 0.222.
También calculamos que la probabilidad de que el primer contacto fuera realizado por mujeres es de 0.514. Y podemos calcular fácilmente la probabilidad de que el primer contacto se hiciera en la primera temporada. Sería 28 dividido por 72; eso es 0.389. Y si hallamos el producto 𝑃 de F por 𝑃 de S uno, obtenemos 0.199. Que no es igual a 0.222. Así que hemos demostrado, de una forma alternativa, que estos sucesos no son independientes.
En este video, hemos aprendido que las tablas de doble entrada sirven para organizar datos bivariados, es decir, datos con dos magnitudes que pueden variar. Hemos visto que podemos calcular probabilidades condicionadas leyendo datos directamente de una tabla de doble entrada. Y el uso de la frase «sabiendo que» es una indicación de que debemos reducir nuestros resultados a una parte de la tabla. Finalmente, hemos visto que para dos sucesos A y B, podemos determinar si son independientes si la probabilidad de A dado B es igual a la probabilidad de A. Si esto no es cierto significa que A y B son sucesos dependientes.