27 nov 2009

El teorema de Bayes y las 3 puertas

Que conste que no entiendo de probabilidad, aunque la curiosidad me está haciendo aprender bastante, a golpe de pensar y deducir.

El otro día volvió a surgir el tema de volver a jugar el mismo número en la lotería, ya que un compañero había ido a un curso, les había planteado el problema de las 3 puertas y el Teorema de Bayes, y lo había equiparado al problema de la lotería comentado en el anterior artículo. La mujer no podía estar más equivocada, ya que los planteamientos no tienen nada que ver.

¿En qué consiste el problema de las 3 puertas? Supongamos que vamos a un concurso de televisión, en el que un presentador nos da a elegir entre 3 puertas. Una de ellas contiene un premio, y las otras dos están vacías. Tras elegir una puerta, el presentador abrirá una de las otras dos, para mostrarnos que no está premiada, y a continuación nos ofrece la posibilidad de cambiar nuestra elección. ¿Tiene sentido en este caso cambiar la puerta elegida? La respuesta es SI. Es más, las probabilidades de ganar siguiendo esta estrategia son mayores que si únicamente hubiera 2 puertas, es decir, superiores al 50%.

La teoría es aplicación directa del Teorema de Bayés, que nos dice la probabilidad a posteriori, es decir, sabiendo que ha ocurrido un suceso. Para entenderlo con detalle, vamos a desglosar todos los casos posibles.

Vamos a suponer primero que elegimos una estrategia de cambiar siempre nuestra elección inicial:
  • Hay un 1/3 de probabilidad de elegir inicialmente la puerta con el premio. Las otras dos puertas estarán vacías, y por tanto al abrir una y cambiar nuestra elección, perdemos.
  • Sin embargo, hay 2/3 de probabilidad de elegir una puerta vacía. El presentador abrirá la otra puerta vacía con el 100% de probabilidad, y al cambiar la elección, ganaremos.
Como se ve claramente, las probabilidades de ganar con esta estrategia son de 2/3 (un 66% aproximadamente).

Sin embargo, si elegimos la estrategia de no cambiar nuestra elección inicial:
  • Hay 1/3 de probabilidades de elegir inicialmente la puerta premiada. Como no vamos a cambiar nuestra elección, ganaremos con 1/3 de probabilidad.
  • Hay 2/3 de probabilidades de elegir una puerta vacía. Como no vamos a cambiar, perderemos con 2/3 de probabilidad.
Con esta estrategia, las posibilidades de acierto son de 1/3, es decir, aproximadamente un 33%.


Otra forma de simplificar el problema y verlo más claro: realmente es como si eligiéramos 2 puertas, y no una. Al elegir una puerta y luego poder cambiar, lo que estamos haciendo es descartarla y quedarnos con las otras dos puertas. De estas dos puertas, una es seguro que no tiene premio, y el presentador se encargará de eliminarla. Por tanto, si cualquiera de estas 2 puertas tenía el premio, habremos ganado.

La cosa varía si cambiamos el planteamiento. Supongamos ahora que tras elegir una puerta, el presentador simplemente abre al azar una de las otras dos puertas. Si la puerta no es la que contiene el premio, nos da posibilidad de cambiar. En otro caso hemos perdido. ¿Qué ocurre aquí con la estrategia de cambiar nuestra elección?:
  • Hay un 1/3 de probabilidad de elegir inicialmente la puerta con el premio. Abra la que abra el presentador, resultará vacía. Al elegir la otra, también vacía, perderemos.
  • Sin embargo, hay 2/3 de probabilidad de elegir una puerta vacía. Pero...
    • Hay un 50% de probabilidad de que el presentador abra directamente la puerta con el premio, por lo que hemos perdido...
    • Y hay otro 50% de probabilidad de que el presentador abra la puerta vacía... cambiamos la elección, y hemos ganado.
En este caso, al haber dos posibilidades de 50% (azar puro) cuando elijamos inicialmente la puerta vacía, al final seguimos teniendo 1/3 de probabilidad de ganar. En este caso, no existe el condicionante de que el presentador va a abrir una puerta que sabe que está vacía, y por tanto nada cambia. Igual daría que el presentador elija la segunda puerta a abrir, o que la elijamos nosotros. Sería también equivalente a descartar una puerta cualquiera, y luego descartar otra también al azar. Al final tenemos 1/3 de probabilidades de llevarnos el premio.


¿Es este problema comparable al de la lotería? No tienen nada que ver. Probabilísticamente sería comparable al siguiente caso, llevado el extremo:
  • Sale un número del bombo de la lotería, y sólo una persona lo sabe. Lo anota en un papel, y vuelve a meter la bola en el bombo (el presentador sabe qué puerta es la buena, pero se guarda la información).
  • Elegimos un número entre los 80.000 posibles, y se lo decimos a esa persona. Ahora esa persona saca del bombo todos los números menos el elegido por nosotros, y el que sabe que está premiado (el presentador abre la puerta no premiada).
  • Finalmente nos deja elegir entre quedarnos con el número elegido, o con la otra bola del bombo. Si el número que elegimos es el que se había escrito en el papel, ganamos la lotería.
En este caso, ¿qué es más probable?
  • Que casualmente hayamos elegido el número que la persona había sacado al azar (1/80.000)
  • Que hayamos elegido un número que no está en el papel, pero que no se ha quitado del bombo por el hecho de ser nuestro elegido. (79.999/80.000).
Como decía, es el caso llevado al extremo. En el caso de las puertas, tenemos 1/3 y 2/3, y en este otro caso con los números, tenemos 1/80.000 y 79.999/80.000. Da qué pensar...

No hay comentarios:

Publicar un comentario