sábado, 11 de marzo de 2017

2.7 La regla de bayes




La Regla de Bayes

En la base de todos los métodos y técnicas bayesianas se encuentra la regla de Bayes, una fórmula sencilla que sin embargo no voy a escribir. La fórmula debe su nombre a  Thomas Bayes, un clérigo presbiteriano y, aún más importante para lo que nos ocupa, miembro de la Royal Society. Su trabajo, junto con el de La place, asentó los cimientos de la estadística bayesiana.

La regla de Bayes suele utilizarse con dos fines diferentes. Por un lado permite actualizar nuestras "creencias" o experiencia previa a la luz de nuevos datos o información. Este sería el caso, por ejemplo, de el análisis de si un juego de azar está o no trucado: tras recoger los resultados de varias partidas podemos corregir nuestros prejuicios. En otras ocasiones se usa para invertir los papeles de la variable aleatoria y el suceso que la condiciona. Este es el caso que se mencionaba al final de la ultima entrada.

La fórmula tiene tres ingredientes, a saber,
  • La probabilidad a priori de que suceda algo o, abusando bastante del lenguaje, prior a secas. Este valor se obtiene típicamente cuantificando nuestros prejuicios aunque en muchas ocasiones puede estimarse mediante otros métodos.

  • La verosimilitud de los datos, esto es, la probabilidad de que se den los datos bajo el supuesto de que la hipótesis es verdadera.
  • La evidencia de los datos o, dicho en otras palabras, la probabilidad de que se hayan dado los datos que efectivamente se han dado no solo bajo la hipótesis considerada, sino también sobre cualquier otra. Este valor es normalmente costoso y difícil de calcular por lo que, aprovechando que es un factor que no depende de la hipótesis que analizamos, suele omitirse.

El resultado que se obtiene es la probabilidad de que la hipótesis sea cierta una vez se tienen en cuenta los datos. A este valor se le denomina probabilidad a posteriorio, nuevamente abusando del lenguaje, posterior.

Para aclarar un poco todo lo anterior vamos a repasar lo dicho sobre un ejemplo típicamente académico. Aquellos interesados en entender el significado de los conceptos arriba presentados pueden leérselo sin pararse en los números concretos. Proponemos el siguiente experimento.

Ejemplo
  • Tenemos dos urnas con bolas. La primera contiene dos bolas blancas y siete negras, mientras que la segunda contiene cuatro blancas y una negra.

  • Tiramos un dado: si sale 1, 2, 3 o 4 escogemos la primera urna y si sale 5 o 6 nos quedamos con la segunda.

  • Sacamos una bola al azar de la urna seleccionada.
Ahora realizamos el experimento, sacamos una bola blanca y nos preguntamos por cuál es la probabilidad de que haya salido de la primera urna. Parece que la pregunta que podemos responder fácilmente es la "inversa", esto es, cómo de verosímil es que salga bola blanca de la primera urna. Esa probabilidad es de 2 /10. El valor de la probabilidad a priori (antes de sacar la bola) también es sencillo de calcular, 4 / 6, según las reglas para seleccionar la caja que hemos conocemos.

El último número que tenemos que calcular es la denominada evidencia de los datos, la probabilidad de que saquemos una bola blanca independientemente de qué caja salga. Como ya adelantamos antes este valor es el más difícil de calcular; aquí nos limitaremos a indicar que el que saquemos la bola de una u otra urna son sucesos independientes y de que por lo tanto la probabilidad detrás de la que andamos es la suma de las probabilidades de que salga de una u otra urna convenientemente ponderadas. Con dos multiplicaciones y una suma obtenemos que la evidencia de los datos es de 2 / 5.

Una vez se combinan estos tres valores en la regla de Bayes se obtiene que la probabilidad de que hayamos extraído la bola de la primera urna sabiendo que era de color blanco, 1 / 3 exactamente. Nótese que antes de sacar la bola esperábamos que en cuatro de cada seis ocasiones la bola saliese de la primera urna pero que al realizar el experimento y obtener un suceso poco probable bajo nuestra hipótesis la probabilidad a priori baja sensiblemente.


La regla de Bayes es un caso especial de la probabilidad condicional que se aplica cuando se desea calcular la probabilidad condicional de un evento que ocurrió primero dado lo que ocurrió después. Para llegar a establecer tan útil regla vamos a estudiar una proposición previa.








Referencias

athlas. (2015). la regla de bayes. 2015, de 2013 Sitio web: http://www.mathlas.com/index.php/component/k2/item/21-regla_de_bayes/21-regla_de_bayes
522 for ever. (2009). Regla de Bayes. 2009, de 522 for ever Sitio web: http://probabilidadcecyte.blogspot.mx/2009/01/ley-de-bayes.html

No hay comentarios:

Publicar un comentario