• En este post, pensando y viendo como horizonte el llegar a entender algún día todo lo que se refiera a estadística Bayesiana no paramétrica donde intervienen cosas como un Proceso Gaussiano o un Proceso de Dirichlet, veremos el Proceso del Restaurant Chino, o en inglés The Chinese Restaurant Process que es el primer peldaño, según se ve y he leído, para entender la idea de los procesos anteriormente mencionados.

    El dato freak: El motivo por el cual recibe el nombre es por los Restaurantes de comida China en San Francisco EE.UU parecieran que tienen infinita capacidad.

    La idea del Proceso del Restauran Chino (CRP de su sigla en inglés) es particionar (partición: una familia de conjuntos que son disjuntos entre si y que cubren todo el espacio en el cual se está trabajando) aleatoriamente los enteros positivos. El proceso estocástico que se describe como sigue:

    Imagínese un Restaurant (Chino!) que posee una cantidad infinita numerable de mesas etiquetadas por los número enteros positivos, id est, 1,2,3… En donde llegan clientes, los cuales escogen una mesa para sentarse de la siguiente manera:

    1. El primer cliente escoge siempre la primera mesa (mesa 1).
    2. El n-ésimo cliente que llega ocupa la primera mesa desocupada con probabilidad proporcional a un parámetro α del proceso y escoge la i-ésima mesa ocupada con probabilidad proporcional a mi, donde mi es el número de clientes ya sentados en la mesa i. Así:

       \Pr\{ \text{enesimo cliente ocupe una nueva mesa}  \} = \frac{\alpha}{n-1+\alpha},
       \Pr\{ \text{enesimo cliente ocupe la mesa}\, i  \} = \frac{m_i}{n-1+\alpha}

    En esta forma de representar el proceso, se ve de foma más clara que la realización del proceso deará como resultado un particionamiento aleatorio de los enteros positivos. Los conjuntos de la partición serán representados por las mesas y los elementos los clientes, cada cliente representa un número. El CRP es una distribución sobre las particiones de los números enteros positivos.

    El parámetro α es propio del proceso, si α es grande el proceso tenderá a generar más particiones, al contrario si α es pequeño ya que la probabilidad de crear una nueva partición será cada vez menor y rápidamente esta probabilidad tenderá a cero. Otra cosa que se debe notar es que la probabilidad a que un cliente tome una mesa en particular será proporcional a la cantidad de clientes en tal mesa, esto hace que el proceso genere pocas mesas con muchos clientes y muchas mesas con pocos clientes.

    Notemos que si acotamos el número de clientes, por ejemplo a M, el proceso podrá generar hasta M conjuntos. De esta forma el proceso servirá para (imaginando que observamos M datos) representar la incertidumbre sobre el número, la forma y estructura de componentes en un Modelo de Mezcla por ejemplo, como lo veremos más adelante cuando veamos el Proceso de Dirichlet y la Mezcla del Proceso de Dirichlet.