Does logp of a variable include its prior?

shkr · April 14, 2018, 10:07pm

I have a reference notebook for this question.

shkr/pymc3/blob/sgfs_gmm/docs/source/notebooks/stochastic-sampling-for-hierarchichal-models.ipynb

{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "# Generate mixture data"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 258,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "image/png": "iVBORw0KGgoAAAANSUhEUgAAAXwAAAD8CAYAAAB0IB+mAAAABHNCSVQICAgIfAhkiAAAAAlwSFlz\nAAALEgAACxIB0t1+/AAAADl0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uIDIuMS4wLCBo\ndHRwOi8vbWF0cGxvdGxpYi5vcmcvpW3flQAAIABJREFUeJzt3Xl8VNX5+PHPc2fNnkDCTiAIiIAC\ngixuuCtWitqqWHfb4q7tT791a7WttVqtVq3aFpW6tIq4o7a4FlcUAVF2CXsgQJAlJJn9nt8fEwJJ\nJiQhmZkk87xfr7xI7naemzDPnDn3LGKMQSmlVMdnJTsApZRSiaEJXymlUoQmfKWUShGa8JVSKkVo\nwldKqRShCV8ppVKEJnyllEoRmvCVUipFaMJXSqkU4Ux2APvKz883ffv2TXYYSinVrsyfP3+bMaag\nsePaVMLv27cv8+bNS3YYSinVrojIuqYcp006SimVIjThK6VUitCEr5RSKSLuCV9EckXkZRFZLiLL\nRGRcvMtUSilVXyIe2j4MzDLG/FhE3EB6AspUSnUgFTsrcbqdeNM9yQ6lXYtrwheRHOBY4FIAY0wQ\nCMazTNWwiG0zc8VyXl62GEE4Z8hQJg4chCWS7NCUimn53JX8+fLHKVlZiogwesIIbnzqKrI7ZSU7\ntHZJ4rnilYgMB6YCS4FhwHzgBmNMZazjR40aZbRbZnwYY7jirTf4bMN6fOEQAOlOF8cXFfHXCROT\nHJ1S9W3dsI2fDfklvgp/zTany0HRoX147Kt7Ea2o1BCR+caYUY0dF+82fCdwOPA3Y8wIoBK4Zd8D\nRGSKiMwTkXllZWVxDid1fbVpI5/vk+wBqsIhPlyzmm82lyYxMqVie+vv7xIOhmttC4cibFixke/m\nrUpSVO1bvBN+CVBijPmy+ueXib4B1DDGTDXGjDLGjCooaHSgmDpAX5RsqJXs9whGIswp2ZCEiFSq\ni4QjTP/T61xQdBU/6nI59136KNs2fl+zf93SEkJ1Ej6AZVlsXrM1kaF2GHFN+MaYzcAGETm4etOJ\nRJt3VILler14HPUf2bgcDtwORxIiUqnu3ose4V93vcTWddso37abD5//hKtH3UzFzmiL75CjBuFJ\nc9c7LxwKc9DwvgmOtmNIRD/864B/i8i3wHDgjwkoU9VxxsCDidXk6Q+HuffTj7ng1RmUVcV8tKJU\nq9tYXMrnM+cRqNrbhyMStqkq9/GfJz8AYMJPTyA9Ow3LsTdNedLcjPnB4fQa2CPhMXcEcU/4xpiF\n1U02hxljzjTG7Ih3maq+nX4/7hg1fICwsflqYwkXvfoS8XyIr9QexV+vxemq/8ky4Auy+NNlAGTl\nZfL4vD9xwk+OJisvk/xenTn/trO57flfJDrcDqNNTZ6m4sMYw8/efI3ygL/BY8LGsHrHDv5bvIKi\n3E70zM4m2+PFrn4DmPb1fP65cAG7gwHG9OzN9aPHYonQLTOLzuk6tEI1T7eiLtgRu952p9tB74N7\n1vyc37MzNz9zXSJD69A04aeA4u3b2VJRQWN197Cxufa/b5PudBGIhHFaFoFIhCy3m0A4TNCOvkA/\nWLOKD9asIt3lImzbTDhoAPeedCoep/53Uk0zcGQ/eh/ckzWL1hEORWq22xFD0aG9kxhZx6Zz6aQA\nfySMJU3/U1eFQ0SMIRCJvhB3B4M1yb7WcaEQwUiEd1YX84dPZrdWuCoFiAj3vvNrhh8/tNZ2O2Lz\n0JVP8Oojbycpso5NE34KOCS/AJcjfn9qfzjMS0sWEYpEGj9YqWrZnbPof3gRTnfttvxAVYC//79n\nuOeCh1m5YHWTrrVm0TpuPuUuzsi4gMm9pjDj/jewY1RSUp0m/BTgtCweOGUCaU4nLiv6J3dbrfun\nD9o2q3ds57GvvmDS9H9x6Ruv8L+1TXuxqtT11ayFhIP1KwrGNnw4/VN+ecxvmP3iZ/u9RunqLdxw\n9K9Z8P63BHxBvt+0g2d/N4O/XvtUvMJut+I6tUJz6dQK8bV+105mLFnE5ooKji7sw/2ff0JpRUWr\nXT/X48EXjhCIRAfLpDldXDXqCK4drROkprry7bv58q0FRCI2Y04fQV7XXABuP+Me5v5nwX7PzchN\n5+UtT+F0xX5G9NCVU5k17QMi4do1erfXxb/X/Y3cgpzWuYk2rKlTK+hTthRSmJPLTUceU/Pzup07\neWTunEYf5jbVrkCg1rV84RCPffUlFxw6nLy0tFYqRSVC0B9kxp9n8u4zszG24cQLj+W8X00iLcPb\n7Gt99NIc7rv0URwOC2MMf73G5uqHL+MHPz+Zc26cyDezlxCoCjR4vh2xWbtkA/2HF8Xcv+Kr4nrJ\nHsDlcVHyXWlKJPym0iadFJbmcuFspGnHEmFQ53wyXK5GrxfrjcPtcPDNls0HGKFKBmMMN59yFy/c\n8xqlq7awec1WXrr/DW487k4izXxOs2PrLu679FGCviC+Cj/+ygBBf4jHf/E0m1ZtZvjxQ7nygYvx\nZnprDbDaVyQUITM3o8Ey+gzpjWXVH1UY9IfoVtSlWfF2dJrwU9jJB/VvdGrkEd26k+Zy0Ss7e7/H\nNXSViDF00tp9u/LN7CUUL1xL0Ld3FGzQH6JkxSbmzVrYrGt99trcmLNaRkJh7j7/Ia4e9SuWfbGS\nBz/6HZfdfT7uOlMpWA6LfsP60q1vw4n7vF9NwuWtfZ47zcW4iSPJ79GpWfF2dJrwU1hRbh7XN9K+\n/nXpJr7eXMqK77/f73GxaveWCN0yMjm0S9cWRKkSbfncYkL++stW+Cr8LJ9bDEAwEOLpO6ZzXs8p\nnJ1/Gfdf/hjbN9cfRB8KhDAxestEwjYr569m5YI1vP+vj/nl0b8hMzedMT84HJfHRUZOOt4MD30G\n9+K3r/7ffuMtGlrI3W/fSp/BvbAcFp40NxMuP5Gbn7v+AH8DHZe24ae4q44Yw7urixtsdjmQjm1p\n1QOweufk8tTEs3Te8namS+/OuL3uWvPQA3gzPBT0zgfgjkl/YtHHSwn6ozOwfvCvT1jw3rdMW/YQ\naZl7P9GNPWMkT97yr5jl7OkwYkdsAr4gj1z9JGmZXowxDD9hKBf++sccNLxvk/7/DBs/hCcX/4WA\nL4DT7cShEwLGpDV8xRUjR+NpxguksWNP7HcQb0y+kFkXXELPRpqCVNtz1FmjcXvd9RKt0+XkuPOO\npHjhGhZ/urwm2UN0quOKnZW8/69Pap3TvV9Xzr/1rIbb/PZhbENVuY9wMMz8d7+h5LtNza4seNI8\nmuz3QxO+4tSD+vPjwUPxOBw1Xw0R4MZxR3NsYd+Y0yo7ROidnUP/Tp3jGLGKJ0+ahwc//j39DuuD\ny+PC5XXRZ3AvHvzod6RnpVH89drYM69WBlg6Z0WtbaFgCKfbidXMcR/+ygAv3vcGU3/1HHdM+hMz\n/jyzZtrkfW3btJ3n//gqf7niH3z4/CeEgvXXfFB7aT98VWPNzh3MLdnAf4tX8vH6tTGPyXK7+ebK\n69jh83HUP6fiD9deoMLrdPLaeRdwcOf8BESs4u370h0Y2ya/Z2fWLtnAyw++ybIvV7JpZWmtOXAg\n2u/9ojvOYfItZwHgq/Bxw1G/ZmPx5loPgJtKRHA4HYRDYTxpbtJz0vnb/Pvo3D0PgMWfLuPWCXdj\nR2yC/hBpmV669Cngkc/vJj0rtToKtJUlDlU7UpSbx9mHDGH+po0NHjOwcwHGGPLS0njw5Al4HE7S\nXS68Ticeh4NfjjlSk30H0rl7Hvk9O/P1h4u4dsytvPfsR6xfWlIv2QM43U5OvfyEmp9f+ctbbFxZ\nut9k7/I0/BjRGEM4FK1QBHxByrft5uk7prNuWQmfvT6Xu859sKabJ0QfKpeu2sxLD8w80Nvt8LSG\nr2op3b2bE5+bVq/mvofX4eC2Y47jwsOGA7DD5+O91cWEbJvj+xbRI0vb7DsaYwyXDLiO0tVb6u0T\nESyHRd+hvblp2tW1Bkf9dMgvWL8sduXBne6mZ/9uXPnAJZRt+J6/XvskoUAYO2LjTnM3+CbhdDmw\nnA4cDqveQ+U9eg7oztMrHjmAO22/2sxIWxFxAPOAjcaYM+JdnmqZTmlp+32+5o9E+OvcL2oSfl5a\nGucOOTQxwamkqNhZSVlJ7G656Tlp/Hvt38jIrr8mQqzlCSHat/5nf7yAiVedUjNdwsFH9Gfm47PY\nun4bh40fwj9vfz7mp4hwKAIxtu/L7W18kGCqSkSTzg3AsgSUo1qBx+nkkmEjarpWxlJWVakrY6UQ\nT5o75kNagKzczJjJHuCMK07Bm+GptU0soc/gXpx1/em15sbpO6Q31z/2c/7w5q2ce9MPGXnKsJgr\nYjVF6eotLP5s+QGd29HFNeGLSC/gB8CT8SxHta6bjjyGK0Ye0WBNvzAnR/vWpxC3182xPx6Hy1O7\n5uxJ93DWDac3eN5pPz2BIycdgSfNjTfDQ3pWGp265XLnKzc1Wub//fMa+gzpXXNec2rt/soAt51+\nN5XlVU0+J1XEtQ1fRF4G7gGygJtiNemIyBRgCkBhYeHIdevWxS0e1TzvrSrm+llv1SyEAtFeOA+e\nMoHT+g9MYmQq0XwVPn5/zgN8+9FSXB4XQX+IUy87nuse/WmjXS7XLSth6ecr6NQ9j1GnDM

This file has been truncated. show original

As you can see I have a hierarchical model, where a Dirichlet process is the prior for a weight distribution of a gaussian mixture model.

When I calculate the gradient of logp_elemwiset wrt beta, it returns me a value independent of the alpha value.

This is a bit puzzling, because if as listed here https://docs.pymc.io/theano.html in the section “How pymc3 uses Theano?”, the logp value of a variable includes its prior. Then the prior of the beta logp value is a function of alpha. In this model, alpha is a free rv, so beta.logp should return a missing input error.

Even if beta is specified, the prior logP(beta), in logp(beta) as defined by:
logP(Data|beta)+logP(beta)=:logp(beta)
It is a function of alpha.

Can someone explain what value of alpha is being assumed under the hood?

junpenglao · April 15, 2018, 6:47am

My understanding is that, it does not include its prior. As the logp function of a single RV (element-wise or not) is \pi(y \mid \theta) that depends on only its immediate input \theta, if \theta follows some distribution \theta \sim \pi(\theta \mid \gamma) you need to express that in \pi (y \mid \theta) also.

From the computation perspective in PyMC3, as shown in the doc (small rewrite for clarity):

# For illustration only, those functions don't actually exist
# in exactly this way!
model = pm.Model()

mu = tt.scalar('mu')
mu2 = tt.scalar('mu2')
# model.add_free_variable(mu)
logp_mu = pm.Normal.dist(0, 1).logp(mu)
logp_mu2 = pm.Normal.dist(mu, 1).logp(mu2)
logp_obs = pm.Normal.dist(mu2, 1).logp(data)

as you can see, logp_obs is only depends on mu2, which is a theano scaler. You can not take gradient of logp_obs wrt mu, unless you chain the logp together by doing logp_mu2+logp_obs. It is different than say mu2 = function(mu).
Another way to think of it: priors are regulations, just like regulations if you want to regulate something you need to add the regulation terms to your loss function. Same here, if you want to take the gradient of the parameters that specify the regulation (for optimization), you need to add the regulation (priors) to the loss function (logp) first.

Topic		Replies	Views
Log-scale transform v5 development , theano , prior , modeling , pytensor	16	682	July 18, 2023
Compute the KL divergence between two distributions Questions	12	2596	August 13, 2018
How to differentiate (Auto-diff) from log likelihood in pymc3 Questions	1	297	September 3, 2022
Meaning of model.logp, a beginner question Questions	4	962	July 12, 2019
How to access the logp function of a normal mixture? Questions	7	1011	January 9, 2020

Does logp of a variable include its prior?

Related topics