Multivariate Normal Distribution¶

Time series model¶

a specification of the joint distribution of ${z_{𝑡}}$

Gaussian time series model¶

p (z_{1}, z_{2}, \dots, z_{T}) = N (μ, Σ) .

probability density:

p (z; μ, Σ) = {(2 π)}^{- (\frac{T}{2})} det {(Σ)}^{- \frac{1}{2}} \exp (- .5 {(z - μ)}^{'} Σ^{- 1} (z - μ))

where $μ = E z$ is the mean of the random vector $z$
and $Σ = E (z - μ) {(z - μ)}^{'} = cov (z)$ is the covariance matrix of $z$

Building Gaussian time series models¶

Gaussian innovations ${ε_{𝑡}}$ :

p (ε_{1}, ε_{2}, \dots, ε_{T}) = p (ε) = N (0, σ^{2} I) .

affine transformation $ε \to z$

z = μ + A ε \sim N (μ, Σ)

where

Σ = σ^{2} A A^{'}

General result¶

z \sim N (μ, Σ)

affine transformation $z \to y$

y = d + B z \sim N (d + B μ, B Σ B^{'})

The joint, marginal and conditional distributions¶

Joint¶

p (\underset{z_{1}}{\underset{⏟}{z_{1}, z_{2}, \dots, z_{k}}}, \underset{z_{2}}{\underset{⏟}{z_{k + 1}, z_{k + 2}, \dots, z_{T}}}) = p (z_{1}, z_{2}) \sim N (μ, Σ) .

with:

\begin{array}{r} μ = [\begin{array}{c} μ_{1} \\ μ_{2} \end{array}] and Σ = [\begin{array}{c} Σ_{11} & Σ_{12} \\ Σ_{21} & Σ_{22} \end{array}], where Σ_{21} = Σ_{12}^{^{'}} \end{array}

Marginal¶

\begin{array}{r} p (z_{1}) = \int_{z_{2}} p (z_{1}, z_{2}) d z_{2} = N (μ_{1}, Σ_{11}) \\ p (z_{2}) = \int_{z_{1}} p (z_{1}, z_{2}) d z_{1} = N (μ_{2}, Σ_{22}) \end{array}

Conditional¶

\begin{array}{r} p (z_{1} | z_{2}) = N (\underset{E (z_{1} | z_{2})}{\underset{⏟}{μ_{1} + Σ_{12} Σ_{22}^{- 1} (z_{2} - μ_{2})}}, \underset{cov (z_{1} | z_{2})}{\underset{⏟}{Σ_{11} - Σ_{12} Σ_{22}^{- 1} Σ_{21}}}) \end{array}

Let

\begin{array}{r} Q = Σ^{- 1} = [\begin{array}{c} Q_{11} & Q_{12} \\ Q_{21} & Q_{22} \end{array}] \end{array}

Then

\begin{array}{r} \begin{aligned} E (z_{1} | z_{2}) & = μ_{1} + Q_{11}^{- 1} Q_{12} (z_{2} - μ_{2}) \\ cov (z_{1} | z_{2}) & = Q_{11}^{- 1} \end{aligned} \end{array}

$Q$ is called the precision matrix.

Independence¶

\begin{array}{r} if Σ_{12} = 0 \\ p (z_{1} | z_{2}) = N (μ_{1}, Σ_{11}) = p (z_{1}) \end{array}

If $z_{1} \sim N (μ_{1}, Σ_{11})$ and $z_{2} \sim N (μ_{2}, Σ_{22})$ are independent then

z_{1} + z_{2} \sim N (μ_{1} + μ_{2}, Σ_{11} + Σ_{22})

and

p (z_{1}, A z_{1} + B z_{2}) \sim N (μ, Σ) .

with:

\begin{array}{r} μ = [\begin{array}{c} μ_{1} \\ A μ_{1} + B μ_{2} \end{array}] and Σ = [\begin{array}{c} Σ_{11} & Σ_{11} A^{'} \\ A Σ_{11} & A Σ_{11} A^{'} + B Σ_{22} B^{'} \end{array}] \end{array}

Information¶

cov (z_{1} | z_{2}) = Σ_{11} - Σ_{12} Σ_{22}^{- 1} Σ_{21} \geq 0

stronger correlation => more information from $z_{1}$ about $z_{2}$ (and from $z_{2}$ about $z_{1}$ )

Bivariate Normal¶

p (z_{1}, z_{2}) \sim N (μ, Σ) .

where:

\begin{array}{r} μ = [\begin{array}{c} μ_{1} \\ μ_{2} \end{array}] and Σ = [\begin{array}{c} σ_{1}^{2} & ρ σ_{1} σ_{2} \\ ρ σ_{1} σ_{2} & σ_{2}^{2} \end{array}] \end{array}

\begin{array}{r} \begin{aligned} p (z_{1} | z_{2}) & = N (μ_{1} + \frac{ρ σ_{1} σ_{2}}{σ_{2}^{2}} (z_{2} - μ_{2}), σ_{1}^{2} - \frac{(ρ σ_{1} σ_{2})^{2}}{σ_{2}^{2}}) \\ = N (μ_{1} + \frac{ρ σ_{1}}{σ_{2}} (z_{2} - μ_{2}), (1 - ρ^{2}) σ_{1}^{2}) \end{aligned} \end{array}

Example: $σ_{1} = σ_{2} = 1$ , $μ_{1} = μ_{2} = 0$

case 1 $ρ = .9$

p (z_{1}) = N (0, 1)

rho=.9
sigma1 = 1
sigma2 = 1
mu1=0

mu2=0

y2 = 1

(
mu1 + (y2 - mu2)*(rho*sigma1*sigma2)/(sigma2**2), 
1 - (rho*sigma1*sigma2)**2/(sigma2**2)
)

(0.9, 0.18999999999999995)

If $z_{2} = 1$

p (z_{1} | z_{2} = 1) = N (0.9, 0.19)

Information about $z_{1}$ from observing $z_{2}$

var (z_{1}) - var (z_{1} | z_{2}) = 1 - 0.19 = 0.81

Reduction of the uncertainty about $z_{1}$ by 81%

case 2 $ρ = .1$ , $σ_{1} = σ_{2} = 1$ , $μ_{1} = μ_{2} = 0$

p (z_{1}) = N (0, 1)

rho=.1
sigma1 = 1
sigma2 = 1
mu1=0
mu2=0

y2 = 1

(
mu1 + (y2 - mu2)*(rho*sigma1*sigma2)/(sigma2**2), 
1-(rho*sigma1*sigma2)**2/(sigma2**2)
)

(0.1, 0.99)

If $z_{2} = 1$

p (z_{1} | z_{2} = 1) = N (0.1, 0.99)

Reduction of the uncertainty about $z_{1}$ by 1%

Let $z$ be jointly Gaussian, and partitioned as ( $z_{1}$ is a scalar)

z = [z_{1}, z_{2}]

\begin{array}{r} μ = [\begin{array}{c} μ_{1} \\ μ_{2} \end{array}] and Σ = [\begin{array}{c} Σ_{11} & Σ_{12} \\ Σ_{21} & Σ_{22} \end{array}] \end{array}

Then

\begin{array}{r} p (z_{1} | z_{2}) = N (\underset{β_{0}}{\underset{⏟}{μ_{1} - Σ_{12} Σ_{22}^{- 1} μ_{2}}} + \underset{β_{1}^{'}}{\underset{⏟}{Σ_{12} Σ_{22}^{- 1}}} z_{2}, \underset{σ^{2}}{\underset{⏟}{Σ_{11} - Σ_{12} Σ_{22}^{- 1} Σ_{21}}}) \end{array}

therefore,

z_{1} = β_{0} + β_{1}^{'} z_{2} + ε where ε \sim N (0, σ^{2})

Conditional (in)dependence¶

Two random variables $z_{1}$ and $z_{2}$ are conditionally independent given $z_{3}$ if

\begin{matrix} (1) & p (z_{1}, z_{2} | z_{3}) = p (z_{1} | z_{3}) p (z_{2} | z_{3}) \end{matrix}

If $z_{1}$ , $z_{2}$ and $z_{3}$ are jointly Gaussian, then (1) is true iff

{Σ^{- 1}}_{1, 2} = Q_{1, 2} = 0

More generally, $z_{i}$ and $z_{j}$ are conditionally independent given the remaining elements of $z$ (denote them with $z_{- i j}$ ) iff

Q_{i, j} = 0

And the conditional correlation between $z_{i}$ and $z_{j}$ is

corr (z_{i}, z_{j} | z_{- i j}) = - \frac{Q_{i, j}}{\sqrt{Q_{i, i} Q_{j j}}}

also known as partial correlation between $z_{i}$ and $z_{j}$

Example 1

\begin{array}{r} Q = [\begin{array}{c} 1 & - 0.4 & 0 \\ - 0.4 & 1.16 & - 0.4 \\ 0 & - 0.4 & 1 \end{array}] \end{array}

then

\begin{array}{r} Σ = [\begin{array}{c} 1.19047619 & 0.47619048 & 0.19047619 \\ 0.47619048 & 1.19047619 & 0.47619048 \\ 0.19047619 & 0.47619048 & 1.19047619 \end{array}] \end{array}

therefore, $z_{1}$ and $z_{3}$ are unconditionally dependent, but conditionally (given $z_{2}$ ) independent

Example 2

\begin{array}{r} Σ = [\begin{array}{c} 1.09 & 0.3 & 0. \\ 0.3 & 1.09 & 0.3 \\ 0 & 0.3 & 1.09 \end{array}] \end{array}

then

\begin{array}{r} Q = [\begin{array}{c} 1. & - 0.3 & 0.08 \\ - 0.3 & 1.08 & - 0.3 \\ 0.08 & - 0.3 & 1 \end{array}] \end{array}

therefore, $z_{1}$ and $z_{3}$ are unconditionally independent, but conditionally (given $z_{2}$ ) dependent

from statsmodels.tsa.arima_process import arma_acovf
from scipy.linalg import toeplitz
import numpy as np

acov1 = arma_acovf(ar=[1, -.4], ma=[1], nobs=10, sigma2=1)
Sigma1 = toeplitz(acov1)
acov2 = arma_acovf(ar=[1,], ma=[1, .3], nobs=10, sigma2=1)
Sigma2 = toeplitz(acov2)


print(np.linalg.inv(Sigma1[:3][:,:3]).round(4))
print(np.linalg.inv(Sigma2[:3][:,:3]).round(4))

[[ 1.   -0.4   0.  ]
 [-0.4   1.16 -0.4 ]
 [ 0.   -0.4   1.  ]]
[[ 0.9993 -0.2976  0.0819]
 [-0.2976  1.0812 -0.2976]
 [ 0.0819 -0.2976  0.9993]]

Missing values¶

Suppose we have a Gaussian model for $z$

z \sim N (μ, Σ)

but some elements of $z$ are not observed, i.e. we observe a vector $z_{1}$

for example

\begin{array}{r} z = [\begin{array}{c} z_{1} \\ z_{2} \\ ⋮ \\ z_{k - 1} \\ z_{k} \\ z_{k + 1} \\ ⋮ \\ z_{T - 2} \\ z_{T - 1} \\ z_{T} \end{array}], z_{1} = [\begin{array}{c} * \\ z_{2} \\ ⋮ \\ z_{k - 1} \\ * \\ z_{k + 1} \\ ⋮ \\ z_{T - 2} \\ * \\ * \end{array}] \end{array}

Some examples¶

mixed frequency
- (univariate) GDP at annual, GDP at quarterly
- (multivariate) GDP at annual, inflation at monthly
- etc.

forecasting

backcasting

unobserved (latent) variables
- state of the economy
- natural rates (interest, unemployment)
- economic shocks

observed elements $z_{1}$ , unobserved elements $z_{2}$ ¶

$z_{1}, z_{2}$ - jointly Gaussian
marginal distribution of $z_{1}$

p (z_{1}) \sim N (μ_{1}, Σ_{1})

example:

\begin{array}{r} z = [\begin{array}{c} z_{1} \\ z_{2} \\ z_{3} \end{array}], z_{1} = [\begin{array}{c} z_{1} \\ z_{3} \end{array}], z_{2} = [\begin{array}{c} z_{2} \end{array}] \end{array}

\begin{array}{r} z_{1} = [\begin{array}{c} 1 & 0 & 0 \\ 0 & 0 & 1 \end{array}] [\begin{array}{c} z_{1} \\ z_{2} \\ z_{3} \end{array}] = B_{1} z \end{array}

\begin{array}{r} z_{2} = [\begin{array}{c} 0 & 1 & 0 \end{array}] [\begin{array}{c} z_{1} \\ z_{2} \\ z_{3} \end{array}] = B_{2} z \end{array}

conditional distribution of $z_{2}$ given $z_{1}$

p (z_{2} | z_{1}) = N (\underset{E (z_{2} | z_{1})}{\underset{⏟}{μ_{2} + Σ_{21} Σ_{11}^{- 1} (z_{1} - μ_{1})}}, \underset{cov (z_{2} | z_{1})}{\underset{⏟}{Σ_{22} - Σ_{21} Σ_{11}^{- 1} Σ_{12}}})

if $z_{1}$ is the past and $z_{2}$ is the future,

$E (z_{2} | z_{1})$ - optimal forecast of $z_{2}$ given $z_{1}$
$cov (z_{2} | z_{1})$ - variance of the optimal forecast

where optimality is in the sense of minimizing the MSE

in general, $E (z_{2} | z_{1})$ is our best guess of $z_{2}$ given $z_{1}$ , and $cov (z_{2} | z_{1})$ is the associated uncertainty

Multivariate Normal Distribution

Contents