Python での VAR モデル構築の「一般的な」例を再現しようとしています/失敗していますが、Granger Causality テストで行き詰っています。提供されたデータセットとコードを使用していますが、次のエラーが発生しています。ここで何が起こっているのか理解できたと思われる場合は、お知らせいただきありがとうございます。一番
ファイル "/Applications/anaconda3/lib/python3.8/site-packages/statsmodels/tsa/tsatools.py"、524 行目、lagmat2ds で ValueError('Only supports 1 and 2-dimensional data.') を発生させる ValueError: Only supports 1 次元および 2 次元データ。
完全なコードを以下に示します。元のチュートリアルはこちら
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
# Import Statsmodels
from statsmodels.tsa.api import VAR
from statsmodels.tsa.stattools import adfuller
from statsmodels.tools.eval_measures import rmse, aicfrom
filepath = 'https://raw.githubusercontent.com/selva86/datasets/master/Raotbl6.csv'
df = pd.read_csv(filepath, parse_dates=['date'],
index_col='date')
print(df.shape) # (123, 8)
df.tail()
from statsmodels.tsa.stattools import grangercausalitytests
maxlag=12
test = 'ssr_chi2test'
def grangers_causation_matrix(data, variables,
test='ssr_chi2test', verbose=False):
"""Check Granger Causality of all possible combinations of
the Time series.
The rows are the response variable, columns are predictors.
The values in the table
are the P-Values. P-Values lesser than the significance
level (0.05), implies
the Null Hypothesis that the coefficients of the
corresponding past values is
zero, that is, the X does not cause Y can be rejected.
data : pandas dataframe containing the time series
variables
variables : list containing names of the time series
variables.
"""
df = pd.DataFrame(np.zeros((len(variables),
len(variables))), columns=variables, index=variables)
for c in df.columns:
for r in df.index:
test_result = grangercausalitytests(data[[r, c]],
maxlag=maxlag, verbose=False)
p_values = [round(test_result[i+1][0][test][1],4) for i in
range(maxlag)]
if verbose: print(f'Y = {r}, X = {c}, P Values =
{p_values}')
min_p_value = np.min(p_values)
df.loc[r, c] = min_p_value
df.columns = [var + '_x' for var in variables]
df.index = [var + '_y' for var in variables]
return df
grangers_causation_matrix(df, variables = df.columns)