Source code for eagpytorch._base_ApproximateGP

#!/usr/bin/env python3

__all__ = [
    "ApproximateGPModel",
    "RunApproximateGP"
]

from random import seed

from gpytorch.distributions import MultivariateNormal
from gpytorch.means import ConstantMean
from gpytorch.mlls import (
    GammaRobustVariationalELBO,
    PredictiveLogLikelihood,
    VariationalELBO
)
from gpytorch.models import ApproximateGP
from gpytorch.variational import CholeskyVariationalDistribution
from gpytorch.variational import VariationalStrategy
from numpy.random import seed as nseed
from numpy import (
    mean,
    ndarray
)
from torch import (
    manual_seed,
    no_grad,
    randperm
)
from torch.optim import (
    Adadelta,
    Adagrad,
    Adam,
    RMSprop,
    SGD
)
from torch.utils.data import TensorDataset, DataLoader

from ._const import (
    # likelihoods
    bernoullilikelihood,
    gaussianlikelihood,
    poissonlikelihood,
    # mlls
    gammarobustvariationalelbo,
    predictiveloglikelihood,
    variationalelbo,
    # optimizers
    adadelta,
    adagrad,
    adam,
    rmsprop,
    sgd
)
from ._likelihoods import (
    PoissonLikelihood,
    GaussianLikelihood,
    BernoulliLikelihood
)
from .utils import (
    array_to_tensor,
    check_device,
    load_model,
    plot_kernel,
    save_model,
    set_kernel,
    _predict_obj,
    _sample_f
)


[docs]class ApproximateGPModel(ApproximateGP):
    """ApproximateGP用のモデル定義クラス

    Parameters
    ----------
    inducing_points : torch.tensor
        補助変数の座標

        `learn_inducing_locations=True` である以上、ここで指定する補助変数は更新される
    ex_var_dim : int
        説明変数の個数

        `ex_var_dim=None` を指定すると計算は速くなるものの、説明変数間の重みの縮退はとけない。
    kernel : str or :obj:`gpytorch.kernels`
        使用するカーネル関数を指定する

        基本はstrで指定されることを想定しているものの、自作のカーネル関数を入力することも可能
    **ker_conf : dict
        カーネル関数に渡す設定
    """
    def __init__(self, inducing_points, ex_var_dim, kernel, **ker_conf):
        variational_distribution = CholeskyVariationalDistribution(
            inducing_points.size(0)
        )
        variational_strategy = VariationalStrategy(
            self,
            inducing_points,
            variational_distribution,
            learn_inducing_locations=True
        )
        super(ApproximateGPModel, self).__init__(variational_strategy)
        self.mean_module = ConstantMean()
        _ker_conf = {'ard_num_dims': ex_var_dim}
        _ker_conf.update(ker_conf)
        self.covar_module = set_kernel(kernel, **_ker_conf)

[docs]    def forward(self, x):
        """ApproximateGPModelのforwardメソッド
        """
        mean_x = self.mean_module(x)
        covar_x = self.covar_module(x)
        return MultivariateNormal(mean_x, covar_x)


[docs]class RunApproximateGP(object):
    """ApproximateGPModelの実行クラス

    Parameters
    ----------
    inducing_points_num : int or float
        補助変数の個数(int)

        もし 0 < inducing_points_num < 1 が渡された場合、学習用データの len と
        inducing_points_num の積が補助変数の個数として設定される
    kernel : str or :obj:`gpytorch.kernels`, default :obj:`'RBFKernel'`
        使用するカーネル関数を指定する。下記から選択する。

        - :obj:`'CosineKernel'`
        - :obj:`'LinearKernel'`
        - :obj:`'MaternKernel'`
        - :obj:`'PeriodicKernel'`
        - :obj:`'RBFKernel'`
        - :obj:`'RQKernel'`
        - :obj:`'SpectralMixtureKernel'`

        基本はstrで指定されることを想定しているものの、 :obj:`gpytorch.kernels`
        を用いた自作のカーネル関数を入力することも可能
    likelihood : str, default :obj:`'GaussianLikelihood'`
        likelihoodとして使用するクラス名が指定される。下記から選択する。

        - :obj:`'GaussianLikelihood'`, :obj:`'GL'` : likelihoodにガウス分布を仮定したガウス過程を行う場合
        - :obj:`'PoissonLikelihood'`, :obj:`'PL'` : likelihoodにポアソン分布を仮定したポアソン回帰ガウス過程モデルを行う場合
        - :obj:`'BernoulliLikelihood'` : likelihoodにベルヌーイ分布を仮定した二値分類ガウス過程モデルを行う場合

    optimizer : str, default :obj:`'Adam'`
        optimizerとして使用するクラス名が指定される。下記から選択する。

        - :obj:`'Adam'`
        - :obj:`'sgd'`
        - :obj:`'RMSprop'`
        - :obj:`'Adadelta'`
        - :obj:`'Adagrad'`

    mll : str, default :obj:`'VariationalELBO'`
        確率分布の周辺化の方法のクラス名が指定される。下記から選択する。

        - :obj:`'VariationalELBO'`, :obj:`'VELBO'`
        - :obj:`'PredictiveLogLikelihood'`, :obj:`'PLL'`
        - :obj:`'GammaRobustVariationalELBO'`, :obj:`'GRVELBO'`

    ard_option : bool, default True
        ARDカーネルを利用するかが指定される

        もし :obj:`kernel_coeff` を利用する場合 `ard_option=True` を選択する
    ker_conf : dict, default dict()
        カーネル関数に渡す設定
    mll_conf : dict, default dict()
        mllに渡す設定
    opt_conf : dict, default dict()
        optimizerに渡す設定
    random_state : int, default None
        seedの固定
    """
    def __init__(self,
                 *,
                 inducing_points_num=0.5,
                 kernel='RBFKernel',
                 likelihood='GaussianLikelihood',
                 optimizer='Adam',
                 mll='VariationalELBO',
                 ard_option=True,
                 ker_conf=dict(),
                 mll_conf=dict(),
                 opt_conf=dict(),
                 random_state=None):
        if isinstance(random_state, int):
            seed(random_state)
            nseed(random_state)
            manual_seed(random_state)
        self.device = check_device()
        self.inducing_points_num = inducing_points_num
        self._kernel = kernel
        self._likelihood = likelihood
        self._optimizer = optimizer
        self._mll = mll
        self.ard_option = ard_option
        self.epoch = 0
        self.model = None  # 空のmodelを作成しないとloadできない
        self.mll = None    # 空のmodelを作成しないとloadできない
        self.optimizer = None  # 空のmodelを作成しないとloadできない
        self._ker_conf = ker_conf
        self._mll_conf = mll_conf
        self._opt_conf = opt_conf
        self.loss = []

    def _set_likelihood(self):
        """likelihoodとしてself._likelihoodの指示の元、インスタンスを立てるメソッド
        """
        if self._likelihood in gaussianlikelihood:
            return GaussianLikelihood().to(self.device)
        elif self._likelihood in poissonlikelihood:
            return PoissonLikelihood().to(self.device)
        elif self._likelihood in bernoullilikelihood:
            return BernoulliLikelihood().to(self.device)
        else:
            raise ValueError(f'likelihood={self._likelihood}は用意されていません')

    def _set_mll(self, num_data, mll_conf):
        """mllとしてself._mllの指示の元、インスタンスを立てるメソッド
        """
        # mllのインスタンスを立てる
        if self._mll in variationalelbo:
            return VariationalELBO(
                self.likelihood,
                self.model,
                num_data=num_data,
                **mll_conf
            )
        elif self._mll in predictiveloglikelihood:
            return PredictiveLogLikelihood(
                self.likelihood,
                self.model,
                num_data=num_data,
                **mll_conf
            )
        elif self._mll in gammarobustvariationalelbo:
            return GammaRobustVariationalELBO(
                self.likelihood,
                self.model,
                num_data=num_data,
                **mll_conf
            )
        else:
            raise ValueError(f'mll={self._mll}は用意されていません')

    def _set_optimizer(self, lr, opt_conf):
        """optimizerとしてself._optimizerの指示の元、インスタンスを立てるメソッド
        """
        if self._optimizer in adam:
            return Adam([
                {'params': self.model.parameters()},
                {'params': self.likelihood.parameters()}
            ], lr=lr, **opt_conf)
        elif self._optimizer in sgd:
            return SGD([
                {'params': self.model.parameters()},
                {'params': self.likelihood.parameters()}
            ], lr=lr, **opt_conf)
        elif self._optimizer in rmsprop:
            return RMSprop([
                {'params': self.model.parameters()},
                {'params': self.likelihood.parameters()}
            ], lr=lr, **opt_conf)
        elif self._optimizer in adadelta:
            return Adadelta([
                {'params': self.model.parameters()},
                {'params': self.likelihood.parameters()}
            ], lr=lr, **opt_conf)
        elif self._optimizer in adagrad:
            return Adagrad([
                {'params': self.model.parameters()},
                {'params': self.likelihood.parameters()}
            ], lr=lr, **opt_conf)
        else:
            raise ValueError(f'optimizer={self._optimizer}は用意されていません')

[docs]    def set_model(self,
                  train_x,
                  train_y,
                  *,
                  lr=1e-3,
                  batch_size=128,
                  shuffle=True):
        """使用するモデルのインスタンスを立てるメソッド

        Parameters
        ----------
        train_x : np.array or torch.tensor
            学習用データセットの説明変数
        train_y : np.array or torch.tensor
            学習用データセットの目的変数
        lr : float
            学習率
        batch_size : int, default 128
            ミニバッチでのデータ数
        shuffle : bool, default True
            学習データをシャッフルしてミニバッチ学習させるかを設定
        """
        if type(train_x) == ndarray:
            train_x = (array_to_tensor(train_x),)
            train_x = tuple(tri.unsqueeze(-1) if tri.ndimension() == 1 else tri for tri in train_x)[0]
        if type(train_y) == ndarray:
            train_y = array_to_tensor(train_y)
        if isinstance(self.inducing_points_num, float) and \
           self.inducing_points_num < 1:
            inducing_points_len = int(len(train_x) * self.inducing_points_num)
            indices = randperm(len(train_x))[:inducing_points_len]
            inducing_points = train_x[indices]
        elif isinstance(self.inducing_points_num, int):
            inducing_points_len = self.inducing_points_num
            indices = randperm(len(train_x))[:inducing_points_len]
            inducing_points = train_x[indices]
        else:
            raise ValueError('inducing_points_numに正しい値が入力されていません')
        ard_option = self.ard_option
        ex_var_dim = train_x.shape[1]

        train_dataset = TensorDataset(train_x, train_y)
        self.train_loader = DataLoader(train_dataset,
                                       batch_size=batch_size,
                                       shuffle=shuffle)

        kernel = self._kernel
        ker_conf = self._ker_conf
        if kernel == 'SpectralMixtureKernel':
            # SpectralMixtureKernelは必ずnum_mixturesと(ミニバッチ学習の場合)batch_sizeが必要となる
            ker_conf['num_mixtures'] = ker_conf.get('num_mixtures', 4)
            ker_conf.update({'batch_size': batch_size})
        # ここで上記モデルのインスタンスを立てる
        if ard_option:
            self.model = ApproximateGPModel(
                inducing_points,
                kernel=kernel,
                ex_var_dim=ex_var_dim,
                **ker_conf
            ).to(self.device)
        else:
            self.model = ApproximateGPModel(
                inducing_points,
                kernel=kernel,
                ex_var_dim=None,
                **ker_conf,
            ).to(self.device)

        # likelihoodのインスタンスを立てる
        self.likelihood = self._set_likelihood()

        # mllのインスタンスを立てる
        num_data = train_y.size(0)
        self.mll = self._set_mll(num_data, mll_conf=self._mll_conf)

        # optimizerのインスタンスを立てる
        self.optimizer = self._set_optimizer(lr, opt_conf=self._opt_conf)

[docs]    def fit(self,
            epochs,
            *,
            test_dataloader=None,
            verbose=True):
        """学習用メソッド

        Parameters
        ----------
        epochs : int
            エポック数
        test_dataloader : :obj:`torch.utils.data.DataLoader`, default None
            テストデータをまとめたデータローダー

            もし test_dataloader を設定している場合エポックごとにテストデータに対するlossも表示されるように設定される
        verbose : bool, default True
            表示形式
        """
        train_dataloader = self.train_loader
        for epoch in range(epochs):
            train_loss = []
            test_loss = []
            self.model.train()
            self.likelihood.train()
            for x_batch, y_batch in train_dataloader:
                self.optimizer.zero_grad()
                output = self.model(x_batch)
                loss = - self.mll(output, y_batch)
                loss.backward()
                self.optimizer.step()

                self.loss.append(loss.item())
                train_loss.append(loss.item())

            self.model.eval()
            self.likelihood.eval()
            if test_dataloader is not None:
                for x_batch, y_batch in test_dataloader:
                    with no_grad():
                        output = self.model(x_batch)
                        loss = - self.mll(output, y_batch)
                        test_loss.append(loss.item())

            is_display_timing = epoch % (epochs // 10) == 0 if epochs >= 10 else True
            if is_display_timing or epoch == epochs - 1 and verbose:
                if test_loss:
                    print(f'Epoch {epoch + 1}/{epochs}'
                          + f' - Train Loss: {mean(train_loss):.5f} /'
                          + f' Test Loss: {mean(test_loss):.5f}')
                else:
                    print(f'Epoch {epoch + 1}/{epochs}'
                          + f' - Train Loss: {mean(train_loss):.5f}')
        # TODO: 追加学習のために再学習の際、self.epochを利用する形にする
        self.epoch = epoch + 1

[docs]    def predict(self, X, *, cl=0.6827, sample_num=None, sample_f_num=None):
        """予測用メソッド

        Parameters
        ----------
        X : np.array or torch.tensor
            入力説明変数
        cl : float default 0.6827(1sigma)
            信頼区間
        sample_num : int default None
            yのサンプル数
        sample_f_num : int default None
            fのサンプル数

        Returns
        -------
        output : object
            予測された目的変数のオブジェクト。下記の属性が用意されている。

            - output.mean : 予測された目的変数の平均値
            - output.upper : 予測された目的変数の信頼区間の上限
            - output.lower : 予測された目的変数の信頼区間の下限
            - output.samples : 入力説明変数に対する予測値yのサンプル(sample_num個サンプルされる)
            - output.samples_f : 入力説明変数に対する予測関数fのサンプル(sample_f_num個サンプルされる)
            - output.probs : BernoulliLikelihood を指定した際に、2値分類の予測確率。このとき mean,upper,lower は output に追加されない。
        """
        if type(X) == ndarray:
            X = array_to_tensor(X)
        if not 0.5 < cl < 1.0:
            raise ValueError(f'cl={cl}が正しい値ではありません')
        self.model.eval()
        self.likelihood.eval()
        with no_grad():
            predicts = self.likelihood(self.model(X))
            if self._likelihood in gaussianlikelihood:
                predicts_f = self.model(X)
            else:
                predicts_f = None
        output = _predict_obj(predicts, cl, sample_num)
        output.samples_f = _sample_f(predicts_f, sample_f_num)
        return output

[docs]    def save(self, file_path):
        """モデルのsaveメソッド

        Parameters
        ----------
        file_path : str
            モデルの保存先のパスとファイル名
        """
        data = dict(
            epoch=self.epoch,
            model=self.model,
            likelihood=self.likelihood,
            mll=self.mll,
            optimizer=self.optimizer,
            loss=self.loss
        )
        save_model(file_path, **data)

[docs]    def load(self, file_path):
        """モデルのloadメソッド

        Parameters
        ----------
        file_path : str
            モデルの保存先のパスとファイル名
        """
        data = dict(
            epoch=self.epoch,
            model=self.model,
            likelihood=self.likelihood,
            mll=self.mll,
            optimizer=self.optimizer,
            loss=self.loss
        )
        (self.epoch,
         self.model,
         self.likelihood,
         self.mll,
         self.optimizer,
         self.loss) = load_model(file_path, **data)

[docs]    def kernel_coeff(self):
        """kernelの係数を出力するメソッド

        Returns
        -------
        output_dict : dict
            カーネル関数の係数

            `ard_option=True` の場合、 $\Theta$ が各々の説明変数ごとに重みを変えて更新され、出力される

        Warning
        --------
        RBFKernelの場合、各説明変数の重要度 $\eta$ は出力される `'base_kernel.raw_lengthscale'`
        の逆数の2乗に対応する
        """
        # TODO: kernel関数をスイッチさせ、それに応じてわかりやすい形に変形する
        output_dict = self.model.covar_module.state_dict()
        return output_dict

[docs]    def plot_kernel(self, *, kernel=None, plot_range=None, **kwargs):
        """カーネル関数のプロット

        Parameters
        ----------
        kernel : str or :obj:`gpytorch.kernels`, default None
            使用するカーネル関数を指定する

        plot_range : tuple, default None
            プロットする幅

        **kwargs : dict
            カーネル関数に渡す設定
        """
        if kernel is None:
            if kwargs:
                temp_kernel = set_kernel(self._kernel, **self._ker_conf)
            else:
                temp_kernel = set_kernel(self._kernel, **kwargs)
        else:
            if kwargs:
                temp_kernel = set_kernel(kernel, **self._ker_conf)
            else:
                temp_kernel = set_kernel(kernel, **kwargs)

        plot_kernel(temp_kernel, plot_range, **kwargs)