基本的な使用方法
=====================
インストール
---------------------
実行環境・必要なパッケージ
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
PHYSBOの実行環境・必要なパッケージは以下の通りです。
現在はPython 2.7で動作します。ver.1.0ではPython3系に対応する予定です。
* Python = 2.7
* numpy
* scipy
* six
.. `Anaconda `_ 環境を利用すると、numpy, scipy, Cython がデフォルトでインストールされているため、COMBO をすぐに実行することが可能です。
依存パッケージを手動でインストールする場合は、以下の手順によりまとめてインストールすることができます。
#. 以下をコピーして、'requirements.txt' というファイル名で保存します (setup.py と同じディレクトリ内に保存します) ::
## To install these requirements, run
## pip install -U -r requirements.txt
## (the -U option also upgrades packages; from the second time on,
## just run
## pip install -r requirements.txt
##
## NOTE: before running the command above, you need to install a recent version
## of pip from the website, and then possibly install/upgrade setuptools using
## sudo pip install --upgrade setuptools
## numpy
numpy >=1.10
## scipy
scipy >= 0.16
##
Cython >= 0.22.1
## mpi4py
mpi4py >= 2.0 (optional)
#. 以下のコマンドを実行します。 ::
> pip install -U -r requirements.txt
ダウンロード・インストール
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
- ``pip`` を用いたインストール(推奨) ::
$ pip install physbo
- NumPy などの依存パッケージも同時にインストールされます。
- ``--user`` オプションを追加するとユーザのホームディレクトリ以下にインストールされます。 ::
$ pip install --user physbo
- ソースコードからのインストール(開発者向け)
#. 本体のダウンロード
ソースファイルをダウンロードするか、以下のように github レポジトリをクローンしてください。 ::
$ git clone https://github.com/issp-center-dev/PHYSBO
#. NumPy, Cython のインストール(コンパイルに必要です) ::
$ pip install numpy Cython
#. インストール ::
$ cd physbo
$ python setup.py install
アンインストール
~~~~~~~~~~~~~~~~~~~~~~~~
#. 以下のコマンドを実行します。 ::
$ pip uninstall physbo
PHYSBOの基本構造
--------------------------
PHYSBOは以下のような構成になっています(第2階層まで表示)。
..
|--physbo
| |--blm
| |--gp
| |--misc
| |--opt
| |--search
| |--predictor.py
| |--variable.py
各モジュールは以下のような構成で作成されています。
- ``blm`` :Baysean linear modelに関するモジュール
- ``gp`` :Gaussian Processに関するモジュール
- ``opt`` :最適化に関するモジュール
- ``search`` :最適解を探索するためのモジュール
- ``predictor.py`` :predictorの抽象クラス
- ``variable.py`` :physboで用いる変数関連について定義されたクラス
- ``misc`` : その他(探索空間を正規化するためのモジュールなど)
各モジュールの詳細についてはAPIリファレンスを参考にしてください。
計算の流れ
--------------------------
ベイズ最適化は、複雑なシミュレーションや、実世界における実験タスクなど、目的関数の評価に大きなコストがかかるような最適化問題に適しています。
PHYSBO では以下の手順により最適化を実行します(それぞれの詳細はチュートリアルおよびAPIリファレンスを参考にしてください)。
1. 探索空間の定義
N: 探索候補の数 , d: 入力パラメータの次元数 とした時、探索候補である各パラメータセット (d 次元のベクトル) を定義します。パラメータセットは全ての候補をリストアップしておく必要があります。
2. simulator の定義
上で定義した探索候補に対して、各探索候補の目的関数値(材料特性値など最適化したい値)を与えるsimulatorを定義します。PHYSBOでは、最適化の方向は「目的関数の最大化」になります。そのため,目的関数を最小化したい場合、simulatorから返す値にマイナスをかけることで実行できます。
3. 最適化の実行
最初に、最適化の policy をセットします(探索空間はこの段階で引数としてpolicyに渡されます)。最適化方法は、以下の2種類から選択します。
- `random_search`
- `bayes_search`
`random_search` では、探索空間からランダムにパラメータを選び、その中で最大となる目的関数を探します。ベイズ最適化を行うための前処理として初期パラメータ群を用意するために使用します。`bayes_search` は、ベイズ最適化を行います。ベイズ最適化でのscore: 獲得関数(acquisition function) の種類は、以下のいずれかから指定します。
- TS (Thompson Sampling): 学習されたガウス過程の事後確率分布から回帰関数を1つサンプリングし、それを用いた予測が最大となる点を候補として選択します。
- EI (Expected Improvement): ガウス過程による予測値と現状での最大値との差の期待値が最大となる点を候補として選択します。
- PI (Probability of Improvement): 現状での最大値を超える確率が最大となる点を候補として選択します。
ガウス過程に関する詳細については :ref:`chap_algorithm` に記載してあります。その他、各手法の詳細については、`こちらの文献 `_ およびその参考文献を参照して下さい。
これらのメソッドに先ほど定義した simulator と探索ステップ数を指定すると、探索ステップ数だけ以下のループが回ります。
i). パラメータ候補の中から次に実行するパラメータを選択
ii). 選択されたパラメータで simulator を実行
i)で返されるパラメータはデフォルトでは1つですが、1ステップで複数のパラメータを返すことも可能です。詳しくはチュートリアルの「複数候補を一度に探索する」の項目を参照してください。また、上記のループを PHYSBO の中で回すのではなく、i) と ii) を別個に外部から制御することも可能です。つまり、PHYSBO から次に実行するパラメータを提案し、その目的関数値をPHYBOの外部で何らかの形で評価し(例えば、数値計算ではなく、実験による評価など)、それをPHYSBOの外部で何らかの形で提案し、評価値をPHYSBOに登録する、という手順が可能です。詳しくは、チュートリアルの「インタラクティブに実行する」の項目を参照してください。
4. 結果の確認
探索結果 res は history クラスのオブジェクト (physbo.search.discrete.results.history) として返されます。以下より探索結果を参照します。
- res.fx : simulator (目的関数) の評価値の履歴。
- res.chosed_actions: simulator を評価したときのaction ID(パラメータ)の履歴。
- fbest, best_action= res.export_all_sequence_best_fx(): simulator を評価した全タイミングにおけるベスト値とそのaction ID(パラメータ)の履歴。
- res.total_num_search: simulator のトータル評価数。
また、探索結果は save メソッドにより外部ファイルに保存でき、load メソッドを用いて出力した結果をロードすることができます。使用方法の詳細はチュートリアルをご覧ください。