【買いたい株が見つかる】銘柄検索・高度な分析をするならCOLOMA

Tech Blog

  • トップ
  • Derivative DTW ~時系列パターンの類似度計算の手法~
052019-03

Derivative DTW ~時系列パターンの類似度計算の手法~

はじめに

同じアパレル業でありながら,ビジネスモデルが大きく異なるファーストリテイリングとZOZOの株価の値動きは似ているのだろうか.同じアパレル業界だから大局的な株価の値動きは似ていると考えられる.一方で,ZOZOは店舗を持たない新しいビジネスモデルを展開しており,また事業に勢いがあるため,株価の値動きは似ていないとも考えられる.このように,ある程度直感的に予想ができるかもしれないが,株価の値動きが "似ている" か "似ていないか" を数値的に表現できると望ましい. 本記事では,2つの時系列データの"類似度"を計算する代表的な手法である動的時間伸縮法 / DTW (Dynamic Time Warping) とその拡張である DDTW (Derivative Dynamic Time Warping)について説明する.

概要

音声や株価のクラスタリング,株価のチャートパターンの検出など,時系列データ同士の類似度の算出は様々なアプリケーションで用いられている.時系列データ同士の類似度を算出する手法として,動的時間伸縮法 / DTW (Dynamic Time Warping) がある.DTWの利点は,異なる長さの時系列データ同士でも距離を算出でき,そのアルゴリズムが簡潔であることが挙げられる.しかし,DTWは時系列データを点として扱っているため,時系列データの形状によってはうまく機能しない場合がある.そこで,本記事ではDTWの拡張版であるDDTW (Derivative Dynamic Time Warping)を用いた時系列データの類似度の算出に関して説明する.DDTWのアルゴリズムはDTWとほぼ同じものであるが,こちらはより形状を捉えた情報である隣接する3点間の微分係数を算出している点で異なる.

論文

Eamonn J. Keogh and Michael J. Pazzani, "Derivative Dynamic Time Warping", SDM'2001 Accepted Papers. URL (pdf): https://www.ics.uci.edu/~pazzani/Publications/sdm01.pdf

解説

DTW (Dynamic Time Warping)

類似度を算出したい2つの時系列データ

があるとき,各時系列データを横・縦に並べたグリッドを考えることができる. このグリッドの点は要素間のアライメントに相当する. ワーピングパス は 時系列データの各要素を"距離"が小さくなるようにアライメントする.つまり,はグリッドの点の系列となる.(Figure from Eamonn 2001) Screen Shot 2019-02-24 at 14.22.58

ここで,2つの要素間の距離を

と定義すると,DTWは次の式で定義される.

よって,計算量は である.

Derivative DTW

Derivative DTWは時系列データの各要素に対して,次のような変換を行った時系列データを用いる.

これをもう一つの時系列データ に対して適用しを得て,以降は変換後の時系列データ に対してDTWと同じアルゴリズムを適用する. よって,計算量はDTWと同じくである. DTWでは各点同士の比較にとどまっていたのに対して,この変換により,上昇トレンドや下降トレンドなどの形状を考慮した類似度が算出できるため,DTWより形状を考慮した時系列データ間の距離が算出できる. 図はEamonn 2001より引用したものである.1)の2つの時系列データに対して,3)のDTWでは2)の直感とは異なるアライメントが見られるが,4)のDDTWでは2)の直感と同じようなアライメントが得られている. Screen Shot 2019-02-24 at 14.45.37

発展性

ここで紹介したDDTW以外にも,DTWの発展としてNN-DTWBagnall 2014やshapeDTW Zhao 2016などが考案されている. NN-DTWは,最近傍法(Nearest Neighbour)と組み合わせて時系列データの分類を行ったものである.また,shape DTWはDDTWを一般化し,形状を捉えるshape descriptorsを用いてより正確なアライメントを実現したものである.

参考文献

Donald J. Bemdt and et al., "Using Dynamic Time Warping to Find Patterns in Time Series", 1994, AAAI. URL (pdf): https://www.aaai.org/Papers/Workshops/1994/WS-94-03/WS94-03-031.pdf

Anthony Bagnall and Jason Lines, "An Experimental Evaluation of Nearest Neighbour Time Series Classification", 2014. URL (arXiv): https://arxiv.org/abs/1406.4757

Jiaping Zhao and Laurent Itti, "shapeDTW: shape Dynamic Time Warping", 2016. URL (arXiv): https://arxiv.org/abs/1606.01601

その他の記事
162019-07

サプライヤー・カスタマー関係における情報の非対称性からリターンを生む方法

企業同士は"サプライヤー(商品供給者)"と"カスタマー(顧客)"の関係で繋がっている。本記事では、”市場参加者の注意力の散漫”によるサプライヤー/カスタマー2社間の特徴的な株価変動を実例とともに紹介したあと、その関係を投資戦略に組み込んだカスタマーモーメンタムとその実験について説明する。

続きを読む
052019-07

Dynamic Mode Decomposition ~データから時空間ダイナミクスを抽出する方法~

複雑な時空間ダイナミクスをデータから抽出する手法の一つとしてDynamic Mode Decomposition (動的モード分解)を紹介する

続きを読む
052019-07

ヘッジファンドは勝てるのか?~2007年から2017年の間のヘッジファンドのパフォーマンスをくらべてみました~

米国株式市場を対象として、ヘッジファンドとインデックスとを比較した実証研究を紹介する。2007年から2009年の金融危機をはさんだ期間においても、インデックスを上回るパフォーマンスのヘッジファンドが存在することがわかった。

続きを読む
272019-05

Graph Convolutional Networksの基礎

グラフ構造を扱うGraph Convolutional Networks (GCN)が近年盛り上がりを見せている.本記事では,Graph Convolutional Networksの基礎を解説した後,Coraデータセットを用いた簡単なクラス分類の実験について説明する.

続きを読む
262019-05

金融商品や投資戦略の評価に使われている各種指標の紹介

銀行や証券会社で販売されている金融商品や、機関投資家が執行する投資戦略の性能評価に使用されている各種指標を紹介する。

続きを読む
122019-04

複素リスク分散ポートフォリオ

金融資産のポートフォリオを生成するとは,適切な配分で複数の金融資産を保有することである. その際に, 数理最適化の手法が応用されている. 本稿ではポートフォリオ生成に関する基本的な内容を復習し, 複素リスク分散ポートフォリオの概要を説明する.

続きを読む
112019-03

株価とマクロ経済指標との関係

日々の生活で触れる経済ニュースの中で,国内総生産や消費者物価指数といったマクロ経済指標と個々の企業の株価に関する情報は必ずといってもよいほど目にするものである.そこで,一つの疑問が湧いてくる.これらのマクロ経済指標と株価との間には何かしらの関係性があるのだろうか?本稿では,イギリス,ドイツ,フランスを対象に株式市場のインデックスとマクロ経済指標との間の関連性について調べた結果を紹介する.

続きを読む
052019-03

Derivative DTW ~時系列パターンの類似度計算の手法~

時系列データ同士の類似度を算出する手法として,動的時間伸縮法 / DTW (Dynamic Time Warping) がある.この手法は、時系列データを点として扱っているが,形状によってはうまく機能しない場合がある.そこで,本記事ではDTWの拡張であるDDTW (Derivative Dynamic Time Warping)を用いた時系列パターンの類似度の算出に関して説明する.

続きを読む
052019-03

サプライヤー・カスタマーの関係性を使った投資戦略

企業間取引での商品提供者(サプライヤー)と顧客(カスタマー)同士のつながりをサプライチェーンという。株価がサプライチェーンを伝わる際に情報の非対称性が存在すると仮定すると、そこには利益を獲得できる機会が生じると期待できる。この発想に基づいた投資戦略を紹介する。

続きを読む