create your own website for free

What we do in
NAM CAST

Brief Introduction

はじめに

「今」を予想するとは?

 例えば、今この瞬間、隣のコンビニにいるお客さんの数を予測することは、簡単です。先週の同じ時間にお客さんが何人いたかを計測していけば良いのです。

 しかし難しいのは、今日たまたま近くでお祭りがあった、今日からアイドルくじが始まった等々の様々な因子が数値の予測には関わってきます。

 近年よく見る人工知能や全自動取引では、「買い」や「売り」だけを支持する複雑無形な形で金融分野では注目されますが、我々の行ったことは別のことです。

我々は、株や為替の価格が大きく変化するであろうポイントをリアルタイムに探しています。その中で我々はナウキャストと呼ぶように今現在の価格変化点を予測していきます。

この価格変化点を探すのに行っている予測データは、新聞記事、ソーシャルデータ、天気、定点カメラ画像など多岐に渡ります。我々が取得したデータと株価の変化を因果関係を持たせることがこの事業で最重要課題です。

テストデータ

「今」を予想するとは?

私たちの実験では、Apple(AAPL)、Google(GOOGL)、Hewlett-Packard(HPQ)、EUR / USD、GBP / USDをテストデータにしてモデルを構築しました。

集めたデータには、Financial Times, 5ch掲示板, Tweetデータ等々予測対象によって大きく変わりますが、基本的にテキストデータから予測を行なっています。

使った手法と比較モデル

「今」を予想するとは?

因果関係と相関関係は異なります。「雨が降ると、地面が固まる」は因果関係です。しかし「気温が高くなると、アイスが売れる」は相関関係です。天気の場合は、雨が原因で地面が固まるという結果を引き起こしています。しかしアイスは気温が高いとき売れるのは、因果ではなく、ただの関係です。


 

因果関係を統計的に推論することは難しいタスクです。そこでグレンジャーの因果性検定は「因果関係」を統計的に検定する方法です。こちらで検定可能な内容は、「Xのデータを使えば、Yのデータを予測できる」という仮説をテストします。

結果

「今」を予想するとは?

このページでは、ソーシャルデータの感情分析やリアルタイムのニュース記事などのテキストを適用して市場動向予測を行うことの実現可能性検討しました。我々の見解では、特定のデータとの因果関係を見いだすことができましたが、一部の株(例えばAPPL)などでは因果関係を見いだすことはできませんでした。一方で、ヒューレットパッカード社に対するナウキャストは予測精度を高めることができました。またそれぞれ予測が当たる期間と当たらない期間があり、これらに注意して予測を分析することが大事です。

SVMを10のテクニカルインジケーターを使用して学習された線形モデルをベースラインと比較すると、ナムキャストのモデルはベースラインモデルよりも優れており、株価の動きを予測するのに役立つことが示されました。Yahooニュース記事から抽出された感情分析や5chのヘッドラインも優れたパフォーマンスをもたらしました。