NYSOL

センチメント指数sentiment

センチメント指数

ファイナンス研究における近年の最もホットなテーマの一つとして、 マーケットセンチメント(市場心理)の株価への影響に関する定量評価を上げることができよう。
例えば、Tetlock は、その先駆け的論文を発表しており、そこではウォール・ストリート・ジャーナルの日々の記 事を解析することで、悲観的な記事が多く現れるとダウ平均株価指数が下落することを示し[1]、また、Bollen らは Twitter のメッセージを大量に収集し、「落ち着き」「不安」という分類語 句がダウ工 業平均株価指数の三日後の値と相関が非常に高いことを示している[2]。
そこで我々は、同様の目的で日経QUICKから提供された2012/1〜2015/5の約5年半のニュース記事から以下の方法によりセンチメント指数を作成した。詳細は、ページ末の参 考文献[4-7]を参考にされたい。

1) ニュース記事からケースフレーム(格助詞句と用言句のペア)を抽出
2) 周辺文脈法[3]によりケースフレームの極性辞書(悲観的なケースフレームと楽観的なケースフレーム)を作成
3) 日ごとに極性別に辞書に登録されたケースフレームの出現記事数をカウント
4) 出現数の過去44日間の単純移動平均を計算  

作成された辞書のサンプル

楽観表現

(販売が,好調だ)
(売り上げが,好調だ)
(株価が,続伸)
(買いが,膨らむ)
(投資判断を,引き上げる)
(買いに,引き上げる)
(業績予想を,上方修正する)  

悲観表現

(赤字を,見込む)
(売り上げが,伸び悩む)
(株価が,下落する)
(売りが, 膨らむ)
(投資判断を,引き下げる)
(買いから,引き下げる)
(業績予想を,下方修正する)  

データ

日別センチメント指数のダウンロード
TOPIXとの関係チャート

データは8項目から構成され、それぞれの項目の意味は以下の通りである。
date: 日付(YYYYMMDD)
Pos: 楽観表現の出現記事数
Neg: 悲観表現の出現記事数*(-1)
PosNeg: Pos+Neg
siPos: 楽観センチメントインデックス(Posの過去44日単純移動平均)
siNeg: 悲観センチメントインデックス(Negの過去44日単純移動平均)
siPosNeg: センチメントインデックス(PosNegの過去44日単純移動平均)
topix: TOPIXの終値  


TOPIXとセンチメントインデックスの相関係数
siPos: 0.011
siNeg: 0.794
siPosNeg: 0.569  

参考文献

[1] P. Tetlock,”Giving content to investor sentiment”, Journal of Finance, 62, pp. 1139-1168,2007.
[2] J. Bollen, H.Mao and X. Zeng, “Twitter mood predicts the stock market”, Journal of Computational Science, pp.1-8, 2010.
[3] 那須川哲哉,金山博,文脈一貫性を利用した極性付評価表現の語彙獲得,情情報処理学会自然言語処理研究会(NL-162−16),pp.109−116,2004.
[4] 羽室行信, 岡田克彦, 森田裕之『周辺文脈アプローチを利用した新聞記事内容と株価に関する分析』 日本オペレーションズ・リサーチ学会全国大会, 2010/9.
[5] 中元政一, 東高宏, 岡田克彦, 羽室行信「極性付き評価表現のクラスタ抽出と株価収益率予測への応用」日本オペレーションズ・リサーチ学会2011年秋期研究発表会,2011/9.
[6] 岡田克彦、羽室行信「相場の感情とその変動-自然言語処理で測定するマーケットセンチメントとボラティリティ-」証券アナリストジャーナル, Vol.49, No.8, pp.37-48, 2011/8.
[7] 前川浩基, 中原孝信, 岡田克彦, 羽室行信, 「大規模ニュース記事からの極性付き評価表現の抽出と株価収益率の予測」, オペレーションズ・リサーチ, Vol.58, No.5, pp.281-288. 2013.05.  

謝辞

本指数を算出するにあたり,JST戦略的創造研究推進事業ERATO湊離散構造系プロジェクト、科学研究費基盤研究Bの支援および株式会社QUICKのご協力を得ております.