5.27. mmvsim 移動窓の類似度計算

移動窓を設定し、各種類似度(2変量の統計量)を計算する。 msim 二変数間の類似度の計算 コマンドの移動窓バージョンとして考えればよい。 msim との違いは、指定できる類似度は一つだけで、また類似度計算の対象項目は2つのみである。

パラメータ

i= : 型=str , 任意(default=標準入力)

入力データを指定する。

o= : 型=str , 任意(default=標準出力)

出力データを指定する。

s= : 型=str , 任意(default=)

ここで指定した項目(複数項目指定可)で並べ替えられた後、各種類似度が計算される。
q オプションを指定しないとき、 s= パラメータは必須。

k= : 型=str , 任意(default=キーブレイク処理しない)

ここで指定された項目(複数項目指定可)を単位として集計する。

f= : 型=str , 必須

集計項目名リスト(複数項目指定可)を指定する。

t= : 型=str , 任意(default=)

期間数を1以上の整数で指定する。

c= : 型=str , 必須

類似度(以下のリストから一つだけ)指定する。
covar|ucovar|pearson|spearman|kendall|euclid|
cosine|cityblock|hamming|chi|phi|jaccard|support|lift
詳細な定義は msim 二変数間の類似度の計算 コマンドを参照のこと。

skip= : 型=str , 任意(default= erb|skip=(t=の値-1)|)

出力を抑制する最初の行数を指定する。

a= : 型=str , 必須

計算結果の出力として追加される項目の名前を指定する。

n= : 型=bool , 任意(default=False)

期間内にNULL値が1つでも含まれていると結果もNULL値とする。

利用例

importと入力データ(CSV)の準備

 1import nysol.mcmd as nm
 2
 3with open('dat1.csv','w') as f:
 4  f.write(
 5'''t,x,y
 61,14,0.17
 72,11,0.2
 83,32,0.15
 94,13,0.33
105,8,0.1
116,19,0.56
12''')

基本例

x、y 項目についてのピアソンの積率相関係数を3期を窓として計算する。

1nm.mmvsim(s="t", t="3", c="pearson", f="x,y", a="sim", i="dat1.csv", o="rsl1.csv").run()
2### rsl1.csv の内容
3# t%0,x,y,sim
4# 3,32,0.15,-0.8746392857
5# 4,13,0.33,-0.6515529194
6# 5,8,0.1,-0.1164257338
7# 6,19,0.56,0.9986254289

関連メソッド