5.27. mmvsim 移動窓の類似度計算¶
移動窓を設定し、各種類似度(2変量の統計量)を計算する。
msim 二変数間の類似度の計算 コマンドの移動窓バージョンとして考えればよい。
msim
との違いは、指定できる類似度は一つだけで、また類似度計算の対象項目は2つのみである。
パラメータ¶
i= : 型=str , 任意(default=標準入力)
入力データを指定する。
o= : 型=str , 任意(default=標準出力)
出力データを指定する。
s= : 型=str , 任意(default=)
ここで指定した項目(複数項目指定可)で並べ替えられた後、各種類似度が計算される。q
オプションを指定しないとき、s=
パラメータは必須。
k= : 型=str , 任意(default=キーブレイク処理しない)
ここで指定された項目(複数項目指定可)を単位として集計する。
f= : 型=str , 必須
集計項目名リスト(複数項目指定可)を指定する。
t= : 型=str , 任意(default=)
期間数を1以上の整数で指定する。
c= : 型=str , 必須
類似度(以下のリストから一つだけ)指定する。covar|ucovar|pearson|spearman|kendall|euclid|
cosine|cityblock|hamming|chi|phi|jaccard|support|lift
詳細な定義は msim 二変数間の類似度の計算 コマンドを参照のこと。
skip= : 型=str , 任意(default= erb|skip=(t=の値-1)|)
出力を抑制する最初の行数を指定する。
a= : 型=str , 必須
計算結果の出力として追加される項目の名前を指定する。
n= : 型=bool , 任意(default=False)
期間内にNULL値が1つでも含まれていると結果もNULL値とする。
共通パラメータ¶
i= , o= , assert_diffSize= , assert_nullkey= , assert_nullin= , assert_nullout= , nfn= , nfno= , x= , q= , tmppath= , precision=
利用例¶
importと入力データ(CSV)の準備
1import nysol.mcmd as nm 2 3with open('dat1.csv','w') as f: 4 f.write( 5'''t,x,y 61,14,0.17 72,11,0.2 83,32,0.15 94,13,0.33 105,8,0.1 116,19,0.56 12''')
基本例
x、y
項目についてのピアソンの積率相関係数を3期を窓として計算する。
1nm.mmvsim(s="t", t="3", c="pearson", f="x,y", a="sim", i="dat1.csv", o="rsl1.csv").run() 2### rsl1.csv の内容 3# t%0,x,y,sim 4# 3,32,0.15,-0.8746392857 5# 4,13,0.33,-0.6515529194 6# 5,8,0.1,-0.1164257338 7# 6,19,0.56,0.9986254289
関連メソッド¶
msim 二変数間の類似度の計算 : 移動窓を設定せずに類似度計算を行う。
mwindow スライド窓の生成 : 動窓のデータを作成するので、そのデータを使えば
mmvstats
で計算できない統計量も計算可能。mmvavg 移動平均の算出 : 移動平均に限定した計算を行う。