5.56. mstats 一変数の統計量算出¶
f=
パラメータで指定した数値項目について
c=
パラメータで指定した統計量の計算をする。
k=
を指定することで、キー単位で集計することができる。
f=
で指定した項目のNULL値は無視される。
ただし、全行がNULL値であればNULL値が出力される。
(注)
k=とf=パラメータで指定した項目以外については、どの行が出力されるか>は不定であることに注意してください。
パラメータ¶
i= : 型=str , 任意(default=標準入力)
入力データを指定する。
o= : 型=str , 任意(default=標準出力)
出力データを指定する。
k= : 型=str , 任意(default=キーブレイク処理しない)
ここで指定された項目(複数項目指定可)を単位として集計する。
f= : 型=str , 必須
ここで指定された項目(複数項目指定可)の値が集計される。
c= : 型=str , 必須
統計量(以下のリストから一つだけ指定可)sum|mean|count|ucount|devsq|var|uvar|sd|usd|USD|cv|min|qtile1|
median|qtile3|max|range|qrange|mode|skew|uskew|kurt|ukurt
n= : 型=bool , 任意(default=False)
NULL値が1つでも含まれていると結果もNULL値とする。
共通パラメータ¶
i= , o= , assert_diffSize= , assert_nullkey= , assert_nullin= , assert_nullout= , nfn= , nfno= , x= , q= , tmppath= , precision=
利用例¶
importと入力データ(CSV)の準備
1import nysol.mcmd as nm 2 3with open('dat1.csv','w') as f: 4 f.write( 5'''customer,quantity,amount 6A,1,10 7B,5,20 8B,2,10 9C,1,15 10C,3,10 11C,1,21 12''')
基本例
customer
項目を単位に quantity
と amount
項目の
各統計量合計値を計算する。
1nm.mstats(k="customer", f="quantity,amount", c="sum", i="dat1.csv", o="rsl1.csv").run() 2### rsl1.csv の内容 3# customer%0,quantity,amount 4# A,1,10 5# B,7,30 6# C,5,46
基本例2
各統計量最大値を計算する。
1nm.mstats(k="customer", f="quantity,amount", c="max", i="dat1.csv", o="rsl2.csv").run() 2### rsl2.csv の内容 3# customer%0,quantity,amount 4# A,1,10 5# B,5,20 6# C,3,21
関連メソッド¶
msim 二変数間の類似度の計算 : 2変量の統計量を求める。
mavg 項目値の平均 :
c=avg
に特化したコマンド。msum 項目値の合計 :
c=sum
に特化したコマンド。mcount 行数カウント :
c=count
と異なり、集計キーの行数をカウントする。