5.58. msummary 1変数の統計量の計算¶
f=
パラメータで指定した集計項目で
c=
パラメータで指定した統計量の計算をする。
パラメータ¶
i= : 型=str , 任意(default=標準入力)
入力データを指定する。
o= : 型=str , 任意(default=標準出力)
出力データを指定する。
k= : 型=str , 任意(default=キーブレイク処理しない)
f= : 型=str , 必須
集計項目名リスト(複数項目指定可)ここで指定された項目の値が集計される。x
,nfn
オプション使用時は、項目番号(0~)で指定。
c= : 型=str , 必須
統計量リスト(複数項目指定可)出力する統計量をコンマで区切って指定する。統計量リスト:sum/mean/count/ucount/devsq/var/uvar/sd/usd/cv/min/qtile1/median/qtile3/max/
range/qrange/mode/skew/uskew/kurt/ukurt
a= : 型=str , 任意(default=)
新項目名を指定する。f=
パラメータで指定した項目名をデータとして出力する際の項目名(省略時はfld)を指定する。
n= : 型=bool , 任意(default=False)
NULL値が1つでも含まれていると結果もNULL値とする。
共通パラメータ¶
i= , o= , assert_diffSize= , assert_nullkey= , assert_nullin= , assert_nullout= , nfn= , nfno= , x= , q= , tmppath= , precision=
利用例¶
importと入力データ(CSV)の準備
1import nysol.mcmd as nm 2 3with open('dat1.csv','w') as f: 4 f.write( 5'''customer,quantity,amount 6A,1,10 7A,2,20 8B,1,15 9B,3,10 10B,1,20 11''')
基本例
customer
項目を単位に quantity
と amount
項目の中央値・平均値を求める。
統計量を求めた項目名は「変数」という項目に出力する。
1nm.msummary(k="customer", f="quantity,amount", c="median:中央値,mean:平均値", a="変数", i="dat1.csv", o="rsl1.csv").run() 2### rsl1.csv の内容 3# customer%0,変数,中央値,平均値 4# A,quantity,1.5,1.5 5# A,amount,15,15 6# B,quantity,1,1.666666667 7# B,amount,15,15
関連メソッド¶
mstats 一変数の統計量算出 : 求める統計量が1つのとき用いる。