5.56. mstats 一変数の統計量算出

f= パラメータで指定した数値項目について c= パラメータで指定した統計量の計算をする。 k= を指定することで、キー単位で集計することができる。 f= で指定した項目のNULL値は無視される。 ただし、全行がNULL値であればNULL値が出力される。 (注) k=とf=パラメータで指定した項目以外については、どの行が出力されるか>は不定であることに注意してください。

パラメータ

i= : 型=str , 任意(default=標準入力)

入力データを指定する。

o= : 型=str , 任意(default=標準出力)

出力データを指定する。

k= : 型=str , 任意(default=キーブレイク処理しない)

ここで指定された項目(複数項目指定可)を単位として集計する。

f= : 型=str , 必須

ここで指定された項目(複数項目指定可)の値が集計される。

c= : 型=str , 必須

統計量(以下のリストから一つだけ指定可)
sum|mean|count|ucount|devsq|var|uvar|sd|usd|USD|cv|min|qtile1|
median|qtile3|max|range|qrange|mode|skew|uskew|kurt|ukurt

n= : 型=bool , 任意(default=False)

NULL値が1つでも含まれていると結果もNULL値とする。

利用例

importと入力データ(CSV)の準備

 1import nysol.mcmd as nm
 2
 3with open('dat1.csv','w') as f:
 4  f.write(
 5'''customer,quantity,amount
 6A,1,10
 7B,5,20
 8B,2,10
 9C,1,15
10C,3,10
11C,1,21
12''')

基本例

customer 項目を単位に quantityamount 項目の 各統計量合計値を計算する。

1nm.mstats(k="customer", f="quantity,amount", c="sum", i="dat1.csv", o="rsl1.csv").run()
2### rsl1.csv の内容
3# customer%0,quantity,amount
4# A,1,10
5# B,7,30
6# C,5,46

基本例2

各統計量最大値を計算する。

1nm.mstats(k="customer", f="quantity,amount", c="max", i="dat1.csv", o="rsl2.csv").run()
2### rsl2.csv の内容
3# customer%0,quantity,amount
4# A,1,10
5# B,5,20
6# C,3,21

関連メソッド