k=パラメータで指定した項目の値が同じ行について、 f=パラメータで指定した集計項目の項目値を合計する。
(注)k=とf=パラメータで指定した項目以外については、どの行が出力されるかは不定であることに注意してください。
msum f= [k=] [-n] [i=] [o=] [-assert_diffSize] [-assert_nullkey] [-assert_nullin] [-assert_nullout] [-nfn] [-nfno] [-x] [-q] [tmpPath=] [precision=] [--help] [--helpl] [--version]
k= |
集計の単位となる項目名リスト(複数項目指定可)を指定する。 |
f= |
ここで指定された項目(複数項目指定可)の値が集計される。NULL値は無視される。 |
-n |
f=で指定した項目にNULL値が入っていると計算結果もNULLとする。 |
「顧客」項目を単位に「数量」と「金額」項目の合計値を計算し、 「数量合計」と「金額合計」という項目名で出力する。
$ more dat1.csv 顧客,数量,金額 A,1,10 B,1,15 A,2,20 B,3,10 B,1,20 $ msum k=顧客 f=数量:数量合計,金額:金額合計 i=dat1.csv o=rsl1.csv #END# kgsum f=数量:数量合計,金額:金額合計 i=dat1.csv k=顧客 o=rsl1.csv $ more rsl1.csv 顧客%0,数量合計,金額合計 A,3,30 B,5,45
mhashsum : 集計キーを事前に並べ替えなくても計算できる。
mavg : 平均バージョン。
mstats : その他の多様な統計量を求めるのであればこれ。