Previous: mnjoin 参照ファイル項目の自然結合 Up: コマンドリファレンス Next: mnrcommon 参照ファイルの複数範囲条件による行撰択 MCMD2
MCMD2 : コマンドリファレンス : mnormalize 基準化

3.36 mnormalize 基準化

f=パラメータで指定した項目を、c=パラメータで指定した基準化の方法で基準化する。

書式

mnormalize c= f= [k=] [i=] [o=] [bufcount=] [-assert_diffSize] [-assert_nullkey] [-assert_nullin] [-assert_nullout] [-nfn] [-nfno] [-x] [-q] [tmpPath=] [precision=] [--help] [--helpl] [--version]

パラメータ

c=

以下に示す基準化の方法のいずれかを指定する。

 

z : z得点 : $z_ i=(x_ i-m)/u$ ($x_ i$: $i$番目のデータ, $m$ :算術平均, $u$ :標準偏差)

 

Z : 偏差値 : $Z_ i=50+10\times z_ i$

 

range : 最小値を0,最大値を1に線形変換 $r_ i=(x_ i-\min _ x)/(\max _ x-\min _ x)$

f=

ここで指定された項目が基準化される。

 

:(コロン)で新項目名を指定する必要がある。例)f=数量:数量基準値

k=

キー項目名リスト

 

ここで指定された項目を単位に基準化を行う。

利用例

例1: 基本例

「顧客」を単位にして「数量」と「金額」項目を基準化(z得点)し、 「数量基準値」と「金額基準値」という項目名で出力する。

$ more dat1.csv
顧客,数量,金額
A,1,10
A,2,20
B,1,15
B,3,10
B,1,20
$ mnormalize c=z k=顧客 f=数量:数量基準値,金額:金額基準値 i=dat1.csv o=rsl1.csv
#END# kgnormalize c=z f=数量:数量基準値,金額:金額基準値 i=dat1.csv k=顧客 o=rsl1.csv
$ more rsl1.csv
顧客%0,数量,金額,数量基準値,金額基準値
A,1,10,-0.7071067812,-0.7071067812
A,2,20,0.7071067812,0.7071067812
B,1,15,-0.5773502692,0
B,3,10,1.154700538,-1
B,1,20,-0.5773502692,1

例2: 偏差値

$ mnormalize c=Z k=顧客 f=数量:数量基準値,金額:金額基準値 i=dat1.csv o=rsl2.csv
#END# kgnormalize c=Z f=数量:数量基準値,金額:金額基準値 i=dat1.csv k=顧客 o=rsl2.csv
$ more rsl2.csv
顧客%0,数量,金額,数量基準値,金額基準値
A,1,10,42.92893219,42.92893219
A,2,20,57.07106781,57.07106781
B,1,15,44.22649731,50
B,3,10,61.54700538,40
B,1,20,44.22649731,60

例3: 0から1への線形変換

$ mnormalize c=range k=顧客 f=数量:数量基準値,金額:金額基準値 i=dat1.csv o=rsl3.csv
#END# kgnormalize c=range f=数量:数量基準値,金額:金額基準値 i=dat1.csv k=顧客 o=rsl3.csv
$ more rsl3.csv
顧客%0,数量,金額,数量基準値,金額基準値
A,1,10,0,0
A,2,20,1,1
B,1,15,0,0.5
B,3,10,1,0
B,1,20,0,1

関連コマンド

Previous: mnjoin 参照ファイル項目の自然結合 Up: コマンドリファレンス Next: mnrcommon 参照ファイルの複数範囲条件による行撰択 MCMD2