ベクトル型の項目の要素を単一化する。 内部的にはtree構造を利用して単一化をしているので、 出力される要素の順序は文字列昇順に並び変わる。
一方で、-nオプションを指定すると、 ベクトルを系列として考え、 要素を先頭から順番に走査し、互いに隣接した要素のみを単一化し出力する。
典型的な例をTable 3.45,3.45に示す。 Table 3.45では、全ての要素が単一化されているのが分かる。 一方で、-nオプションを指定して実行すると、 Table 3.45の3行目に見られるように、 互いに隣接するbのみが単一化される。
Table 3.45: 入力データ in.csv |
||||||||||
no items 1 b a a 2 a a b b b 3 a b b a 4 a b c |
no |
items |
1 |
a b |
2 |
a b |
3 |
a b |
4 |
a b c |
no |
items |
1 |
b a |
2 |
a b |
3 |
a b a |
4 |
a b c |
mvuniq vf= [-A] [-n] [i=] [o=] [delim=] [-assert_diffSize] [-assert_nullin] [-assert_nullout] [-nfn] [-nfno] [-x] [-q] [tmpPath=] [--help] [--helpl] [--version]
vf= |
単一化する対象項目名を指定する。複数項目指定可能。 |
結果の項目名を変更したいときは、:(コロン)に続けて新項目名を指定する。 |
|
-A |
vf=で:(コロン)に続けて指定した項目名で、新たな項目が追加される。 |
なお-Aオプションを指定した場合、vf=パラメータで指定するすべての |
|
項目に新項目名を指定しなければならない。 |
|
-n |
ベクトルを系列と考え隣接する同一要素のみ単一化する |
$ more dat1.csv items1,items2 b a c,1 1 c c,2 2 3 e a a,3 1 $ mvuniq vf=items1,items2 i=dat1.csv o=rsl1.csv #END# kgvuniq i=dat1.csv o=rsl1.csv vf=items1,items2 $ more rsl1.csv items1,items2 a b c,1 c,2 3 a e,1 3