5.64. muniq レコードの単一化¶
値が重複した行を単一化する。
パラメータ¶
i= : 型=str , 任意(default=標準入力)
入力データを指定する。
o= : 型=str , 任意(default=標準出力)
出力データを指定する。
k= : 型=str , 任意(default=キーブレイク処理しない)
行を単一化する単位となる項目名リストを指定する。
共通パラメータ¶
i= , o= , assert_diffSize= , assert_nullkey= , nfn= , nfno= , x= , q= , tmppath= , precision=
利用例¶
importと入力データ(CSV)の準備
1import nysol.mcmd as nm 2 3with open('dat1.csv','w') as f: 4 f.write( 5'''date,customer 620081201,A 720081202,A 820081202,B 920081202,B 1020081203,C 11''')
基本例
date
項目を単位に重複行を削除し単一にする。
1nm.muniq(k="date", i="dat1.csv", o="rsl1.csv").run() 2### rsl1.csv の内容 3# date%0,customer 4# 20081201,A 5# 20081202,B 6# 20081203,C
複数の項目での重複行の削除
date
と customer
項目を単位に重複行を削除し単一にする。
1nm.muniq(k="date,customer", i="dat1.csv", o="rsl2.csv").run() 2### rsl2.csv の内容 3# date%0,customer%1 4# 20081201,A 5# 20081202,A 6# 20081202,B 7# 20081203,C
関連メソッド¶
mbest 指定行の選択 : 同一キーの中で何番目の行を選択するかを指定したい場合は
mbest
コマンドを使う。