5.64. muniq レコードの単一化

値が重複した行を単一化する。

パラメータ

i= : 型=str , 任意(default=標準入力)

入力データを指定する。

o= : 型=str , 任意(default=標準出力)

出力データを指定する。

k= : 型=str , 任意(default=キーブレイク処理しない)

行を単一化する単位となる項目名リストを指定する。

共通パラメータ

i= , o= , assert_diffSize= , assert_nullkey= , nfn= , nfno= , x= , q= , tmppath= , precision=

利用例

importと入力データ(CSV)の準備

 1import nysol.mcmd as nm
 2
 3with open('dat1.csv','w') as f:
 4  f.write(
 5'''date,customer
 620081201,A
 720081202,A
 820081202,B
 920081202,B
1020081203,C
11''')

基本例

date 項目を単位に重複行を削除し単一にする。

1nm.muniq(k="date", i="dat1.csv", o="rsl1.csv").run()
2### rsl1.csv の内容
3# date%0,customer
4# 20081201,A
5# 20081202,B
6# 20081203,C

複数の項目での重複行の削除

datecustomer 項目を単位に重複行を削除し単一にする。

1nm.muniq(k="date,customer", i="dat1.csv", o="rsl2.csv").run()
2### rsl2.csv の内容
3# date%0,customer%1
4# 20081201,A
5# 20081202,A
6# 20081202,B
7# 20081203,C

関連メソッド

  • mbest 指定行の選択 : 同一キーの中で何番目の行を選択するかを指定したい場合は mbest コマンドを使う。