1.6. sspc アイテム集合のクラスタリング¶
実装の詳細は simsetのオリジナル解説ページ を参照されたい。
パラメータ¶
type= : 型=str , 必須
* _:no message* +:write solutions in append mode* =:do not remove temporal files* @:do not execute data polishing, E:read edge list file* i:set similarity measure to the ratio of one is included in the other* I:set similarity measure to the ratio of both are included in the other* S:set similarity measure to \(|A\cap B|/max(|A|,|B|)\)* s:set similarity measure to \(|A\cap B|/min(|A|,|B|)\)* C:set similarity measure to the cosign distance, the inner product of the normalized characteristic vectors* T:set similarity measure to the intersection size, i.e., \(|A\cap B|\)* R:(recemblance) set similarity measure to \(|A\cap B|/|A\cup B|\)* P(PMI): set similarity measure to \(log(|A\cap B|*|all| / (|A|*|B|))\) where \(|all|\) is the number of all items* M:output intersection of each clique, instead of IDs of its members* v (with M): output ratio of records, including each item* m:do not remove edges in the data polishing phase* O:repeatedly similarity clustering until convergence* Y:take intersection of original graph and polished graph, instead of clique mining* 1:do not remove the same items in a record (with -G)* W:load weight of each element* t:transpose the input database, so that each line will be considered as a record
i= : 型=str , 必須
similarity-graph-filename
o= : 型=str , 必須
出力ファイル名を指定する。
th_s= : 型=float , 必須
similarity-threshold
th_d= : 型=int , 必須
degree-threshold
G= : 型=str , 任意(default=)
use [similarity] of [threshold] in the first phase (file is regarded as a transaction database)
k= : 型=int , 任意(default=)
find only k-best for each record inG
option
M= : 型=str , 任意(default=)
merge similar cliques of similarity in [num] of recemblance (changes to 'x' by giving '-Mx')
m= : 型=str , 任意(default=)
take independently cliques from similar cliques of similarity in [num] of recemblance,and merge the neighbors of each independent clique ('recemblance' changes to 'x' by giving '-Mx')
v= : 型=float , 任意(default=)
specify majority threshold (default=0.5)(if negative is given, items of frequency no more than -[num] are output)
u= : 型=int , 任意(default=制限なし)
ignore vertices of degree more than [num]
l= : 型=int , 任意(default=制限なし)
ignore vertices of degree less than [num]
U= : 型=int , 任意(default=上限なし)
ignore transactions of size more than [num] (with -G)
L= : 型=int , 任意(default=上限なし)
ignore transactions of size less than [num] (with -G)
I= : 型=int , 任意(default=上限なし)
ignore items of frequency more than [num] (with -G)
i= : 型=int , 任意(default=上限なし)
ignore items of frequency less than [num] (with -G)
II= : 型=float , 任意(default=上限なし)
give thresholds by the ratio of #ransactions/#items)
ii= : 型=float , 任意(default=上限なし)
give thresholds by the ratio of #ransactions/#items)
t= : 型=int , 任意(default=上限なし)
ignore pairs whose intersection size is less than [num] (T for first phase with -G option, and t for polishing)
T= : 型=int , 任意(default=上限なし)
ignore pairs whose intersection size is more than [num] (T for first phase with -G option, and t for polishing)
O= : 型=int , 任意(default=制限なし)
specify the number of repetitions
9= : 型=int , 任意(default=制限なし)
shrink records of similarity more than [num]
X= : 型=float , 任意(default=制限なし)
multiply the weight by [num] (and trancate by 1, for C command)
x= : 型=float , 任意(default=制限なし)
power the weight by [num] (and normalize, for C command)
y= : 型=float , 任意(default=制限なし)
at last, remove edges with weight less than [num]
w= : 型=str , 任意(default=重みは等しいものとする)
load weight of elements from the file
multi= : 型=int , 任意(default=1)
use multicores of [num] (compile by 'make multicore')
W= : 型=str , 任意(default=)
specify the working directory (folder).The last letter of the directory has to be '/' ('')
separator= : 型=str , 任意(default=スペース)
give the separator of the numbers in the output
Q= : 型=str , 任意(default=replaceしない)
replace the output numbers according to the permutation table given by [filename]
K= : 型=int , 任意(default=制限なし)
頻出な上位のアイテム集合のみ出力する
l= : 型=int , 任意(default=制限なし)
アイム集合のサイズの下限値を指定する。
u= : 型=int , 任意(default=制限なし)
アイム集合のサイズの上限値を指定する。
a= : 型=float(0以上1以下) , 任意(default=制限なし)
相関ルールマイニングを実施しconfidenceの下限値を与える。
A= : 型=float(0以上1以下) , 任意(default=制限なし)
相関ルールマイニングを実施しconfidenceの上限値を与える。
r= : 型=float(0以上1以下) , 任意(default=制限なし)
相関ルールマイニングを実施しrelational confidenceの下限値を与える。
R= : 型=float(0以上1以下) , 任意(default=制限なし)
相関ルールマイニングを実施しrelational confidenceの上限値を与える。
item= : 型=int , 任意(default=)
指定した番号のアイテムに関する相関ルールを出力する。
so= : 型=str , 任意(default=ファイル出力しない)
標準出力の内容を指定のファイルに出力する。
separator= : 型=str , 任意(default=スペース)
出力時のアイテムの区切り文字を指定する。