tutorialで利用されるデータやパターン認識の分野で有名なirisデータセットなど多様なデータセットを生成する。 このコマンドはパラメータの与え方が、他のコマンドと全く異なることに注意する。
mdata データセット名/パラメータ1/パラメータ2/...
データセット名とそれに対するパラメータを"/"で区切ることで指定する。 データセットの一覧と内容はTable 3.1に示すとおりである。 パラメータの与え方はそれぞれのデータセットによって異なり、その方法も同表に示されている。
データセット名 |
内容 |
パラメータ |
iris |
萼片と花びらの大きさによって、アヤメの種類の |
なし |
分類モデルの構築を目的に構成されるデータセット |
||
man0 |
本マニュアルのFigure 2.1で使われているデータ |
なし |
man1 |
本マニュアルのFigure 2.3で使われているデータ |
なし |
tutorial_jp |
チュートリアルで利用されるスーパーマーケットの |
データ名を指定すると各データが標準出力に出力される。 |
擬似購買データ。顧客マスターや商品マスターなど |
指定しないと全てのファイルがtutorial_jp |
|
複数のデータファイルから構成される。 |
ディレクトリの下に生成される。 |
|
データ名とその内容は以下のとおり。 |
||
dat:購買データ |
||
syo:商品マスター |
||
cust:顧客マスター |
||
jicfs1,jicfs2,jicfs4,jicfs6:商品分類マスター |
||
tutorial_en |
tutorial_jpデータセットの英語版 |
tutorial_jpに同じ |
irisデータセットを標準出力に出力する。
$ mdata iris SepalLength,SepalWidth,PetalLength,PetalWidth,Species 5.1,3.5,1.4,0.2,setosa 4.9,3,1.4,0.2,setosa 4.7,3.2,1.3,0.2,setosa 4.6,3.1,1.5,0.2,setosa :
チュートリアルデータセットを全てファイル出力する。
$ mdata tutorial_en #END# mdata tutorial_en $ ls -l tutorial_en total 4704 -rw-r--r-- 1 hamuro staff 20673 8 22 08:14 cust.csv -rw-r--r-- 1 hamuro staff 2281312 8 22 08:14 dat.csv -rw-r--r-- 1 hamuro staff 128 8 22 08:14 jicfs1.csv -rw-r--r-- 1 hamuro staff 529 8 22 08:14 jicfs2.csv -rw-r--r-- 1 hamuro staff 6630 8 22 08:14 jicfs4.csv -rw-r--r-- 1 hamuro staff 36400 8 22 08:14 jicfs6.csv -rw-r--r-- 1 hamuro staff 46466 8 22 08:14 syo.csv $ more tutorial_en/dat.csv customer,dob,gender 00000A,19711107,female 00000B,19461025,female 00000C,19660307,female :
商品マスターデータを標準出力に出力する。
$ mdata tutorial_en/syo product,productName,Code1Desc,Code2Desc,Code4Desc,Code6Desc,manufacturer,brand,unitCost 0000000,Processed_Seafood_2,1,11,1197,119705,0495,049502,310 0000001,Other_Yogurt_Drink_2,1,14,1404,140497,1658,165801,215 0000002,Carbonic_Flavor_3,1,14,1403,140305,1911,191100,406 :