NYSOL(「にそる」と読む*)とは

大規模データの解析に関する様々な大学やプロジェクトでの研究成果を

広く産業界に還元する目的で構築されたソフトウェアツールの総称およびそのプロジェクト活動である。

UNIX環境(Linux, Macなど)で動作する。



MCMD(Mコマンド)
バージョン 1.2 マニュアル(htmlpdf),  変更点
バージョン 2.0 マニュアル(html, pdf)  
大規模な表構造データ(CSVデータ)を効率よく処理する目的で開発された
オープンソースのコマンド群である。一般のPCでも数千万件〜数億件のCSVデータを処理できる。
Take
マニュアル(pdf)

頻出パターンマイニングに関する各種コマンドを提供する。頻出アイテム集合、系列パターンについて、emerginパターンやtaxonomyを加味したパターン列挙が可能。コアアルゴリズムとしてLCMVSOPを利用している。
ZDD
マニュアル(htmlpdf)

本パッケージは、ZDD(Zero-suppressed Binary Decision Diagrams: ゼロサプレス型二分決定グラフ)を利用し、 重み付きのアイテムの組み合わせ集合をコンパクトに格納することを可能とするVSOP (Valued-Sum-Of-Products calculator)
をruby拡張ライブラリとして実装したものである。
Mining
マニュアル(pdf)

データマイニングや機械学習の手法を提供するパッケージで、大学の研究室で開発されたツールや統計パッケージRと連動したコマンドなどを提供する
School
チュートリアル, Q&A, 応用スクリプト集

NYSOLパッケージのチュートリアル、Q&A、様々な応用スクリプトを公開していくことで、NYSOLの学習支援を行うことを目的としたサブプロジェクトである。
  • MCMDチュートリアル(htmlpdf)
 Ekillion(えきりおん)

JR大都市近郊区間内の経路を対象に、指定条件にあわせて全パスを高速列挙するアプリケーションである。パス列挙にはJST ERATO 湊離散構造処理系プロジェクトで開発された Graphillion を使っている。
RubyM
マニュアル(htmlpdf)

Ruby上で大規模なCSVデータを扱うためのRuby拡張ライブラリ。シーケンシャルな読み込み/ 書き込み関数、 そしてセル単位でのランダムアクセス関数などがある。 いずれの関数もCSVの標準仕様であるRFC4180に概ね準拠しており カンマや改行を含む文字列も扱うことができる。
View
マニュアル(html, pdf)

視覚化のコマンドを集めたパッケージで、GraphVizGephiで描画可能なグラフデータを構築したり、D3で描画可能な各種チャートを簡単に生成できるようにしたコマンドなどが含まれる。
Fumi
マニュアル(html, pdf)

テキストマイニング関連のコマンドを集めたパッケージで、jumanknpを用いた日本語文の形態素解析や構文解析に始まり、格フレームの抽出や辞書登録などを用意に実現できるようにしたパッケージであ
る。
KABU
AMI
FUJI
 センチメント指数(ダウンロード)   

ファイナンスに関する以下の研究成果を公開している。
株式市場における市場心理をニュース記事から測定する試み。
・取引コストやマーケットインパクトコストなどを考慮した株取引のシミュレーションプログラム。
 準備中 準備中

*「にそる」の語源はアイヌ語で「雲」である。本プロジェクトがERATO湊離散構造処理系プロジェクトへの参加をきっかけとして発足したことから、「北海道」と「クラウド時代」の二つの意味をかけている。

www.nysol.biz


NYSOL ソフトウェアの商用サポート・トレーニング等についてはこちら