最近被導(dǎo)師告知要做數(shù)據(jù)挖掘方面的東西,于是一竅不通的我硬著頭皮學(xué)起了數(shù)據(jù)挖掘。首先便是工具的問題,對一竅不通的我來說選工具實在是個難題,想想還是找個開源的吧。當(dāng)然這方面的文章很多,開源的數(shù)據(jù)挖掘工具也很多,比較了半天終于選定了KNIME。 然而
最近被導(dǎo)師告知要做數(shù)據(jù)挖掘方面的東西,于是一竅不通的我硬著頭皮學(xué)起了數(shù)據(jù)挖掘。首先便是工具的問題,對一竅不通的我來說選工具實在是個難題,想想還是找個開源的吧。當(dāng)然這方面的文章很多,開源的數(shù)據(jù)挖掘工具也很多,比較了半天終于選定了KNIME。
然而,接下來又是一個頭大的問題,這個玩意兒沒有中文幫助,好吧,華麗麗的去看英文幫助文檔。。
搞清楚了它的基本工作原理之后便是要把那些節(jié)點的功能弄清楚,不然節(jié)點的基本功能都沒有,如何建模呢?好吧,邊學(xué)邊練。。
首先是連數(shù)據(jù)庫,因為大部分的數(shù)據(jù)還是要從數(shù)據(jù)庫讀入的。如果只是讀入一張表的話,Database Reader就可以了,KNIME自帶的是JDBCODBC Driver,我想大家應(yīng)該都有用windows的管理工具建過數(shù)據(jù)源吧?是的,就是那個。在Database URL參數(shù)下輸入那個就行了jdbc:odbc:
但當(dāng)時我的連接并沒有成功,還以為這個參數(shù)理解錯了,后來才發(fā)現(xiàn)該項配置還有一個參數(shù):SQL Statement,其默認值是:SELECT * FROM