好,我承認標題下得有點好笑,而且也很意外寫這種實作的文章(我早就往理論派轉型了)。總之照著這篇文章的步驟,你可以使用java 將一串正體(繁體)中文的字串依照詞彙切開,以方便進行中文文字探勘(Text Mining)等計算詞頻的工作。 ▲mmseg4j中文斷詞結果,可以看到它把「處理」、「文章」等詞分割出來 首先呢,為了簡化開發,程式都在Eclipse 上開發,以下用簡單兩句話說明Eclipse 如何安裝: 到Java網站,下載並安裝JRE (請選擇合適的作業系統) ...
碼上會! mmseg4j 中文斷詞java 實作 (55行)
由 FUNction 於 2010年10月16日
晚上10:06 發表
感知學習演算法(Perceptron Learning Algorithm)白話說明
由 FUNction 於
下午6:44 發表
看完這篇文章,你會對機器學習最入門的概念─「感知學習演算法」有基本的認知。因為筆者數學並不好,為了寫這篇,我花了大約30小時,看了10多個版本的教學(n次),在成大數學的高手歐民同學的指導下,站在好懂的角度撰寫,希望不會令你感到失望 :) 感知器是幹麻用的? 用來產生判斷結果!會經由多個輸入的數據,透過運算產生一個非黑即白的結果,用途相當廣泛。例如透過收入、負債的數據,協助銀行判斷顧客是否可以核辦信用卡(可發/不可發)、或是可以找出潛在消費者(潛在/非潛在)、判斷股票未來的走勢(漲/跌)等等。...