About Me

我的相片
台北市, Taiwan
我是方選,
方白科技(finebind tech.)共同創辦人,
臺大資管所畢,
希望能幫助更多的人!

FB: http://fb.com/function1122
LINE: http://bit.ly/1foeZft (手機開啟點擊網址自動加入)

最新15則讀者回應

最新文章

FUNction's 上課筆記

Error loading feed.

Label Cloud

Blog Archive

FeedBurner

追蹤者

免註冊指考落點分析 (Powered by 台大資管)

FUNction 於 2011年7月8日 晚上10:19 發表
又到了填志願的時間,掐指一算過了好多年。只記得當年我沒有考指考,直接用推甄的,而推的學校也是親戚不知道哪裡弄來的「去年錄取分數表」,然後就不知不覺的過了大學。最近因緣際會下,朋友要我比較一下落點分析的網站,才發現原來現在好多學校都有提供這樣的服務,不禁讓我覺得,要是當年有這樣的工具也許會上更好的科系XD 市面上落點分析工具最麻煩的地方是要註冊或下載,不過現在都已經是雲端時帶了,下載幹嘛呢?讓我話不多說看看2011台大資管落點分析系統-ImWhatIM怎麼操作吧! ▲2011台大資管落點分析...
繼續閱讀全文 免註冊指考落點分析 (Powered by 台大資管)

碼上會!Java+libSVM 分析動態資料 (144行)

FUNction 於 2011年1月14日 下午3:17 發表
沒想到「碼上會」還會有第二集,標題有點聳動,但在這裡的「動態資料」指的是從資料庫load 出資料(一般libSVM都是標準格式的讀檔案來分析)。此外這篇還涉及處理一個文字探勘(Text Mining)中重要問題 ─ 資料分散(Sparse data)。由於網路上沒有其他實作,所以我想使用以下講解的程式碼,可以讓你加快libSVM的分析效能,也可以提升不少工作效率(不用再輸出多個檔案就能交叉測試)。 ▲將libSVM嵌入你的java程式,從資料庫中撈出資料直接訓練 libSVM簡介...
繼續閱讀全文 碼上會!Java+libSVM 分析動態資料 (144行)

碼上會! mmseg4j 中文斷詞java 實作 (55行)

FUNction 於 2010年10月16日 晚上10:06 發表
好,我承認標題下得有點好笑,而且也很意外寫這種實作的文章(我早就往理論派轉型了)。總之照著這篇文章的步驟,你可以使用java 將一串正體(繁體)中文的字串依照詞彙切開,以方便進行中文文字探勘(Text Mining)等計算詞頻的工作。 ▲mmseg4j中文斷詞結果,可以看到它把「處理」、「文章」等詞分割出來 首先呢,為了簡化開發,程式都在Eclipse 上開發,以下用簡單兩句話說明Eclipse 如何安裝: 到Java網站,下載並安裝JRE (請選擇合適的作業系統) ...
繼續閱讀全文 碼上會! mmseg4j 中文斷詞java 實作 (55行)

感知學習演算法(Perceptron Learning Algorithm)白話說明

FUNction 下午6:44 發表
看完這篇文章,你會對機器學習最入門的概念─「感知學習演算法」有基本的認知。因為筆者數學並不好,為了寫這篇,我花了大約30小時,看了10多個版本的教學(n次),在成大數學的高手歐民同學的指導下,站在好懂的角度撰寫,希望不會令你感到失望 :) 感知器是幹麻用的? 用來產生判斷結果!會經由多個輸入的數據,透過運算產生一個非黑即白的結果,用途相當廣泛。例如透過收入、負債的數據,協助銀行判斷顧客是否可以核辦信用卡(可發/不可發)、或是可以找出潛在消費者(潛在/非潛在)、判斷股票未來的走勢(漲/跌)等等。...
繼續閱讀全文 感知學習演算法(Perceptron Learning Algorithm)白話說明

2010 暑假生活總回顧

FUNction 於 2010年9月12日 晚上9:23 發表
明天(9/13)即將開學,讓我們來回顧一下這個暑假吧!整個暑假近三個月的時間(6/24~7/12),大致上可以分成三個部分。前半段以資種生活為主,令人流連的南京海外參訪、招生專案以及中間的許多小活動;後半段以政大生活為中心,包括大和國的畢業旅行、新生迎新共識營等等。至於第三個部分,是一直貫串的創業與家庭生活,我認為是我的主軸,雖然創業進度大大落後,讓人不堪回顧放假前訂的計畫(說的大話),但我想累積的這些知識,與自我學習的態度,仍是相當可觀的收穫! 暑期作息表 七月十八日,老楊的研討會論文告一段落(deadline:7/16),我花了兩天的時間,安排暑假的作息,如下表:...
繼續閱讀全文 2010 暑假生活總回顧

中譯:進階領域獨立的線性文件分段 (Advances in domain independent linear text segmentation)

FUNction 於 2010年8月19日 下午5:51 發表
這依然是一篇逐字翻譯的文章,需要注意的是第四節「評估」我沒有完全翻完,因為我已經在第三節「演算法」找到我想看的東西了,而第四節主要就有點老王賣瓜的比較與其他分段方法的優越性,因此我只翻譯了第四節的結論,有興趣的讀者可以閱讀原文。本文分段完全依照原文所訂,對照起來應該相當容易,末段「心得」為我的見解,也一併與你分享。當然,翻譯的目的依然是讓中文為母語的讀者能快速掌握這些知識,以利後進學者的研究。   ▲研究苦悶可以到郊外走走,看見藍天白雲和蔚藍的大海,必能使人心曠神怡(圖為筆者6:40...
繼續閱讀全文 中譯:進階領域獨立的線性文件分段 (Advances in domain independent linear text segmentation)

中譯:使用語彙鏈建立文件摘要(Text Summarzation Using Lexical Chains)

FUNction 於 2010年8月14日 上午11:10 發表
找到這篇是因為看了一篇寫得非常非常好的國內論文《混合式自動文件摘要方法》(這真的寫得非常好,學習Text Mining 非常推薦以之為基礎),想要多了解文法剖析法(Linguistic Approach),因為文中指出Brunn所作的《Text Summarization Using Lexical Chains》提出的系統架構與我的想法相近。但後來發現命題相近的《Using lexical chains for text summarization》可能才是所謂的key paper(引用598次),不過都翻譯了,就丟上來啦。我依照原文的章節形式分段,並用標楷體標註非作者提及的內容,文末心得處亦為我讀後的見解,為了避免讀者混淆,特別在此註明。...
繼續閱讀全文 中譯:使用語彙鏈建立文件摘要(Text Summarzation Using Lexical Chains)

資訊種子:即將大三到碩一的你 請讀這篇可能改變你一生的文章

FUNction 於 2010年8月8日 晚上7:14 發表
「資訊種子」不限資訊相關科系學生參加,是台北縣電腦公會辦的公益(免費)活動,為期一年。聘請經理級以上講師固定於周六下午上課(課程內容包含資訊產業、數位內容、生涯規劃、智慧財產…),此外還有企業參訪、專案參與及海外參訪,最重要的是,誠如我說的,可以完成學生階段「認識不同領域的優秀人才」的目標。   ▲想要成為眾所矚目的焦點,加入資種,你也可以! 好了,其實已經差不多介紹完了!我認為在資訊種子最大的收穫是能夠認識許多優秀、負責且活躍的同儕,這些人脈的培養將會使你在未來的人生上左右逢源。舉個簡單的例子,據我所知,本屆資訊種子的學員報名微軟實習計畫全部都錄取了,由此可知將資訊種子比喻為成功的搖籃毫不為過。...
繼續閱讀全文 資訊種子:即將大三到碩一的你 請讀這篇可能改變你一生的文章

什麼是 馬...馬可夫鏈(Markov Chains)?

FUNction 於 2010年8月6日 下午5:15 發表
「人生的課題,如果你沒有學會處理,它就會一而再、再而三的讓你練習」…其實也沒那麼嚴肅啦,只是小時候沒學好,最近讀論文的時候一直碰到馬可夫鏈…讓我覺得很卡,於是想說花一些時間把這個關節打通。我希望用一些淺顯易懂的文字寫一些老嫗能解的馬可夫鏈概念(千萬不要像維基百科寫得像天書般),這就是邊學邊寫的最高境界吧,我想! ▲當我聽到「馬可夫鏈」的時候,總會想像一條長長的鏈子,鏈住馬的頭@@ 正文開始 我們想像有一些加以編號的桶子,每個桶子裡面裝著數顆編號過的球,如下圖所示: ...
繼續閱讀全文 什麼是 馬...馬可夫鏈(Markov Chains)?