在meeting 中常聽到: 你有什麼comment? 這是個good point! 在這個Algorithm中,我們會先… 雖然既有的單語辨識系統已經漸趨成熟,但在實務上,雙語辨識系統的確有其需要。要建構中英雙語辨識系統,必須要考慮兩種語言的特性,並加以整合。此外,實務應用上的「自發性語音(spontaneous speech)」常伴有許多的停頓、重複、無意義的語助詞或不完整的段落。而且演說者常會把英文說得有點想像中文,例如facebook會說成「非死不可」之類的,也會增加辨識的難度(中:英...
中英混雜自發性語言語音辨識之研究
由 FUNction 於 2010年6月17日
晚上8:41 發表
建立中文廣播新聞摘要之研究
由 FUNction 於 2010年6月15日
中午12:23 發表
中文語音辨識 語音文件無法被概括性的瀏覽,只能循序瀏覽到最後才能了解整篇文件要表達的含意。相同內容,由不同的人說出來的語音文件,除了聲調、音量外,口音也會使每篇語音文件顯得不同。即使是相同的人,也會因為環境、身體狀況而改變語音文件的品質。 「索引特徵」是資訊檢索、分類系統表示文件或使用者問句的基礎。在中文裡,特徵分為詞(word-level)、字(Character-level)以及音節(syllable-level)三個層次。結構上中文具有以下特質: 中文一個字就是一個音節...
新聞事件偵測與時間分析之研究
由 FUNction 於 2010年6月14日
下午1:37 發表
主題事件的分類(TDT, Topic Detection and Tracking),五大追蹤方向 文件切割(Story Segmentation):將依則包含許多新聞的文件切割成許多單獨新聞的文章 主題追蹤(Topic Tracking):找出新進文件是否與之前主題相關 主題偵測(Topic Detection):將探討鄉圖主題的文件分類 第一則新聞偵測(First Story Detection):判斷新進文件是否屬於新的主題或是尚未討論過的主題 連結偵測(Link...
99台大資管所榜眼上榜心得:感恩篇
由 FUNction 於 2010年6月5日
下午1:25 發表
我想第一要感謝的還是我的家人,他們知道我要考試讓我能安心念書,不需要操心家務。特別感謝老爸和老弟,是老爸才讓我抓住這個嘗試的機會,而老弟陪我一起念書(雖然我唸書的時間不多,而且考前的周末我老弟還跟朋友去彰化玩三天兩夜XD),讓我有共同奮戰的感覺! 結果我瘋狂的在我家樓下的門貼上榜文,這是我與老爸的合照XD 第二是感謝文昌爺爺,雖然筆試的時候我沒有拜祂,因為我覺得我準備的不夠,拜祂是一種褻瀆。但是我跟我自己講,如果進了口試,我就有資格拜祂。果然他給我力量,讓我在台大獲取更多的資源,造福社會。口試時我一直帶著祂的御守,一定是因為祂的守護,才能讓我能如此順利…...