近年來,自然語言處理中的統(tǒng)計學方法已經逐漸成為主流。本書是一本全面系統(tǒng)地介紹統(tǒng)計自然語言處理技術的專著,被國內外許多所著名大學選為計算語言學相關課程的教材。本書涵蓋的內容十分廣泛,分為四個部分,共16章,包括了構建自然語言處理軟件工具將用到的幾乎所有理論和算法。全書的論述過程由淺入深,從數(shù)學基礎到精確的理論算法,從簡單的詞法分析到復雜的語法分析,適合不同水平的讀者群的需求。同時,本書將理論與實踐緊密聯(lián)系在一起,在介紹理論知識的基礎上給出了自然語言處理技術的高層應用(如信息檢索等)。在本書的配套網站上提供了許多相關資源和工具,便于讀者結合書中習題,在實踐中獲得提高。本書不僅適合作為自然語言處理方向的研究生的教材,也非常適合作為自然語言處理相關領域的研究人員和技術人員的參考資料。近年來,統(tǒng)計自然語言處理(或稱統(tǒng)計語言學)異軍突起,現(xiàn)已成為自然語言處理研究的主流。本書是一本全面系統(tǒng)地介紹統(tǒng)計自然語言處理技術的專著,已經被國內外許多所著名大學選為計算語言學相關課程的教材。本書涵蓋的內容十分廣泛,分為四個部分,共16章,包括了構建自然語言處理軟件工具將用到的幾乎所有理論和算法。為了方便學生和研究人員建立自己的語言處理系統(tǒng),本書不僅提供了寬廣而精確的數(shù)學和語言學理論基礎,還詳細討論了統(tǒng)計語言模型,并覆蓋了搭配查找、語義消歧、概率分析、信息檢索和其他應用。