《文本機器學習》系統(tǒng)性地介紹了多個經典的和前沿的機器學習技術及其在文本域中的應用。首先,詳細介紹了面向文本數據的預處理技術和經典的機器學習技術(如矩陣分解與主題建模、聚類與分類/回歸等),并深入探討了模型的原理和內在聯(lián)系以及相應的性能評估;其次,詳細介紹了結合異構數據的文本學習技術(如知識共享與遷移學習等),以及面向信息檢索與排序的索引和評分等技術;末尾,詳細介紹了一些文本應用相關的重要技術,包括序列建模與深度學習、文本摘要與信息提取、意見挖掘與情感分析、文本分割與事件檢測等。本書從技術原理到實際應用,綜合梳理了文本機器學習的多個技術,深入分析了模型的優(yōu)缺點和內在聯(lián)系,并在每章結束時提供了詳細的參考資料、軟件資源和習題。 《文本機器學習》不僅可以作為工具書供具有相關背景的專業(yè)人士使用,也可以作為教材幫助具有線性代數和概率論基礎的初學者入門。