本書系統介紹了自然語言處理及深度學習,并結合實際應用場景和綜合案例,深入淺出地講解自然語言處理領域的相關知識。 全書共 15 章,分為 4 個部分。第 1 部分是自然語言處理基礎,首先介紹自然語言處理的相關概念和基本技能,然后介紹詞向量技術和實現方法,最后介紹關鍵詞提取技術。第 2 部分是自然語言處理核心技術,分別介紹樸素貝葉斯算法、N-gram 語言模型、PyTorch 深度學習框架、FastText 模型文本分類和基于深度學習的文本分類。第 3 部分是序列標注,介紹序列標注的具體應用,如 HMM 詞性標注和 HMM 命名實體識別等常見的自然語言處理應用場景。第 4 部分是預訓練模型,它在很大程度上促進了自然語言處理的發(fā)展,這部分內容關注預訓練模型的具體應用,如 ALBERT 的命名實體識別、Transformer 的文本分類、BERT的文本相似度計算、ERNIE 的情感分析等。 本書適合對人工智能、機器學習、深度學習和自然語言處理感興趣的讀者閱讀,也可以作為應用型本科院校和高等職業(yè)院校人工智能相關專業(yè)的教材。