目 錄
第1章
信息檢索及其主要研究內容 1
1.1 信息檢索 3
1.1.1 信息檢索的基本概念 3
1.1.2 信息檢索的研究內容 3
1.1.3 研究現狀和發(fā)展趨勢 4
1.1.4 結構化、半結構化和非結構化信息 5
1.2 大數據背景下的信息檢索 6
參考文獻 7
第2章
信息檢索的需求表達 11
2.1 需求表達 13
2.2 需求表達的主要理論方法 13
2.3 需求表達存在的主要問題分析 14
2.4 信息需求域 15
2.4.1 機器信息檢索:用關鍵詞匹配近似語義匹配 15
2.4.2 文檔、句子及詞語之間的語義關系 15
2.4.3 信息需求域 18
2.4.4 信息需求域的理論推導 22
2.4.5 信息需求域的子域、近似域 24
2.4.6 查詢請求與信息需求的關系 26
2.4.7 信息需求域的理論意義 29
2.4.8 信息需求域的一種粗糙集解釋 29
2.5 小結與討論 33
參考文獻 34
第3章
信息檢索的檢索模型 37
3.1 信息檢索的主要檢索模型 39
3.2 查詢擴展、相關反饋研究現狀 42
3.3 檢索存在的主要問題分析 43
3.4 信息需求域基礎上的信息檢索 45
3.4.1 信息需求域的結構 45
3.4.2 文檔相似度的定義 50
3.5 檢索模型的發(fā)展方向分析 59
參考文獻 60
第4章
文檔索引的建立 67
4.1 附加統(tǒng)計信息的倒排索引 69
4.2 停用詞 71
4.3 詞干提取 71
4.4 詞形歸并 72
4.5 小結與討論 73
參考文獻 73
第5章
信息檢索系統(tǒng)的評價方法 75
5.1 測試集 77
5.2 無序檢索結果的評價 79
5.3 排序檢索結果的評價 80
5.4 小結與討論 82
參考文獻 82
第6章
偽相關文檔反饋需求域模型信息檢索 85
6.1 偽相關文檔反饋機制 87
6.2 需求域去噪 87
6.3 偽相關文檔反饋機制的模型分析 89
6.3.1 去噪性能分析與實驗 91
6.3.2 去噪參數β的取值分析與實驗 95
6.3.3 參數α的取值分析與實驗 99
6.3.4 偽相關反饋文檔數目及穩(wěn)定性分析與實驗 101
6.4 偽相關文檔反饋機制下的需求域模型結論 103
6.4.1 需求域模型結論 104
6.4.2 檢索性能對比實驗分析 106
6.5 小結與討論 111
參考文獻 112
本章附錄 112
第7章
用戶相關文檔反饋需求域模型信息檢索 117
7.1 用戶相關文檔反饋機制 119
7.2 用戶相關文檔反饋機制下的模型分析 120
7.2.1 用戶相關文檔反饋下的上界優(yōu)化分析與實驗 121
7.2.2 優(yōu)化參數β的取值分析與實驗 124
7.2.3 參數α的取值分析與實驗 127
7.2.4 相關反饋文檔數目及穩(wěn)定性的分析與實驗 130
7.3 用戶相關文檔反饋機制下的需求域模型結論 133
7.3.1 需求域模型結論 133
7.3.2 檢索性能對比實驗分析 135
7.4 需求域模型計算性能分析 139
7.5 小結與討論 140
全書參考文獻 143