目錄
前言
第一章 導論 1
1.1 信息、語言信息和語篇信息 1
1.2 語篇信息分析 4
1.3 語篇信息挖掘 9
1.4 本書章節(jié)安排 14
第二章 語篇信息挖掘研究的基礎 16
2.1 語篇信息理論 16
2.1.1 基本概念 16
2.1.2 主要理論模式 20
2.1.3 基本觀點 21
2.1.4 分析過程和工具 23
2.1.5 發(fā)展及應用前景 24
2.2 其他語言學理論 25
2.2.1 修辭結構理論 26
2.2.2 體裁分析理論 28
2.2.3 系統(tǒng)功能語言學理論 29
2.3 自然語言處理 30
2.3.1 現(xiàn)狀 30
2.3.2 分析技術 32
2.3.3 機器學習 34
2.3.4 主要難題 36
2.4 數(shù)據(jù)挖掘 37
2.4.1 數(shù)據(jù)挖掘與信息挖掘 37
2.4.2 數(shù)據(jù)挖掘方法與信息挖掘方法 38
2.4.3 數(shù)據(jù)挖掘技術的特點 38
2.4.4 數(shù)據(jù)挖掘技術與語料庫 39
2.4.5 數(shù)據(jù)挖掘技術的信息視角 40
2.4.6 數(shù)據(jù)挖掘技術在信息挖掘中的應用 40
2.5 網絡搜索 41
2.5.1 網絡搜索的基本原理及局限性 41
2.5.2 網絡搜索的智能化 42
2.5.3 搜索引擎與數(shù)據(jù)采集器 43
第三章 語篇信息挖掘的技術條件 44
3.1 概述 44
3.2 語料庫 47
3.2.1 語料庫概述 47
3.2.2 語料庫功能 48
3.2.3 語料庫技術基礎 49
3.2.4 信息型語料庫 51
3.3 數(shù)據(jù)庫 54
3.3.1 數(shù)據(jù)庫種類 54
3.3.2 數(shù)據(jù)庫的技術優(yōu)勢 56
3.3.3 數(shù)據(jù)庫技術的新發(fā)展 57
3.4 互聯(lián)網 58
3.4.1 互聯(lián)網資源 58
3.4.2 互聯(lián)網技術基礎 61
3.4.3 互聯(lián)網的技術共享 68
3.4.4 互聯(lián)網信息處理的障礙 68
3.5 搜索引擎 69
3.5.1 搜索引擎的種類 69
3.5.2 搜索引擎的主要功能 70
3.5.3 搜索引擎的局限性 71
3.5.4 搜索引擎的發(fā)展方向 72
3.5.5 搜索引擎為信息挖掘提供的技術基礎 73
第四章 語篇信息分析過程 75
4.1 概述 75
4.2 分析設計 76
4.3 宏觀信息結構 77
4.3.1 樹型結構模式 78
4.3.2 樹干結構模式 81
4.4 信息流動調控 84
4.4.1 調控者模式 85
4.4.2 調控方式模式 87
4.5 信息組合 89
4.5.1 主觀+客觀+說明信息模式 90
4.5.2 信息配置與變換模式 92
4.6 微觀信息結構 95
4.6.1 微觀信息結構模式 95
4.6.2 微觀信息配置模式 96
4.7 信息功能 96
4.7.1 交際指向模式 97
4.7.2 功能配置模式 98
4.8 基本信息模式總結 99
第五章 以信息挖掘為指向的多角度研究 101
5.1 概述 101
5.2 體裁分析 103
5.3 語用分析 108
5.4 認知分析 110
5.5 調查研究 120
5.6 實驗研究 125
5.6.1 文本鑒別實驗 126
5.6.2 語音識別實驗 128
5.6.3 語言心理實驗 131
第六章 信息挖掘模式的核心構成 132
6.1 規(guī)則的歸納 132
6.1.1 語篇分類規(guī)則 133
6.1.2 宏觀結構規(guī)則 134
6.1.3 微觀結構規(guī)則 136
6.1.4 語義分析規(guī)則 140
6.1.5 語篇語言分析規(guī)則 141
6.2 規(guī)則的組織和運行 143
6.2.1 規(guī)則運用舉例 144
6.2.2 規(guī)則庫 147
6.2.3 規(guī)則庫結構 149
6.2.4 其他相關機制 150
6.3 經驗主義方法在信息挖掘中的應用 151
6.3.1 規(guī)則控制中的機器學習 152
6.3.2 信息挖掘過程中的機器學習 152
6.3.3 粗糙集算法應用舉例 153
第七章 信息挖掘模式的架構 156
7.1 信息模式識別 156
7.1.1 信息模式的類別 157
7.1.2 信息模式的用途 158
7.1.3 信息模式識別的基本條件 159
7.1.4 信息模式識別技術 160
7.1.5 信息模式識別過程 162
7.2 信息模式預測 164
7.2.1 語篇體裁線索 165
7.2.2 核心信息線索 166
7.2.3 關鍵概念線索 167
7.2.4 同種類語篇的共性線索 168
7.2.5 信息模式預測的步驟 169
7.3 信息模式生成 170
7.3.1 信息模式生成的基本條件 171
7.3.2 信息模式生成機制 172
7.3.3 信息模式的基本指標及其優(yōu)化 174
7.4 語篇類別分析 176
7.4.1 語篇類別與分析 176
7.4.2 語篇共性分析 178
7.4.3 語篇差別分析 179
7.4.4 語篇單獨分析 180
7.4.5 語篇大樣本分析 181
第八章 信息挖掘技術及其實際應用 183
8.1 語篇信息提取 183
8.1.1 信息提取及使用 184
8.1.2 普通信息檢索 185
8.1.3 語篇信息檢索 186
8.1.4 多模態(tài)信息處理 188
8.1.5 信息提取的相關問題 190
8.2 輿論走向預測 191
8.2.1 輿論走向 191
8.2.2 輿論走向的語篇信息分析方法 193
8.2.3 輿論走向預測的步驟 194
8.2.4 未來發(fā)展 198
8.3 網絡信息挖掘 199
8.3.1 應用空間 200
8.3.2 數(shù)據(jù)挖掘 201
8.3.3 數(shù)據(jù)與信息 202
8.3.4 信息挖掘過程 203
8.3.5 技術要求和信息挖掘原則 205
8.4 信息平臺建設 206
8.4.1 平臺的基本功能 206
8.4.2 主要模塊 211
8.4.3 平臺的基本技術要求 212
8.5 信息挖掘技術的服務對象 213
第九章 結束語 217
9.1 概述 217
9.1.1 語篇信息挖掘研究的背景、任務、思路和方法 217
9.1.2 語篇信息挖掘的相關技術和信息庫工具 219
9.1.3 未來的研究 220
9.2 主要觀點歸納 221
9.3 解決的主要問題 224
9.4 未來發(fā)展 229
參考文獻 230