第 1章 商務數(shù)據采集概述 1
1.1 初識數(shù)據 1
1.2 商務數(shù)據的涵義 6
1.3 商務數(shù)據來源與采集 9
第 2章 商務數(shù)據采集工具及應用 23
2.1 商務數(shù)據采集工具介紹 23
2.2 爬蟲軟件在商務數(shù)據分析中的應用 24
2.3 python爬蟲在商務數(shù)據采集中的應用 30
第3章 數(shù)據采集方法與采集器 38
3.1 初識數(shù)據采集器 38
3.2 數(shù)據采集器的安裝與界面 40
第4章 數(shù)據采集器應用 48
4.1 簡易模式及實例 48
4.2 向導模式及實例 49
4.3 自定義采集模式 55
第5章 數(shù)據采集器高級應用 70
5.1 屏蔽網頁廣告 70
5.2 切換瀏覽器版本 70
5.3 禁止加載圖片 71
5.4 增量采集 71
5.5 智能防封 73
5.6 登錄采集 75
5.7 網頁源碼提取 78
5.8 圖片、附件采集與下載 79
5.9 循環(huán)切換下拉框 80
5.10 移動鼠標到元素上 81
第6章 數(shù)據采集器定位方式及云采集 83
6.1 XPath數(shù)據定位 83
6.2 云采集 96
第7章 數(shù)據采集器采集實例 103
7.1 數(shù)據采集器應用領域 103
7.2 金融網站的數(shù)據采集 104
7.3 新聞網站的數(shù)據采集 109
7.4 職場招聘的數(shù)據采集 112
7.5 店鋪位置的數(shù)據采集 116
7.6 競品數(shù)據的采集 118
7.7 企業(yè)產品相關評論的采集 124
7.8 營銷推廣的數(shù)據采集 132
第8章 數(shù)據處理 138
8.1 數(shù)據清洗 138
8.2 數(shù)據加工 146