本書共分 3 篇,針對 Python 爬蟲初學者,從零開始,系統(tǒng)地講解了如何利用 Python 進行常見的網絡爬蟲的程序開發(fā)。第 1 篇快速入門篇(第 1 章 ~ 第 9 章):本篇主要介紹了 Python 環(huán)境的搭建和一些 Python 的基礎語法知識等、Python爬蟲入門知識及基本的使用方法、Ajax 數據的分析和抓取、動態(tài)渲染頁面數據的爬取、網站代理的設置與使用、驗證碼的識別與破解,以及 App 數據抓取、數據的存儲方法等內容。第 2 篇技能進階篇(第 10 章 ~ 第 12 章):本篇主要介紹了 PySpider 和 Scrapy 兩個常用爬蟲框架的基本使用方法、分布式爬蟲的實現(xiàn)思路,以及數據分析、數據清洗常用庫的使用方法。第 3 篇項目實戰(zhàn)篇(第 13 章):本篇通過 6 個綜合實戰(zhàn)項目,詳細地講解了 Python 數據爬蟲開始與實戰(zhàn)應用。本篇對全書內容進行了總結回顧,強化讀者的實操水平。本書案例豐富,注重實戰(zhàn),既適合 Python 程序員和爬蟲愛好者閱讀學習,也適合作為廣大職業(yè)院校相關專業(yè)的教學用書。