《基于python的web大數(shù)據(jù)爬取實戰(zhàn)指南》主要研究基于Python的Web大數(shù)據(jù)爬取,采用Python語言實現(xiàn)。《基于python的web大數(shù)據(jù)爬取實戰(zhàn)指南》貫穿各種爬蟲算法與案例進行講解,是一本典型的實戰(zhàn)指南。內容涵蓋基礎知識和數(shù)據(jù)爬取兩大部分,涉及網絡爬蟲入門、Python基礎、HTML基礎、正則表達式、Selenium技術、網頁自動登錄和數(shù)據(jù)庫存儲等知識?!痘趐ython的web大數(shù)據(jù)爬取實戰(zhàn)指南》結合實例詳細講解了Python網絡爬蟲的各種技術,抓取在線百科、技術博客、新浪微博、游迅網、生物醫(yī)學網等的信息,構思合理,從基礎知識到案例代碼,由淺入深地將知識分享給讀者。《基于python的web大數(shù)據(jù)爬取實戰(zhàn)指南》符合國家大數(shù)據(jù)發(fā)展戰(zhàn)略,有利于推動各地區(qū)的大數(shù)據(jù)發(fā)展,為底層大數(shù)據(jù)挖掘技術做出貢獻。