隨著云計算、大數(shù)據(jù)、物聯(lián)網、人工智能和區(qū)塊鏈等IT 技術的發(fā)展與應用,信息技術不斷驅動社會生產方式的變革,人類進入機器智能時代。近年來,大數(shù)據(jù)處理技術已經廣泛地滲透到各行各業(yè),大數(shù)據(jù)分析與應用的教學工作也逐漸成為高校中的重中之重,這是大數(shù)據(jù)時代下的必然趨勢。本書從實際應用出發(fā),結合具體案例及應用場景,深入淺出地介紹大數(shù)據(jù)處理預備知識、Python 技術基礎、大數(shù)據(jù)處理常用模塊、大數(shù)據(jù)采集技術、大數(shù)據(jù)處理算法以及文本挖掘與應用等。從環(huán)境搭建到數(shù)據(jù)采集可視化,從數(shù)據(jù)預處理到特征選擇與模型訓練,再從模型調優(yōu)到測試評估。通過本書,讀者可掌握大數(shù)據(jù)處理中必備的知識體系和技能,在各領域開展大數(shù)據(jù)處理與研究工作。本書實例短小精練,便于學習,讀者能夠在短時間內掌握相關知識點及其應用。本書主要面向高等學校從事大數(shù)據(jù)處理和分析的本科生和研究生,亦可作為高等學校大數(shù)據(jù)處理相關課程的教材。此外,本書提供配套的軟件包、實例代碼和數(shù)據(jù)文件,歡迎使用本書作為教材的老師登錄www.cmpedu.com 進行下載。