統計模型是數據分析的重要工具,模型選擇則是統計學研究的核心問題之一正如英國統計學家George E.P.Box所言,“所有模型都是錯的,但其中有一些是有用的”、我們很難找到一個在任何情況下,表現都很出眾的模型,而模型平均作為模型選擇的推廣形式,能幫助我們克服模型選擇的不確定性,得到更加穩(wěn)定和精確的估計或預測。隨著科技的進步,人們收集到的數據更加海量和多元,建立的模型也更加復雜。本書基于復雜的數據和模型,進一步拓展了模型平均理論,研究成果主要包括以下幾個方面:(1)研究高維縱向數據的半參數模型,以預測誤差最小化為目標,首次提出了雙權重的刪組交叉驗證準則,并基于這一準則證明了所提出刪組模型平均估計量的漸近**性。數值結果也表明本書所提出方法比其他常用的模型選擇或模型組合方法表現更優(yōu);(2)基于經濟和醫(yī)療上常用的處理效應模型,針對條件平均處理效應的估計,提出了相應的OPT模型平均準則。建立了這一準則下**的模型平均估計量,證明了其漸近**性,數值模擬上包含與**模型平均方法的比較,結果顯示,研究提出的估計量大多數情況下表現**;(3)對比了常用的模型平均方法和機器學習方法,一方面,進行了廣泛的數值論證,對兩種方法在不同設置下的表現進行了比較;另一方面,提出了綜合兩類平均方法優(yōu)勢的交叉驗證(MTCV)組合方法,新方法能夠自適應地給出較優(yōu)結果。