近10,000分鐘口語錄音及其轉寫文本120萬詞的作文語料多種自主開發(fā)的研究工具《中國學生英語口筆語語料庫2.0》(SWECCL2.0)是一個全新的語料庫,包含口語子庫和筆語子庫??谡Z子庫的主要特色全新語料,共100萬余詞,源于2003-2007間全國英語專業(yè)四、八級口試;文本按照不同任務類型切分,便于研究的開展;語音文件采用mp3格式保存,便于使用者瀏覽、編輯、加工和標注。筆語子庫的主要特色全新語料,120萬詞,源于高校擴招以來的學生作文;包含27個不同題目的學生英語議論文和說明文;配有多種自主開發(fā)的研究工具,包括:1)用于從總庫中抽取子庫的Sub—corpus Generator:2)可以快速提取多種語言特征的Pat Count3)專門用于分析類聯接的Colligator。本項目得到教育部人文社會科學重點研究基地北京外國語大學中國外語教育研究中心的資助。