注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)新聞資訊歷史

概念史研究的數(shù)字轉(zhuǎn)向

2021年11月26日,復(fù)旦大學(xué)中國(guó)近代史青年學(xué)者讀書(shū)班2021年第7期在線上進(jìn)行?;顒?dòng)由復(fù)旦大學(xué)歷史學(xué)系章可副教授召集主持,南京大學(xué)學(xué)衡研究院暨歷史學(xué)院邱偉云副教授受邀主講

2021年11月26日,復(fù)旦大學(xué)中國(guó)近代史青年學(xué)者讀書(shū)班2021年第7期在線上進(jìn)行。活動(dòng)由復(fù)旦大學(xué)歷史學(xué)系章可副教授召集主持,南京大學(xué)學(xué)衡研究院暨歷史學(xué)院邱偉云副教授受邀主講,講座題目為《概念史研究的數(shù)字轉(zhuǎn)向》。評(píng)議人為北京師范大學(xué)文學(xué)院方維規(guī)特聘教授。本文為主講人發(fā)言整理稿,末附評(píng)議人發(fā)言稿。

主講人邱偉云

主講人邱偉云


主持人章可

主持人章可


過(guò)去十年的概念史研究法的數(shù)字轉(zhuǎn)向探索實(shí)踐,逐步證明了概念史研究法數(shù)字轉(zhuǎn)向的可能性,近年來(lái)也逐漸受到中國(guó)學(xué)界同行的肯定與關(guān)注。從全球概念史學(xué)界近年發(fā)展可見(jiàn),自2015年開(kāi)始已有海外名校同樣意識(shí)到將計(jì)算機(jī)學(xué)界的自然語(yǔ)言處理技術(shù)引入詞匯與概念研究中的可能性與發(fā)展前景。以下就從概念史研究的數(shù)字轉(zhuǎn)向?yàn)轭}來(lái)討論概念史研究方法數(shù)字轉(zhuǎn)向的可能發(fā)展與前景所在。

節(jié)點(diǎn)1:什么是概念史(history of concepts)?

由于參加我們今天這個(gè)討論會(huì)的師友們,有些是計(jì)算機(jī)學(xué)界的朋友,因此我先大概說(shuō)明一下何謂概念史(history of concepts)。根據(jù)方維規(guī)老師研究指出,德文Begriffsgeschichte(概念史)一詞最早出現(xiàn)于黑格爾﹙Georg Wilhelm Friedrich Hegel﹐1770–1831﹚的《歷史哲學(xué)講座》中,指基于普遍觀念撰述歷史的方式,用來(lái)指稱(chēng)一種史學(xué)類(lèi)型,即考察藝術(shù)、法學(xué)和宗教的歷史,可以納入哲學(xué)史的范疇。而后在科塞雷克 (Reinhart Koselleck, 1923-2006)所主編的八卷本《歷史基本概念-德國(guó)政治和社會(huì)語(yǔ)言歷史辭典》(1972-1997)與《歷史語(yǔ)義學(xué)與概念史》(1979)書(shū)中,完成了“概念史”學(xué)派的定型。簡(jiǎn)言之,概念史研究的目的,即希望通過(guò)考察重大概念在不同歷史語(yǔ)境中的社會(huì)影響,推導(dǎo)出政治社會(huì)群體運(yùn)用特定概念的典型張力,進(jìn)而分析時(shí)代、社會(huì)、政治的結(jié)構(gòu)變化,最后重構(gòu)社會(huì)史的截面,進(jìn)一步呈現(xiàn)出整個(gè)社會(huì)歷史,提供史學(xué)研究一個(gè)新范式。在概念史研究法特征上,我們發(fā)現(xiàn)了能與計(jì)算機(jī)學(xué)界文本探勘技術(shù)進(jìn)行協(xié)作研究的著力點(diǎn)所在,因?yàn)槲谋咎娇奔夹g(shù)正是一種可計(jì)算長(zhǎng)時(shí)段中巨量文字語(yǔ)料里的詞語(yǔ)結(jié)構(gòu)及其變化的數(shù)字技術(shù),從這角度而言,文本探勘技術(shù)即能介入概念史研究視野,輔助概念史研究工作者進(jìn)行復(fù)雜與長(zhǎng)時(shí)段的概念形成、運(yùn)用與嬗變研究。關(guān)于概念史研究法中豐厚且復(fù)雜的理論層次與研究視角,有興趣的師友可參見(jiàn)方老師自2019年出版的概念史三書(shū),分別是《概念的歷史分量:近代中國(guó)思想的概念史研究》(北京:北京大學(xué)出版社,2019年)、《什么是概念史》(北京:生活·讀書(shū)·新知三聯(lián)書(shū)店,2020年)、《歷史的概念向量》(北京:生活·讀書(shū)·新知三聯(lián)書(shū)店,2021年),通過(guò)閱讀概念史三書(shū),當(dāng)能較為全面的掌握德國(guó)概念史研究理論方法。至于概念史研究案例,可參見(jiàn)2013年開(kāi)始至今,由南京大學(xué)學(xué)衡研究院院長(zhǎng)孫江教授主編出版的《亞洲概念史研究》集刊,目前出版至第8卷,收錄眾多亞洲概念史研究的優(yōu)秀成果,當(dāng)然也不能錯(cuò)過(guò)章可老師在概念史研究領(lǐng)域的力作《中國(guó)“人文主義”的概念史(1901-1932)》(上海:復(fù)旦大學(xué)出版社,2015年),章老師以一本書(shū)的分量系統(tǒng)且細(xì)密地揭示了“人文主義”的概念以及圍繞此概念的其他相關(guān)概念,是想了解概念史研究方法與實(shí)踐取徑的師友們不能錯(cuò)過(guò)的好書(shū)。

《什么是概念史》

《什么是概念史》


節(jié)點(diǎn)2:什么是數(shù)字轉(zhuǎn)向(Digital Turn)?

上面我們通過(guò)簡(jiǎn)要的概述,幫助計(jì)算機(jī)學(xué)界師友們了解概念史研究方法的簡(jiǎn)明基礎(chǔ)定義后,接著我們?cè)僬務(wù)勈裁词菙?shù)字轉(zhuǎn)向(Digital Turn),以幫助人文學(xué)界師友們理解為何要數(shù)字轉(zhuǎn)向?以及如何數(shù)字轉(zhuǎn)向等問(wèn)題。南京大學(xué)陳靜老師與香港城市大學(xué)徐力恒老師曾在〈我們?yōu)槭裁葱枰獢?shù)字人文〉(《社會(huì)科學(xué)報(bào)》第1572期,2017年8月24日,第5版)一文中指出,隨著數(shù)字技術(shù)更新迭代、數(shù)字化內(nèi)容不斷增加,數(shù)字化的研究趨勢(shì)得到了更廣泛的應(yīng)用,影響遍及各個(gè)人文學(xué)科。大約在2000年以后“數(shù)字轉(zhuǎn)向”(digital turn)時(shí)代到來(lái),個(gè)人計(jì)算機(jī)變得十分普遍,成為大多數(shù)學(xué)者能方便使用的設(shè)備。如今通過(guò)高速高能的計(jì)算機(jī)設(shè)備,配合國(guó)家提出的數(shù)字中國(guó)主張,各界都如火如荼的對(duì)古代乃至近代的所有歷史文獻(xiàn)進(jìn)行數(shù)字化、數(shù)據(jù)化乃至智能化的工作,展開(kāi)各種目前可見(jiàn)的大型數(shù)據(jù)庫(kù)建置項(xiàng)目計(jì)劃,運(yùn)用各種前沿的數(shù)字技術(shù),包括數(shù)據(jù)探勘、文本探勘、圖像標(biāo)記、網(wǎng)絡(luò)分析、時(shí)空地理分析、聲音分析技術(shù)等,對(duì)人文世界進(jìn)行諸多前沿性的探索性研究工作,這就是目前人文學(xué)研究的數(shù)字轉(zhuǎn)向情況。

節(jié)點(diǎn)3:概念史研究真的需要數(shù)字轉(zhuǎn)向嗎?

也許有師友們會(huì)問(wèn),概念史研究真的需要數(shù)字轉(zhuǎn)向嗎?在當(dāng)代語(yǔ)境中,我們不難想見(jiàn)未來(lái)乃是一切皆數(shù)據(jù)的世界。不僅過(guò)去的材料我們不斷的進(jìn)行數(shù)字化工作,諸如愛(ài)如生的“典海”中浩如煙海的數(shù)字化古籍;或是近現(xiàn)代的史料數(shù)字化工作,如香港中文大學(xué)中國(guó)近代思想史專(zhuān)業(yè)數(shù)據(jù)庫(kù)(1830-1930)具有一億兩千萬(wàn)字的全文史料內(nèi)容,晚清期刊全文數(shù)據(jù)庫(kù)(1833-1911)收錄期刊520余種,文章53萬(wàn)余篇,民國(guó)時(shí)期期刊數(shù)據(jù)庫(kù)(1911-1949)收錄期刊25,000余種,文章1000余萬(wàn)篇;中國(guó)社會(huì)科學(xué)院近代史研究所“抗日戰(zhàn)爭(zhēng)與近代中日關(guān)系文獻(xiàn)數(shù)據(jù)平臺(tái)”于2020年9月1日已上線報(bào)紙1046種、期刊2343種、圖書(shū)71071冊(cè)……以上數(shù)據(jù)平臺(tái)若配合前沿OCR技術(shù),在未來(lái)將轉(zhuǎn)為巨量可全文檢索與計(jì)算的文字文本。概念史研究者們未來(lái)在研究概念時(shí),會(huì)有人力難以讀盡的材料。此外還須考慮到概念史研究的重點(diǎn)之一即做概念比較研究,目前東亞學(xué)界也不斷進(jìn)行歷史文獻(xiàn)材料數(shù)字化工作,如“韓國(guó)近代報(bào)刊語(yǔ)料庫(kù)”,近代中日詞匯交流有關(guān)文獻(xiàn)的數(shù)字檔案化與詞匯語(yǔ)料庫(kù),及日本皓星社建置的《雜志記事檢索集成數(shù)據(jù)庫(kù)(1860-1945) 》(http://info.zassaku-plus.com/)等,都是未來(lái)在研究亞洲概念史時(shí)不可回避的巨量數(shù)據(jù)庫(kù)。目前歐美各國(guó)也都積極推行多語(yǔ)種歷史材料的數(shù)字化工程,如GALE平臺(tái)即收錄了跨越全球500 年歷史的1.7億頁(yè)珍稀原始資源文獻(xiàn),包含多種語(yǔ)言的文學(xué)、檔案、法律文書(shū)、手稿等內(nèi)容,其中ECCO 十八世紀(jì)作品在線數(shù)據(jù)庫(kù)更是收集了1700-1799年之間所有在英國(guó)出版的圖書(shū)和所有在美國(guó)和英聯(lián)邦出版的非英文書(shū)籍,涵蓋英語(yǔ)、法語(yǔ)、德語(yǔ)、西班牙語(yǔ)、拉丁文等多個(gè)語(yǔ)種,包含13萬(wàn)種15萬(wàn)卷,超過(guò)3,300萬(wàn)頁(yè)的內(nèi)容。

因此,假如概念史研究就是要觀察詞語(yǔ)及其作為語(yǔ)言的運(yùn)用與嬗變過(guò)程,借以推導(dǎo)政治社會(huì)群體運(yùn)用特定概念的典型張力,分析時(shí)代、社會(huì)、政治的結(jié)構(gòu)變化,那么概念史研究就天然的適合與需要進(jìn)行數(shù)字轉(zhuǎn)向。由于數(shù)據(jù)化將使人類(lèi)認(rèn)識(shí)世界的方式產(chǎn)生根本性轉(zhuǎn)變,因此未來(lái)世界不再是一連串自然或社會(huì)現(xiàn)象的事件,而是由信息所構(gòu)成(Viktor Mayer-Sch?nberger and Kenneth Cukier,2013),百年后的概念史研究者們?nèi)粝胍芯堪倌昵拔覀儸F(xiàn)在這個(gè)社會(huì)中的概念發(fā)展,他們會(huì)有看不完的文本,包含系統(tǒng)性的個(gè)人專(zhuān)著、論文,與碎片化的朋友圈、微博、推特等文字。這樣巨量的文字?jǐn)?shù)據(jù)信息,若不借助數(shù)字方法,將難以進(jìn)行“概念與社會(huì)”互動(dòng)的概念史研究,因此現(xiàn)在的數(shù)字轉(zhuǎn)向正是在為未來(lái)的概念史家提出方法的準(zhǔn)備。

在上述全球歷史材料數(shù)字化工程下,可以想像未來(lái)概念史研究者的焦慮,將從過(guò)去的“動(dòng)手動(dòng)腳找材料”向“巨量材料如何讀盡”轉(zhuǎn)變。在舊文本不斷被數(shù)字化,新文本膨脹速度比舊資料快的語(yǔ)境下,未來(lái)概念史研究者必定面對(duì)材料過(guò)多無(wú)法讀盡的問(wèn)題,這也是概念史研究的數(shù)字轉(zhuǎn)向的合理性與必要性所在。

節(jié)點(diǎn)4:全球概念史研究的數(shù)字轉(zhuǎn)向重要案例

正因全球歷史文獻(xiàn)材料如火如荼的數(shù)字化工作,使得全球概念史研究者們逐漸發(fā)現(xiàn),若不采用新工具與新方法,將出現(xiàn)難以窮盡所有歷史材料再進(jìn)行概念研究觀察與提出結(jié)論的問(wèn)題,因此已有諸多著名大學(xué)研究團(tuán)隊(duì)開(kāi)啟了概念史研究的數(shù)字轉(zhuǎn)向?qū)嵺`工作。

第一個(gè)案例是美國(guó)劍橋大學(xué)在2014-2018年設(shè)置的概念實(shí)驗(yàn)室(CCDK)。此一實(shí)驗(yàn)室嘗試通過(guò)計(jì)算方法描述和分析由概念結(jié)構(gòu)生成的結(jié)構(gòu)化環(huán)境,試圖揭示其中循環(huán)的概念網(wǎng)絡(luò)(https://ccdkconceptlab.wordpress.com/)。2020年,該團(tuán)隊(duì)的Peter de Bolla, Ewan Jones, Paul Nulty, Gabriel Recchia, John Regan共同發(fā)表了The Idea of Liberty, 1600 – 1800: A Distributional Concept Analysis, University of Pennsylvania Press in the Journal of the History of Ideas(Volume 81, Number 3, July 2020)一文,運(yùn)用計(jì)算和統(tǒng)計(jì)方法對(duì)十六到十八世紀(jì)的“Liberty”概念進(jìn)行分析,基于一套定制的分析概念結(jié)構(gòu)的工具,幫助對(duì)“Liberty”概念的文獻(xiàn)分析工作,并與以賽亞·伯林(Isaiah Berlin)和昆汀·斯金納(Quentin Skinner)過(guò)去有關(guān)Liberty概念的研究成果相互對(duì)話(huà)。

第二個(gè)案例是英國(guó)謝菲爾德大學(xué)數(shù)字人文學(xué)院(DHI),是英國(guó)領(lǐng)先的數(shù)字人文中心之一,成立于1994年。2016年春季開(kāi)啟現(xiàn)代西方思語(yǔ)言DNA項(xiàng)目(https://www.dhi.ac.uk/ldna/),通過(guò)對(duì)十五到十八世紀(jì)英語(yǔ)話(huà)語(yǔ)中發(fā)生的語(yǔ)義和概念變化建模,進(jìn)以理解早期現(xiàn)代思想的演變。最近的研究成果可參見(jiàn)Digital methods for studying meaning in historical English. Special Issue of Transactions of the Philological Society, 119 (2)、§Susan Fitzmaurice, (2020).

第三個(gè)案例是新近成立的芬蘭赫爾辛基大學(xué)數(shù)字人文中心(HELDIG),這是一個(gè)集合赫爾辛基大學(xué)七個(gè)不同院系數(shù)字人文學(xué)科相關(guān)領(lǐng)域的協(xié)作中心。早在成立之初的2015年,他們就舉辦了“概念變化–數(shù)字人文案例研究座談會(huì)”,討論應(yīng)該如何使用大的數(shù)字化歷史數(shù)據(jù)研究概念變化。自2017年起,這個(gè)中心開(kāi)始連年舉辦“概念計(jì)算方法”專(zhuān)題討論會(huì)、“歷時(shí)性概念變化的計(jì)算方法”討論會(huì)、“言語(yǔ)與行動(dòng):政治文本挖掘” 講習(xí)班及詞匯語(yǔ)義變化講習(xí)班等,密切聚焦于計(jì)算概念研究的趨勢(shì)方法及其轉(zhuǎn)向。

節(jié)點(diǎn)5:中國(guó)概念史研究的數(shù)字轉(zhuǎn)向

對(duì)詞匯概念的“形成”“運(yùn)用”與“變化”研究視角進(jìn)行量化轉(zhuǎn)譯與考察,很早就已經(jīng)在中國(guó)學(xué)界出現(xiàn)?;诖藢?duì)詞匯概念研究進(jìn)行數(shù)字轉(zhuǎn)向的思考,配合計(jì)算機(jī)學(xué)界自然語(yǔ)言處理技術(shù)的迭代與更新,在中國(guó)概念史研究學(xué)界中產(chǎn)生了三種領(lǐng)先全球的新的量化考察視角。

第一種是結(jié)合文本探勘技術(shù)與網(wǎng)絡(luò)分析技術(shù)對(duì)概念關(guān)系進(jìn)行量化計(jì)算并發(fā)現(xiàn)互斥概念的研究路徑。如我與鄭文惠、劉昭麟、林書(shū)佑等老師合作的《概念關(guān)系的數(shù)位人文研究——以<新青年>中的“世界”觀念為考察核心》(收于項(xiàng)潔主編:《數(shù)位人文:在過(guò)去、現(xiàn)在和未來(lái)之間》(臺(tái)北:臺(tái)灣大學(xué)出版中心,2016年12月)一文,以數(shù)字人文技術(shù)與德國(guó)概念史理論對(duì)話(huà),勾勒《新青年》500萬(wàn)字語(yǔ)料中與“世界”概念共現(xiàn)的概念群并計(jì)算其間的概念網(wǎng)絡(luò)。該文使用機(jī)率統(tǒng)計(jì)、統(tǒng)計(jì)學(xué)中的LSA、PMI等關(guān)系性計(jì)算,以及詞匯相依計(jì)算法等多種可能適用于概念關(guān)聯(lián)性計(jì)算的方法,發(fā)現(xiàn)《新青年》前后不同時(shí)段“世界”概念共現(xiàn)詞群的分合。其中“世界”與“天下”這一對(duì)概念呈現(xiàn)出從不顯著相關(guān)到顯著負(fù)相關(guān)的變化,表示“天下”概念與世界論述互斥,此種概念關(guān)系型態(tài)是人力不能考察者,亦即是數(shù)字人文視野下獨(dú)特的發(fā)現(xiàn)。

第二種是對(duì)漢語(yǔ)詞綴復(fù)合詞研究進(jìn)行量化計(jì)算的工作。關(guān)于漢語(yǔ)詞綴復(fù)合詞研究工作,2001年方維規(guī)老師即發(fā)表 “Yi,Yang,Xi,Wai and Other Terms:The Transition from ‘Barbarian’to ‘Foreigner’in Late Imperial Chi- na”(“夷”、“洋”、“西”、“外”及其相關(guān)概念:晚清譯詞從“夷狄”到“外國(guó)人”的轉(zhuǎn)換in:New Terms for New Ideas:Western Knowledge & Lexical Change in Late Imperial China,ed.by Michael Lackner et al.,Leiden:Bril l,2001)一文,探討由“夷”“洋”“西”“外”等四個(gè)漢語(yǔ)詞綴所復(fù)合出的四批復(fù)合詞間的時(shí)代變化,從中提出中國(guó)近代對(duì)西方認(rèn)同的轉(zhuǎn)型現(xiàn)象;而后2011年章清先生發(fā)表《“界”的虛與實(shí):略論漢語(yǔ)新詞與晚清社會(huì)的演進(jìn)》(《東アジア文化交渉研究》,別冊(cè)7,2011 年3 月)一文,更是直接指明漢語(yǔ)詞綴復(fù)合詞研究的意義與價(jià)值,文中指出作為現(xiàn)代漢語(yǔ)中頗為特殊的“后綴復(fù)合詞”(或稱(chēng)為“接尾詞”),這樣的構(gòu)詞法已預(yù)示其具有明顯的開(kāi)放性和不確定性,往往成為考察語(yǔ)言成長(zhǎng)具有特殊意義的例證,而這樣的構(gòu)成法大大提升了語(yǔ)匯的制造能力,“后綴”之前添加什么,決定于中國(guó)社會(huì)所做的取舍。拙作《詞匯、概念、話(huà)語(yǔ):數(shù)字人文視野下中國(guó)近代“美”之觀念的建構(gòu)與再現(xiàn)》(收入周憲主編:《藝術(shù)理論與藝術(shù)史學(xué)》第三輯(北京:中國(guó)社會(huì)科學(xué)出版社,2019年10月)即實(shí)踐了漢語(yǔ)詞綴復(fù)合詞研究法的量化轉(zhuǎn)譯工作,通過(guò)數(shù)字人文技術(shù),計(jì)算并歸結(jié)中國(guó)近代“美”之觀念的建構(gòu)與再現(xiàn)軌跡,有一從“美善”“美術(shù)”到“美育”的三階段發(fā)展過(guò)程,并發(fā)現(xiàn)中國(guó)近代“美”之觀念具有教化性與實(shí)用性?xún)蓚€(gè)特征。當(dāng)我們能將此前所提到的中國(guó)從古代到近當(dāng)代所有建置完成的數(shù)據(jù)庫(kù)加以串連,那么我們就可望通過(guò)數(shù)字技術(shù),勾勒出中國(guó)各種詞匯概念由傳統(tǒng)至當(dāng)代的發(fā)展史,這是過(guò)去依靠人力難以完成的重大工作。

第三種是結(jié)合圖像標(biāo)記技術(shù)對(duì)圖像概念史進(jìn)行量化計(jì)算工作。如王平、鈕亮、金觀濤、劉青峰等發(fā)表的《五代北宋山水畫(huà)的數(shù)位人文研究(二)——以“漁隱”主題為例》(收入《數(shù)位典藏與數(shù)位人文》2018年第1期 )一文,即以五代北宋時(shí)期至今流傳的120余幅山水畫(huà)圖像為研究對(duì)象,圍繞舟船、漁人兩類(lèi)圖像進(jìn)行數(shù)據(jù)擷取與圖像分析,以此去追溯“漁隱”主題及其概念的原形與流變。在圖像概念史研究法的數(shù)字轉(zhuǎn)向思考中,研究者嘗試通過(guò)計(jì)算機(jī)自動(dòng)發(fā)現(xiàn)穩(wěn)定圖像形式結(jié)構(gòu),使人文研究者可考察其圖像概念含義,以及從穩(wěn)定圖像形式結(jié)構(gòu)去考察其圖像概念譬喻含義,或從概念寓意畫(huà)考察其圖像概念含義。當(dāng)圖像數(shù)據(jù)的收集與數(shù)字化、數(shù)據(jù)化乃至于智能化工作完成,概念史研究者們即可快速地從長(zhǎng)時(shí)段的跨國(guó)圖像中發(fā)現(xiàn)概念環(huán)流的蹤影與歷史意義。

節(jié)點(diǎn)6:中國(guó)概念史研究數(shù)字轉(zhuǎn)向的未來(lái)方向

以上我們已經(jīng)介紹了全球概念史研究在數(shù)字轉(zhuǎn)向上的經(jīng)典項(xiàng)目以及中國(guó)在概念史研究法數(shù)字轉(zhuǎn)向上的獨(dú)特貢獻(xiàn),下面可再?gòu)娜宋牡母拍钍防碚撘暯浅霭l(fā),談?wù)勚袊?guó)概念史研究數(shù)字轉(zhuǎn)向的未來(lái)方向。

第一個(gè)基于中國(guó)概念史理論可以進(jìn)行數(shù)字轉(zhuǎn)向的工作是中國(guó)近代概念發(fā)展轉(zhuǎn)型的數(shù)字考察。孫江教授曾在《概念史研究的中國(guó)轉(zhuǎn)向》(《學(xué)術(shù)月刊》2018年第10期)一文中討論中國(guó)近代概念轉(zhuǎn)型的問(wèn)題,基于中國(guó)近代概念轉(zhuǎn)型的特征,提出了有別于德國(guó)概念史家科塞雷克所勾勒出的德國(guó)近代鞍型期概念轉(zhuǎn)型中的“四化”尺度,分別是標(biāo)準(zhǔn)化(Standardization)、大眾化(Popularization)、政治化(Politicization)、衍生化(Derivatization),未來(lái)可進(jìn)一步通過(guò)文本探勘的量化模型方法,轉(zhuǎn)譯與偵測(cè)中國(guó)近代概念轉(zhuǎn)型中的概念四化發(fā)展現(xiàn)象。

第二是基于中國(guó)近代漢字發(fā)展的詞化現(xiàn)象進(jìn)行數(shù)字轉(zhuǎn)向研究。如日本關(guān)西大學(xué)沈國(guó)威教授在《近代中日詞匯交流研究:漢字新詞的創(chuàng)制、容受與共享》(北京:中華書(shū)局,2010)一書(shū)中指出,詞化是對(duì)概念的命名。概念可以用一句話(huà)、一個(gè)說(shuō)明性或比喻性詞組、一個(gè)短語(yǔ)來(lái)表達(dá),而當(dāng)概念用一個(gè)詞來(lái)指稱(chēng)時(shí),叫做概念的“詞化”,或稱(chēng)“詞匯化”。通過(guò)數(shù)字轉(zhuǎn)向,可以利用詞嵌入、文本探勘、時(shí)空地理、網(wǎng)絡(luò)分析等技術(shù)進(jìn)一步的量化轉(zhuǎn)譯東亞近代概念詞匯化的進(jìn)程。

《近代中日詞匯交流研究:漢字新詞的創(chuàng)制、容受與共享》

《近代中日詞匯交流研究:漢字新詞的創(chuàng)制、容受與共享》


第三是基于近代中日韓三國(guó)之間概念環(huán)流現(xiàn)象進(jìn)行數(shù)字轉(zhuǎn)向研究。亦即可運(yùn)用時(shí)空地理技術(shù)、文本探勘、網(wǎng)絡(luò)分析方法等,結(jié)合中日韓三國(guó)對(duì)于同一概念的研究數(shù)據(jù)基礎(chǔ),進(jìn)行跨國(guó)的概念數(shù)據(jù)比較研究,借以揭示概念的源流以及在長(zhǎng)時(shí)段過(guò)程中三向影響交流的動(dòng)態(tài)過(guò)程。

今日所談的概念史研究的數(shù)字轉(zhuǎn)向方法與趨勢(shì),正符合文理交叉的“新文科”主張,這一主張使得我們一方面能通過(guò)結(jié)合計(jì)算機(jī)與統(tǒng)計(jì)方法對(duì)人文研究議題進(jìn)行“人文數(shù)字化”的思考與探討,另一方面又能再基于人文關(guān)懷角度去商榷與研發(fā)帶有人文性的計(jì)算統(tǒng)計(jì)方法而完成“數(shù)字人文化”工作。唯有建立起人文數(shù)字化與數(shù)字人文化兩個(gè)角度的循環(huán)交流協(xié)作工作流程,才能真正落實(shí)新文科的文理交叉訴求,為2035年建成高等教育強(qiáng)國(guó)、實(shí)現(xiàn)中國(guó)教育現(xiàn)代化提供有力支撐。 

評(píng)議人發(fā)言:方維規(guī)教授

問(wèn)題一:

用計(jì)算機(jī)進(jìn)行人文研究易缺乏人文溫度:計(jì)量研究如遠(yuǎn)讀認(rèn)為重要的關(guān)鍵點(diǎn)在數(shù)值的高峰,但人文研究學(xué)者會(huì)認(rèn)為概念的意義在走勢(shì)之中,因?yàn)楦拍铐敺逡呀?jīng)喪失了銳氣,但人文研究者更在乎的是發(fā)展趨勢(shì)中如何普及的過(guò)程,以及普及過(guò)程中報(bào)人或是百姓等不同層次行動(dòng)者的理解現(xiàn)象,但這些研究角度在計(jì)算機(jī)視角中容易被忽略。且在數(shù)字轉(zhuǎn)向之中,很多研究結(jié)果都以可視化圖表方式進(jìn)行呈現(xiàn),但這種數(shù)據(jù)可視化的結(jié)果易將“人”推向平面化,亦即只關(guān)注高低而不關(guān)注過(guò)程,會(huì)削弱其中豐富的人文性信息。

回答:對(duì)于這一問(wèn)題,數(shù)字人文學(xué)界也開(kāi)始進(jìn)行反思,亦即數(shù)字轉(zhuǎn)向的發(fā)展,并非拿來(lái)主義式的只聽(tīng)從于計(jì)算方法的“人文數(shù)字化”,也許在過(guò)去十年我們確實(shí)是走“人文數(shù)字化”的道路,因?yàn)槟菚r(shí)是在探索階段,我們得先把各種計(jì)算方法拿來(lái)探索實(shí)踐,看看是否能結(jié)合?然而在十年后的今天,數(shù)字轉(zhuǎn)向應(yīng)該邁向建立理論的方向,亦即我常說(shuō)的轉(zhuǎn)向“數(shù)字人文化”的方向,我們不能再像過(guò)去十年一樣,不問(wèn)計(jì)算方法的優(yōu)劣以及其是否合適拿來(lái)計(jì)算人文問(wèn)題,只要看到最新方法就拿來(lái)使用,只求量化視角的信校度,卻不問(wèn)這些新方法是否適合用于計(jì)算人文問(wèn)題。如今我們應(yīng)該邁向從人文角度去對(duì)各種最新的方法進(jìn)行“人文性”的信校度提問(wèn)與反思階段,亦即必須通過(guò)人文視野去判斷與反思各種最新計(jì)算方法的人文研究配適性,甚至是更進(jìn)一步,應(yīng)當(dāng)基于人文問(wèn)題意識(shí)的需求,量身定做計(jì)算方法,如此一來(lái),像方老師提出人文學(xué)者更應(yīng)關(guān)注的是概念的爬坡發(fā)展階段的重要性此一研究視角,就能通過(guò)量身定做,發(fā)展出一種探索概念爬坡軌跡與信息的測(cè)量方法,以符合人文研究者的需求。這樣的方法才是真正結(jié)合數(shù)字與人文的思考后所產(chǎn)生出的真正的數(shù)字人文方法。

問(wèn)題二:

在概念研究中常見(jiàn)存在著一種概念用多種不同詞匯來(lái)翻譯與理解的現(xiàn)象,例如Democracy在近代就有“民主”與“共和”兩種譯法,那么在利用數(shù)字方法進(jìn)行Democracy概念研究時(shí),如果只注意到“民主”或“共和”,就是忽略了其他當(dāng)時(shí)同時(shí)代表著Democracy概念的發(fā)展向度,基于這樣的問(wèn)題,數(shù)字人文方法如何解決?

回答:目前在自然語(yǔ)言處理技術(shù)當(dāng)中,有種非監(jiān)督學(xué)習(xí)的詞向量研究法,可以通過(guò)詞匯的上下文語(yǔ)義關(guān)系,偵測(cè)并辨別出長(zhǎng)時(shí)段巨量文本中的近義詞,有望處理并解決一詞多義與多詞一義的問(wèn)題。因此對(duì)于上述問(wèn)題,未來(lái)可以利用詞向量方法進(jìn)行探索性實(shí)驗(yàn),通過(guò)數(shù)據(jù)驅(qū)動(dòng)的方法找到并解決同一概念具有多種詞匯能指的問(wèn)題。

問(wèn)題三:

報(bào)告中談到全球概念史的比較問(wèn)題,在這中間有很多需要考慮的地方,例如中日概念對(duì)比時(shí)候,要注意概念先后問(wèn)題;還有概念到底是在殖民地或是半殖民地發(fā)展也會(huì)有所不同,而這些細(xì)節(jié)往往并非量化方法所考慮的問(wèn)題?該如何解決?而且概念在跨語(yǔ)境間是很難進(jìn)行比較的,因?yàn)楦拍铍S著語(yǔ)境不同有著完全不同的變化?那么全球概念比較研究如何可能?

章可老師回應(yīng)

我認(rèn)為全球概念史研究還是有可能的,因?yàn)榧词垢拍顣?huì)隨著語(yǔ)境而有很大的不同,但跨語(yǔ)境中還是有屬于非語(yǔ)境成分,這個(gè)非語(yǔ)境成分恰恰是語(yǔ)義帶來(lái)的,而這往往就是全球概念史的基礎(chǔ),因此全球概念比較研究還是有可能的。

回答:這正是概念史研究法在數(shù)字轉(zhuǎn)向過(guò)程中需要通過(guò)人文與計(jì)算機(jī)領(lǐng)域?qū)W者密切討論去解決的問(wèn)題。概念史學(xué)者可以提出各種在研究概念時(shí)應(yīng)當(dāng)關(guān)注的人文研究變項(xiàng),而計(jì)算機(jī)學(xué)者就能從這些變項(xiàng)去思考該如何通過(guò)計(jì)算權(quán)重的調(diào)整與方法的復(fù)合重組,讓計(jì)算方法能很好的回應(yīng)人文學(xué)者所關(guān)注的焦點(diǎn)問(wèn)題,因此概念史研究的數(shù)字轉(zhuǎn)向,需要人文學(xué)者多多提出人文性的關(guān)懷視角,借以發(fā)展適合于概念史研究專(zhuān)用的數(shù)字計(jì)算方法。而章可老師提出可以考察跨語(yǔ)境當(dāng)中的非語(yǔ)境成分的問(wèn)題意識(shí),即是未來(lái)在概念史研究數(shù)字轉(zhuǎn)向中可以通過(guò)量化模型去嘗試加以勾勒的重要人文問(wèn)題。

問(wèn)題四:

從莫來(lái)蒂提出世界文學(xué)的研究主張中,可以發(fā)現(xiàn)世界文學(xué)的研究可能帶有偏見(jiàn),這里的偏見(jiàn)包括世界文學(xué)的組成多為英語(yǔ)文學(xué),而其他語(yǔ)種則少;又或者殖民文學(xué)多,精英文學(xué)多,那么這樣的研究結(jié)果可以稱(chēng)為世界文學(xué)嗎?

回答:確實(shí),老師提出的是目前數(shù)字轉(zhuǎn)向中時(shí)常被提出來(lái)進(jìn)行反思的一個(gè)問(wèn)題,亦即“數(shù)據(jù)偏見(jiàn)”。例如斯坦福大學(xué)李飛飛教授他們?cè)?jīng)對(duì)大量圖片進(jìn)行人機(jī)互動(dòng)標(biāo)記工作,進(jìn)而訓(xùn)練出一個(gè)能自動(dòng)標(biāo)記圖片的模型,當(dāng)他們將穿有白紗的女性圖片給予識(shí)別時(shí)可以自動(dòng)識(shí)別出是婚禮;但當(dāng)他們將印度女性穿著印度傳統(tǒng)婚紗的圖片給機(jī)器識(shí)別時(shí)卻識(shí)別出是戲劇,這里問(wèn)題就出在訓(xùn)練計(jì)算機(jī)自動(dòng)辨識(shí)模型時(shí)所用的圖像多為西方圖片,因此只能較好的識(shí)別西方圖像中的事物,但對(duì)東方事物的識(shí)別就產(chǎn)生了問(wèn)題,這就是一種“數(shù)據(jù)偏見(jiàn)”,亦即機(jī)器所學(xué)習(xí)的數(shù)據(jù)是有偏向的,如此所建置的計(jì)算識(shí)別模型語(yǔ)自然也是帶有偏向的。在此案例中,李飛飛即通過(guò)調(diào)整機(jī)器學(xué)習(xí)的數(shù)據(jù),更為多元的重新收集機(jī)器學(xué)習(xí)的圖像材料,借以讓機(jī)器學(xué)習(xí)的結(jié)果更為公正客觀而不具有偏見(jiàn)。就此而言,概念史研究的數(shù)字轉(zhuǎn)向前提,就是我們用以計(jì)算概念發(fā)展的語(yǔ)料必須盡量避免材料的傾斜,對(duì)語(yǔ)料結(jié)構(gòu)必須十分了解,如此才能針對(duì)語(yǔ)料結(jié)構(gòu)的傾斜而調(diào)整計(jì)算權(quán)重,進(jìn)一步避免與解決數(shù)據(jù)偏見(jiàn)可能導(dǎo)致偏見(jiàn)結(jié)論的問(wèn)題。

熱門(mén)文章排行

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) www.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)