最后,盡管沒有專門的學術術語,不過學術出版是受到等級這個概念的推動的。對論文的評價不僅僅根據其中的原創(chuàng)性思想和嚴格的引經據典,還有賴于它所引用的論文的數量、后來引用它的論文的數量,以及一般認為的這些引文的重要性。這樣的做法導致了學術文獻引用的通貨膨脹(冗長的、毫無意義的引用),還有互相吹捧式的引用(如果你引用我的,我就引用你的)。盡管如此,這種做法的確為每一篇給定的論文提供了嚴格的等級評定。事實上,以加菲爾德為代表的很多人都已經證明,某一篇給定論文的重要性可以根據有多少篇論文通過引用而同它建立聯系來確定。
學術出版是一個以同行評審、引文編寫和注評為核心的、或許存在些許瑕疵但行之有效的體系。這個體系為已出版的論文提供了一種等級評定的方法。
這個說法很公允??墒牵勥@些的意義何在?
蒂姆.伯納斯-李正是因為想要通過技術和超文本網絡來改進這個體系的缺陷才會發(fā)明了萬維網。而拉里.佩奇和謝爾蓋.布林正是因為試圖改進伯納斯-李建立的萬維網才創(chuàng)造了Google。將所有這些工作串在一起的就是文獻引用―通過指向他人的成果來建立自己的成果的做法。
佩奇的推論是,整個網絡就是由引用和注評構成的松散體系。畢竟,鏈接不就是引用嗎?而鏈接描述文字不就是注評嗎?根據佩奇的說法,如果他能夠找到一種方法來計算方向鏈接的數量和衡量它的質量,那么“網絡就會成為一個更有價值的地方”。
佩奇接著說:“從某種意義上來講,網絡就是這樣一個地方:在這里每個人都可以很容易地通過建立一個鏈接來為任何事做注評。可是,早期的超文本有一個悲劇性的缺陷―你不能夠反向追蹤鏈接。BackRub項目就是要做反向追蹤,搜集網絡上所有的鏈接再把它們倒回去是一件感覺很酷的事?!?/p>
佩奇把他的項目稱為BackRub,這個項目旨在發(fā)現網絡中的鏈接,存儲它們以進行分析,然后在網上重新發(fā)布它們。不過,通過再次發(fā)布的鏈接,任何人都可以知道到底有誰同網絡上的任何給定網頁建立鏈接。不管從哪個角度來看,這都是一個雄心勃勃的計劃。但是,佩奇一開始就沒有讓BackRub在數量有限的測試網頁上工作。恰恰相反,他目標遠大:為什么不一下子解決所有問題呢,直接在整個萬維網上做?
要完成這樣一個任務需要非同尋常的、無所畏懼的投入。盡管佩奇只是打算儲存鏈接而不是整個網絡的內容,但他還是需要搜索整個網絡來找到這些鏈接。在1995年,這樣的做法1995年首先做此嘗試的人是使用DEC公司的資源發(fā)布Alta Vista的路易斯.莫尼爾。 還很少見。
當佩奇構思BackRub的時候,網絡文件總數據估算大約有1 000萬,而連接它們的鏈接數量還是未知的。佩奇估計鏈接數量大概是1億個左右,而實際的數量后來證明遠大于此。而且,佩奇在開始工作之前耽擱的時間越久,網絡就會變得越大。早期,網絡增長速度是每年2 000%還多。要捕獲這樣一頭巨獸所需要的計算機處理資源非常龐大,遠超出了一個普通的學生項目所能負擔的程度。佩奇開始設計他自己的網頁捕獲器時,但還不完全明白自己這樣做的后果。
這個想法的復雜性和規(guī)模性吸引了布林。到目前為止,這個多面手還是不停地從一個項目跳到另一個項目,遲遲不肯確定一個論文選題。他發(fā)現支撐Backrub項目的前提頗具吸引力。布林回憶說,“我在學校里,同許多課題小組討論過他們的課題,而這一個是最讓人興奮的項目。不僅僅因為這個項目以代表人類知識的互聯網為研究對象,還因為我喜歡拉里和他的小組里的另外兩個人?!?/p>
同佩奇和布林一同工作的另外兩個人是斯科特.哈桑和艾倫.斯特姆伯格,他們是被派到這個項目的博士生助手。(每位博士學位申請人都會分配到一兩名助手;助手的職位是由想賺點外快的碩士研究生來擔當的。)哈桑和斯特姆伯格都在Google真正起步之前離開了這個項目。但是,即使是這些中途離開的人后來也創(chuàng)辦了成功的互聯網公司。哈桑同拉里的哥哥卡爾.佩奇一起創(chuàng)立了eGroupcom,后來把公司以超過5 000萬美元的價格出售給了雅虎。斯特姆伯格在密歇根讀大學時就已經發(fā)布了一個很受歡迎的天氣網站Weather Underground,而且現在還在經營這個網站。