前言:本站為你精心整理了概率語言范文,希望能為你的創作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。
一、語言事實與語言理論
20世紀中葉以來,生成轉換語法突破原來結構主義和行為主義的藩籬,掀起了語言學界的軒然大波,出現了眾多語言理論異彩紛呈的局面。在語言學爭論中,各種語言學派都列舉語言事實作為其理論的支撐點。從現代語言學的傳統來看,從描寫主義、歷史主義到結構主義,從語言習得、語言教學到語文改革,都注重收集語言數據,提倡經驗主義。Chomsky(1957,1961)的理性主義則主張語言學家的任務是描寫人的語言能力,外部語料(例如語料庫)無法解釋語言能力。理性主義所根據的語言事實是語言學家本身的母語知識(直覺、天性),由此可推導出UG(linguisticuniversals,語言共同性、語言共項)。Chomsky主要針對20世紀中葉以前以經驗主義為基礎的語法研究(例如Fries依賴美國政府非正式通訊檔案來編寫AmericanEnglishGrammar,1940),不無道理。但理性主義研究方法提出以來,語言理論層出不窮,而我們在沉迷于理論的解釋時,卻往往忽略了一個出發點:語言理論雖可解釋語言事實,但語言事實本身并非語言理論的產物。語言事實和語言理論究竟誰是第一性的?如果我們承認語言事實是第一性的,那么根據哪些語言事實來提升語言理論?是語言研究者憑本人直覺所提供的語言事實,還是大多數語言使用者所提供的語言事實?鄭錦全在談到美國語言學研究現狀時指出:“目前美國語言學界存在一個問題:理論泛濫,而缺少充分的語言材料,不夠扎實”(張鳳芝等2002:77)。
語言學中理性主義的基石之一是語言能力/運用的兩分法,自Saussure提出“語言”和“言語”的區別以來,贊成此說者不少。Chomsky強化了它們的區別,將之看成是涇渭分明。對此,不同的語言學家從不同的角度提出了相反的看法。從語篇研究的角度持相反意見的語言學家有:Pike,Hjelmslev,Firth,Halliday,vanDijk&Kintsch,Hartmann等人(見Beaugrande1991)。社會語言學家(如Hymes1972)、功能語法學派(如Hallidayl973)、應用語言學家(如Widdowsonl984)、心理語言學家和語用學家更是毫不諱言,指出語言運用才是他們研究的對象。語用學家Mey(1993:5)指出,“語用學的恰當領域是Chomsky所說的語言運用”。心理語言學家Aitchison(1998:183-184)雖廣泛地介紹了Chomsky的觀點,卻也覺得把語言能力和語言運用截然分開難以接受,認為“心理語言學家對語言運用和語言知識同樣感興趣;兩者密切相關,任何人只注意其中一個因素,而忽略另一個因素,是很奇怪的”。
內省式的語言研究方法也受到不少人的質疑。在語音學研究中,人們只能依賴自然觀察的數據。語言習得研究難以采用內省式判斷,研究者本人的語言直覺代替不了兒童的語言直覺(McEnery&Wilson1996)。Chomsky(1964)自己也認為反對觀察語言運用的看法并不適用于研究語言習得。內省式判斷對自然觀察方法的指責是言過其實。自然觀察的數據的好處是有案可查、有目共睹,可以驗證;而內省式的判斷則是個人的行為,往往沒有太大把握,容易陷入循環論證的怪圈。這實際上是科學研究中經常出現的客觀知識和主觀知識問題:是自然現象還是人為現象?是公眾的觀察還是個人的臆斷?至于當初Chomsky對語料庫的任意性偏態的指責,也不見得公允。Oakes(1998)指出,如果我們使用對數正態分布(lognormaldistribution)的辦法來描述語料分布,偏態就不會出現。值得注意的是Alien&Seidenberg(1999)的研究,他們認為,在整個生成語法歷史中一直沒有弄清楚語言能力和語言運用的關系,其實兩者不能截然分開,他們使用了連接主義網絡模型的方法來模擬語法性判斷,說明語言運用也可以產生語言能力。
應該說,生成語法學家致力于考察語言能力的同時,作為相反傾向的、主張尊重客觀語言事實的經驗主義傳統并沒有中斷,而且在理論、方法論上也有很大進步。數據的基本特征是頻數(frequency),表現為概率關系,這就導致以概率為基礎的語言研究的蓬勃發展。Halliday(1991)認為,語言系統的概率是固有的。當然觀察頻數僅是一種手段,不是目的。其目的應該是觀察問題和回答問題,從定量向定性發展(Aartsl999)。概率語言學、計算語言學、語料庫語言學、心理語言學都是以頻數和概率為基礎的,它們體現了尊重語言事實的歷史傳統的重現光彩。
二、概率語言學的提出
語言研究的概率方法(ProbabilisticApproach)由此出現。2001年美國語言學會首先在華盛頓召開了第一次語言學概率理論專題討論會,其結果見Bob等(2003)的《概率語言學》。該書Jurafsky(2003)一文指出:“各式各樣的證據表明語言是概率性的。概率在語言理解和產生方面,對意義提取、分解和生成起作用。概率在學習方面,對切分和概括起作用。概率在語音學和形態學方面,對可接受性判斷和替換性起作用。概率在句法學和語義學方面,對范疇梯度化、句法合格與否的判斷和解釋起作用。概率在建立語言變化和差異模型中更起到關鍵作用。”現代語言學的基石是所謂“范疇主義的準則”(maximofcategoricity)。語言是一些定義清晰的、離散的范疇,數量不起什么作用。雖然真正的語言有很多變數、有梯度,但它僅是語言運用的產物。但是概率語言學的主張者認為,越來越多的證據表明,語言判斷顯示出連續統的特性,是一種明顯的梯度行為。2003年在Atlanta召開的第二次概率語言學討論會,深入討論了怎樣把概率語言學和當前語言學潮流結合起來。會議認為概率語言學和生成語言學似乎是對立的,其實也并行不悖:生成語言學的目的是獲得語言現象分布的最終結果,而概率語言學則考慮較少為人探索的、有梯度的中間地帶。只注意連續統的兩端,會使一半語言現象得不到探索和解釋。兩者結合起來可以讓語言學家去探索數據中那些不易為人覺察的、沒有得到解釋的微妙的型式,使語言學界超越那些顯而易見的現象。“中間地帶論”只是概率語言學的一種想法,生成語法學者是否也這樣想,那是另一回事。
計算語言學、語料庫語言學、統計語言學也把頻數作為它們研究的出發點。它們更直截了當地提出和理性主義相對立的經驗主義,Sampson(2000)稱之為經驗語言學(empiricallinguistics)。Manning&Schutze(1999)認為,從1960到1985之間,理性主義完全統治了語言學、心理學、人工智能和自然語言處理,但是原來在1920-1960年間盛行過的經驗主義傳統在1970-1989年之間有所復蘇。經驗主義也認為人的大腦生來就有認知能力,不過并沒有理性主義所說的與語言組件有關的原則和程序。經驗主義從信息論的角度出發,不贊成范疇化的原則,把語言現象分為合語法和不合語法。Colorlessgreenideassleepfuriously雖然合乎語法,但實際上沒有人那樣說。還不如把語言事件的出現看成是概率性的行為,如把句子分為“經常出現”和“不經常出現”。所以一個學英語的學生寫下這樣的句子:Inadditiontothis,sheinsistedthatwomenwereregardedasadifferentexistencefrommanunfairly./Ihaveanacheinthehead.即算是合語法,操本族語者也聽得懂,但卻覺得他們自己不會這樣說。Manning&Schutze(1999)認為,語言的非范疇化現象在語言變化中尤為明顯。英語中的while曾經用作名詞,表示“時間”(如takeawhile),但后來卻變為引導從句的補足語(Whileyouwereout...)。我們沒有什么理由說它在1742年前是名詞,以后則變為補足語。這是因為它的使用頻數在不同的語言環境中有變化。從本質上看,認知和作為它的一部分的語言都是概率現象,概率論應是解釋語言的理論核心。認知之所以是概率性現象,是因為世界充滿了不確切性和不完整的信息。Chomsky(1957)反對根據語料庫的話語來計算句子的概率,認為這樣一來,合語法和不合語法的句子的概率都會很低,難以解釋語言的能產性。Manning&Schutze(1999)認為這種看法只是針對那些對概率表征有偏見的人而言的。以tall(高)的認知表征而言,當我們看到一個堂堂七尺的男子漢,又第一次看到這樣的高度時,我們才會叫他“高個子”,而不會把他看成非范疇化的男子。如果又看到一個只有四尺的男子,我們絕不會叫他為“高個子”。所以概率論的模型很容易表征這種規律性,而對未經檢驗的句子做出判斷。它不會把未經判斷的句子都看成一樣。
三、語料庫語言學的興起
Svartvik(1996)指出,語料庫正在成為主流,它不但提供了一種研究方法,而且提供了一種新的哲學思維方式,就像Leech(1992)所說的,“它是一種‘芝麻開門’,導致關于語言的新思維方式”。Sampson(2001)認為,由于語言運用存在一些別的因素而排斥它,也違反科學常理。例如加速使物體下落部分地受引力規律所控制,但其他的外部因素(例如空氣阻力、氣流運動)也會發生干擾。一個研究引力規律的物理學家不會因為有了這些外部因素,而放棄觀察數據。他無非是把這些因素分離開來。Sampson(1992)指出,采用內省式方法想出來的句子和語料庫所收集的句子相距甚遠,不但是語料,就是內省式判斷也存在任意性偏態。Chomsky認為有些句子不見于語料庫,這實際上說明一個饒有趣味而又十分重要的問題:頻數問題。人類并不太清楚某些詞語或結構的頻數是多少,用內省式方法更不能了解以頻數為基礎的數據。例如They''''rejusttryingtoscorebrowniepointswithpoliticians./Thebossispleased-that''''sanotherbrowniepoint.這兩句話中有一句是來自真實的語料庫,是哪一句呢?內省式判斷會產生意見紛紜,通過語料庫檢索可了解到browniepoints的頻數是76,而browniepoint的頻數只有6。可見用作復數的情況多得多。
從計算語言學的角度看,作為以規則為基礎的人工智能派的對立面的概率派在20世紀80年代出現。Sampson(1987)指出,概率方法的特點有三:1)使用依賴語言統計特性的分析技術,而不是使用絕對的邏輯規則;2)焦點放在不受限制的語篇中的真實材料,而不是一些語言學家自己發明的例子;3)和這兩點有關的是,由于算法需要而采用的對付真實的、而不是事先選擇好的材料的統計學是強有力的。當時提出這種方法的是少數派,主要原因是受到生成轉換語法的影響。概率方法在對語料庫進行語法標注上取得了重大進展。Brown語料庫問世后,Green與Rubin編制了以規則為基礎的標注程序TAGGIT,準確率只有77-78%。英國Lancaster大學Garside(1987)等人用概率的方法根據LOB語料庫所提供的133×133個標注過渡矩陣而編制的CLAW程序,標注的準確率達96-97%。CLAW不斷更新,它的第四版吸收了以規則為基礎的標注程序的優點,用來處理一億詞的BNC,其錯誤率是:1.15%,歧義率是3.75%。在高科技(計算機的普及,大硬盤、高內存的出現,掃描儀和光盤技術的發展)的推動下,語料的收集數量以一日千里之勢增加,現在的語料庫實際上已是機讀語料庫。20世紀60年代出現的Brown和LOB語料庫只有100萬詞,而現在的LGSWE(LongmanSpokenandWrittenEnglishCorpus)已達4000萬詞,BNC(BritishNationalCorpus)已達1億詞(而且提供光盤版給人研究),而COBUILD語料庫(BankofEnglish)則接近4億詞。Biber等人(1999)根據LGSWE而編著的LongmanGrammarofSpokenandWrittenEnglish,洋洋灑灑達1000多頁,對各種英語使用現象的描寫大都附以語料庫的統計資料,令人耳目一新。由15個國家和地區的語料庫專家聯合開發的國際英語語料庫(InternationalCorpusofEnglish,簡稱ICE),按照統一部署收集各個國家和地區的英語語料各100萬詞,亦接近完成。語料庫語言學首先在歐洲興起,而北美因為受到生成語法的影響,相對滯后,但后來也發展神速。Simpson&Swales(2001)指出:“美國具有迎頭趕上的能量,已經得到很好的證實,就等于我們所見到的空間競賽中后蘇聯人造衛星時代和最近10年的美國汽車工業一樣。”美國賓州大學的語言數據聯合體(LinguisticDataConsortium)長期致力于收集和散布各種語料;由心理學家MacWhinney主持的CHILDES專門收集說各種語言的兒童語料;密歇根大學開發的MICASE(MichiganCorpusofAcademicSpokenEnglish)專門收集大學生英語口語語料;美國考試服務公司的T2K-SWAL語料庫(TOEFL2000SpokenandWrittenAcademicLanguageCorpus)則是專門研究大學英語語體,保證TOEFL考試所測試的英語符合到美國大學就讀的學生的需要。對英語的使用者和學習者來說,他們關心的不是理論語言學家坐在扶手椅上(Fillmore語)想出來的母語語言能力(哪些句子是可能的?哪些句子是不可能的?),而是哪些語言現象使用得較為普遍?哪些不那么普遍或較為不普遍?
隨著大型語料庫的出現,在以語料庫為基礎的方法(corpus-basedapproach)之外,又出現丁受語料庫驅動的方法(corpus-drivenapproach)。Tognini-Bonelli(2001)指出,以語料庫為基礎的方法是使用語料庫的證據來解釋、檢驗或說明語言理論或做語言描述。這些理論或描述是大型語料庫出現前已經存在的,但是語言事實不夠充分,語料庫提供了收集大量、可靠數據的手段。Bob的自然語言處理研究、Quirk等人的《當代英語綜合語法》、Halliday的功能語法學派都是使用這種方法。受語料庫驅動的方法則不限于使用語料庫來選擇例證以支持某一種理論的陳述,而著眼于整個語料庫的完整性,根據語料庫所提供的證據來全面地描寫語言。所以理論的陳述和語料庫所提供的證據應該是一致的,它應該直接反映語料庫的證據,根據頻數分布和反復出現的型式來系統地導出語言范疇。作為這種方法的體現的是Sinclair1987以來所從事的COBUILD工程(包括CollinsCobuildDictionary和一系列叢書),Hunston&Francis(2000)的《型式語法》是體現這種方法的一本代表作。
四、心理語言學的突破
在20世紀50年代,受信息論影響,語言學和心理語言學的許多研究都使用了統計和概率的方法。但是60-80年代,這種方法銷聲匿跡了。到了90年代這種方法有了很大復蘇,根據Jurafsky(2003)的統計,在2000年國際計算語言學協會年會上,有77%的論文都采用了語言和學習概率模型。關于語言理解,可從三個方面看概率的作用:(1)從心理詞匯或語法的角度看,語言結構的提取是一種概率性行為:最有可能被提取的結構提取時間最短,花的力氣最少。(2)解決歧義。可能性越大的解釋越會被選中。概率在解決歧義時起了核心作用。(3)解決語言理解的加工難度。一些加工難度較大的句子都是概率很低的句子。同樣的道理也適合于解釋語言產生:概率高的句子被提取得快,如有多個被選的結構,概率就會起作用。在研究學習方面,語言學習結構的模型也是以概率和信息理論的模型為基礎。概率論對心理語言學的最基本的啟發是使用證據推導的結構模型:它提供了一種很容易理解的算法(例如貝葉斯(Bayes)模型),對證據進行組合和加權,在語言理解時選擇最佳的解釋,在語言產生時選擇最佳結果。概率模型在心理語言學方面的應用廣及語音、形態、詞匯、句法、語篇處理等方面。
頻數在語言理解和語言產生中都起到關鍵的作用,但是頻數必須和詞語或句法結構有某種關系,才能發揮作用。高頻詞辨認時間比低頻詞短、需要較少的感覺輸入、受鄰近詞的干擾也少。高頻詞的產生時間也短些,而低頻詞容易導致語音失誤。在解決形態、句法和語義的歧義時,人們傾向于使用頻率更高的詞類、形態結構和語義。但是這種詞匯語義/句法范疇的效應似乎并沒有延伸到語言產生。復合詞結構的頻率在語言理解和語言產生中都有作用。常用的詞組或成語提取得更快,在解決歧義時也用得更多。各種條件概率在語言理解和語言產生中都起作用。對具有不只一個句法次范疇的動詞來說,最常用的次范疇框架最易于被用來解決歧義。對具有一種詞類的單詞來說,最常用的詞類最容易被用作解決歧義。競爭模型(TheCompetitionModel,MacWhinneyetal.1984;MacWhinney&Bates1989;MacWhinney,2001)是第一個處理句子的概率模型,它把語言習得看成是一個構建性的、受數據驅動的過程。這個過程并不依賴語言結構的共項,而是依賴認知過程的共項。這個模型強調詞匯功能主義(句法型式受詞項控制),把“形式”層面(表層形式、句子結構、韻律形式等)映射到“功能”(意義、意圖)。因為輸入是歧義的、有噪音的,句子處理器就必須以概率的方式依賴詞語所提供的各種表層提示(cues)。提示效度(cuevalidity)把提示的概念形式化,而提示效度又可以理解為提示可用性(cueavailability)和提示信度(cuereliability)的結合。從學習者的角度看,語言發展主要是學習和轉移在起作用。
以概率為基礎的心理語言學不限于提出某種語言處理模型,還想進一步解決一些長期以來爭論不休的理論(例如語言是否天生?)問題。這就是涌現論(emergentism)的提出。Bates等人(1998)認為這個問題可以得到解決,有三個原因:首先是理論物理學的非線形動力學的發展使我們認識到,按照一個維度所發生的少量變化可以導致復雜的非連續性的結果;其次是我們可能通過神經網絡的模擬技術來解釋一些簡單的輸入怎樣導致復雜解決方案的產生;其三是發展神經生物學的突破,“今天神經生物學的成果對昨天的天生主義是壞消息,因為這些成果強調了皮層專門化的特別靈活的、依賴于活動的性質,并且支持對高級認知功能的發展的涌現主義解釋”。涌現主義可以用來解釋諸多語言現象,包括語音形式、形態變化、詞匯結構、語言歷史變化、皮欽語化(pidginization)和二語習得,而且可以作形式化處理,例如連接主義網絡模型、動力學系統論、貝葉斯模型、優選論,等等,它們都是以概率為基礎的。
以概率為基礎的語言處理模型在心理語言學中取得了統治的地位,競爭模型外,還有以制約為基礎的模型(Constraint-basedModels)、理性模型(RationalModels)、馬爾可夫詞匯范疇優先模型(MarkovModelsofLexicalPreference)、不考慮上下文隨機語法(StochasticContext-freeGrammar)、貝葉斯信念網絡(BayesianBeliefsNetworks)、語言產生概率模型(ProbabilisticModelingofProduction)等等,限于篇幅,在此不再贅述。
五、對我國語言學界的啟發
上面著重介紹了以概率為基礎的語言研究方法,絲毫沒有意思把它說成為一種主流的、唯一的研究方法,而只是想說明語言研究方法豐姿多采,必須結合我們自己的實際鼎新革故,吸收人家的先進東西,走我們自己的道路。
1.理論語言學是我們的弱項,而生成轉換語法以及其他語言理論模型在西方仍在不斷發展。借鑒它們的理論和方法建立一套確實能夠說明漢語的語言理論,是我國語言學家面臨的一大挑戰。我們的目標不限于考察漢語有些什么參數設置,還要進一步通過漢語來探討UG。
2.漢語語言學有其自身的傳統,從小學(文字、音韻、訓詁)到現代漢語研究都注重收集語言數據。胡樸安(1983)早在1937年就提出,“訓詁學方法之新趨勢,惟有甲骨文金文之考證與統計學之推測,二法而已”。他有感于“瑞典人柯羅倔論著左傳真偽考[即高本漢(Karlgren),《左傳真偽考》為陸侃如譯,新月書店出版]用統計方法統計左傳、論語、孟子中的助字,為考據學者辟一新門徑”。他也統計了《論語》中的“君子”的頻數(約六十有余),然后區分出孔子對君子之界說。胡樸安后,又有多少我國訓詁學家使用了概率方法,筆者忝屬外行,不敢妄言。但概率方法在某個意義上不僅是一種方法,而且是一種思想。事物的出現(包括語言的使用)都是一種概率行為,但是我們立論求證時卻往往忽略這種特性,只注意收集有利于自己觀點的正面證據,而把負面的證據置之不顧。在我國開展語言學研究,概率方法值得重視。
3.實施以概率為基礎的語言研究方法的一個基礎工程是收集和建設語料庫。這項工程已受到整個華語世界的重視,但力量分散,各自為政,甚至重復勞動。現在要考慮的是:(1)我國大陸、臺灣、港澳地區都在組織人力建設現代漢語的語料庫,應該強調統一力量,加強協作,像ICE那樣制訂統一的抽樣方案、注釋格式、文本格式,甚至編制統一的、兼容簡繁體的檢索工具乃至語料庫工具,便于大家使用。(2)語料的收集和入庫雖然牽涉大量人力物力,語料本身卻是公共財富,應該向公眾開放,如提供在線檢索或語料光盤。(3)古漢語語料庫的建立也應提到議事日程。我國許多經典著作和辭書都應電子化,便于檢索。(4)漢語信息化和電子化的“攔路虎”是斷詞問題,大家都有不同的方案和處理方法,應集中力量,共謀良策。斷詞問題解決不了,語料就無從進行索引。可否考慮以“字”為單位,通過搭配字檢索來解決詞的問題?(5)統一和分散,齊頭并進。既要考慮編制大型的語料庫,也要考慮編制各種專業化的語料庫。(6)建立語料庫雖是一項基礎研究,但其根本目的是對語言使用(包括漢語以及其他民族語言)進行客觀的概率研究,因此必須大力訓練掌握這種研究方法的人員。
4.在漢語心理語言學方面,雖有一些零碎研究(如對母語習得、二語習得),但我國還處在創始階段,任重道遠。針對漢語使用而開展認知心理模型的研究還比較少,關鍵問題是漢語研究和認知心理學研究的結合問題。在西方有過兩次結合:首先是語言學家和心理學家的結合,如1951年在美國Cornell大學召開的暑期研討班、美國社會科學院的語言學和心理學委員會1953年在Indiana大學召開的學術討論會,訂出了所謂“心理語言學憲章”;其次是上世紀70年代以來心理語言學和認知心理學的合流(桂詩春2000)。這使語言學通過心理語言學的媒介成為認知科學的一個重要組成部分。
5.以概率為基礎的方法在二語習得研究中的影響更大,牽涉面更多,實用意義更大,是一個很重要的領域。筆者將另作專文討論。
【參考文獻】
1Aarts,B.2000.Corpuslinguistics,Chomskyandfuzzytreefragments[A].InC.Mair&M.Hundt(eds.).CorpusLinguisticsandLinguisticTheory[C].Amsterdam:Rodopi.
2Aitchison,J.1998.TheArticulateMammals:AnIntroductiontoPsycholinguistics[M].London:Routledge.
3Alien.J&Seidenberg.1999.Theemergenceofgrammaticalityinconnectionistnetworks[A].InB.MacWhinney(ed.).TheEmergenceofLanguage[C].NJ:LawrenceErlbaumAssociates,Inc.,Publishers
4Bates,E.,J.Elman,M.Johnson,A.Karmiloff-Smith,D.Parisi&K.Plunkett.1989.Innatenessandemergentism[A].InW.Bechtel&G.Graham(eds.).AComponiontoCognitiveScience[C].Oxford:BasilBlackwell.
5Beaugrande,R.1991.LinguisticTheory:TheDiscourseofFundamentalWorks[M].London:Longman.
6Bob,R.,J.Hays&S.Jannedy.2003.ProbabilisticLinguistics[M].Cambridge,Mass:MITPress.
7Chomsky,N.1957.SyntacticStructures[M].TheHague:Mouton&Co.
8Halliday,M.A.K.1973.ExplorationsintheFunctionofLanguage[M].London:Arnold.
9Halliday,M.A.K.1991.Corpusstudiesandprobabilisticgrammar[A].InK.Aijmeretal.(eds.).EnglishCorpusLinguistics[C].London:Longman
10Hymes,D.1972.Oncommunicativecompetence[A].InJ.B.Prideetal(eds.).Sociolinguistics[C].Harmondsworth:PenguinBooksLtd.
11Jurafsky,D.2003.Probabilisticmodelinginpsycholin-guistics:Linguisticcomprehensionandproduction[A].InR.Bobetal.(eds.).2003.
12LeechG.N.1992.Corporaandtheoriesoflinguisticperformance[A].InJ.Svartvik(ed).DirectionsinCorpusLinguistics.ProceedingsofNobelSymposium82,Stockholm,4-8August,1991[C].MoutondeGruyter,BerlinandNewYork.
13MacWhinney,B.,E.Bates&R.Kliegl.1984.CuevalidityandsentenceinterpretationinEnglish,German,andItalian[J].JournalofVerbalLearningandVerbalBehavior23.127-150.
14MacWhinney,B.&E.Bates.1989.TheCross-linguisticStudyofSentenceProcessing[M].Cambridge:CambridgeUniversityPress.
15MacWhinney,B.2001.TheCompetitionmodel:Theinput,thecontextandthebrain[A].InP.Robinson(ed.).CognitionandSecondLanguageAcquisition[C].Cambridge:CambridgeUniversityPress.
16Manning,C.&H.Schutze.1999.StatisticalNaturalLanguageProcessing[M].
17McEnery,T.&A.Wilson.1996.CorpusLinguistics[M].Edinburgh:EdinburghUniversityPress.
18Mey,J.1993.Pragmatics:AnIntroduction[M].Oxford:BlackwellPublishersLtd.
19Oakes,M.1998.StatisticsforCorpusLinguistics[M].Edinburgh:EdinburghUniversityPress.
20Sampson,G.1987.Probabilisticmodelsofanalysis[A].InR.Garsideetal.(eds.).TheComputationalAnalysisofEnglish[C].London:Longman.16-29.
21Sampson,G.1992.Probabilisticparsing[A].InSvartvik(ed.).DirectionsinCorpusLinguistics:ProceedingsofNobelSymposium82[C].Berlin:MoutonGruyter.
22Sampson,G.2001.EmpiricalLinguistics[M].London:Continuum.
23Simpson,R.&J.Swales.2001.Introduction:NorthAmericanperspectivesoncorpuslinguisticsatthemillennium[A].InR.Simpson&J.Swales(eds.).CorpusLinguisticsinNorthAmerica[C].Michigan:TheUniversityofMichiganPress.
24Svartvik,J.1996.Corporaarebecomingmainstream[A].InJ.Thomas&M.Short(eds.).UsingCorporaforLanguageResearch[C].London:Longman.
25Tognini-Bonelli,E.2001.CorpusLinguisticsatWork[M].Amsterdam:JohnBenjaminsPublishingCo.
26Widdowson,petenceandcapacityinlanguagelearning[A].InH.Widdowson(ed.).ExplorationsinAppliedLinguistics2[C].Oxford:OUP.
27桂詩春,2000,《新編心理語言學》[M]。上海:上海外語教育出版社。
28胡樸安,1983,《中國訓詁學史》[M]。北京:中國書店(根據商務印書館1937年版影印)。
29張風芝等,2002,語言學科建設高級專家座談會綜述[J],《暨南大學華文學院學報》第4期。