國外語料庫現狀,語料庫的優缺點

2025-04-01 13:45:09 字數 2957 閱讀 8641

1樓:網友

英國國家語料庫(british national corpus)是目前世界上非常有代表性的當代英語語料庫之一,由英國牛津出版社、朗文出版公司、牛津大學計算機服務中心、蘭卡斯特大學英語計算機中心以及大英圖書館等聯合開發建立。以**廣泛的書面語和口語為樣本,呈現了20世紀後期以來的英式英語。其中詞容量超過一億,書面語佔90%,口語佔10%。

bnc包含了各個年齡段、各個社會階層的語言,覆蓋英國語言的方方面面。整個語料庫包含4054篇文字取樣,每篇抽樣文字的長度不超過45000詞。

2.美國當代英語語料庫(coca)

**位址。美國當代英語語料庫,簡稱彎此則coca,是目前最大的免費英語語料庫,它由包含 億詞的文字構成,這些文字由口語、小扒知說、流行雜誌、報紙以及學術文章五種不同的文體構成。從 1990 年至 2015 年間語料庫以每年增加兩千萬詞的速度進行擴充,以保證語料庫內容的時效性。因此,美國當代英語語料庫被認為是用來觀察美國英語當前發展變化的最合適的英語語料庫。

3.美國國家語料庫(anc)

**位址:美國國家語料庫(american national corpus)記錄了20世紀90年代以來,2200萬美式英語的口語和書面語詞彙。它是目前規模最大的關於美式英語使用現狀的語料庫,也極大地促進了語料庫語言學的發展。

4.柯林斯英語語料庫(boe)

**位址。柯林斯語料庫為目前世界三大著名語料庫之一,該語料庫(the bank of english)為英國伯明罕大學與harper collins出版社合作建立的cobuild語料庫的一部分,目前固定在億詞的規模,可以**檢索。

柯林斯英語語料庫是從20世紀80年代開始在john sinclair教授指埋棚導下建立的,主要應用與詞典編撰的乙個大規模語料庫。目前haper collins出版社已根據該語料庫編撰出版了多本非常有影響的英語詞典。

2樓:太陽也是會累的

發展迅速。語料庫的發展與現談啟狀自1979年中國開始建立機器可讀的語料庫以來,國內語料櫻侍粗庫發展迅速,取得了相當一部脊鎮分的成就。

3樓:網友

教學是教師的教和學生的學所組成的一種人類特有的人才培談螞養活動。通過這種活動,教師有目的、有計劃、有組織地引導學生學習和掌握文化科學知識和技能,促進學生素質提高,使他們成為社會所陪鏈需要的人。下面是我精心整理的**語含亂埋料庫在外語教學中的應用,歡迎閱讀,希望大家能夠喜歡。

語料庫的優缺點

4樓:至東深晴

2、語料庫能夠豐富商務翻譯教學材料。由模擬語料或人工語料構迅鄭成的教學材料說服力不強,與商務翻譯實踐連線不夠緊密,導致教學效果不理想。

3、基於語料庫的教學改革有利於使商務翻譯實踐畝迅頌與教學緊密結合,改善教學效果。商務活動由於與各方經濟利昌李益緊密相關。

4、優點:研究方便,可重用,功能多樣,分析清晰。

5、缺點:語料不客觀(手工標註準確率高而一致性差,自動或者半自動標註一致性高而準確率差),標註不一致,準確率低。

什麼是語料庫?

5樓:offercoming留學

語料庫中存放的是在語言的實際州孫使用中真實出現過的語言材料。

1、語料庫。

是語料庫語言學研究的基礎資源,也是經驗主義語言研究方法的主要資源。應用於詞典編纂,語辯臘言教學,傳統語言研究,自然語言處理中基於統計或例項的研究等方面。

2、語料庫分類。

異質攜跡滑的、同質的、系統的、專用的。

3、語料庫特徵。

語料庫中存放的是在語言的實際使用中真實出現過的語言材料,因此例句庫通常不應算作語料庫;語料庫是承載語言知識的基礎資源,但並不等於語言知識;真實語料需要經過加工(分析和處理),才能成為有用的資源。

什麼是語料庫?

6樓:網友

corpus linguistics

語料庫語言學(corpus linguistics)就是一門與語料庫直接有關的語言學科。但是語料庫語言學與其它各種加修飾語的語言學科不同:別的語言學科基本上都是研究有關領域。

語料庫語言學(corpus linguistics)就是一門與語料庫直接有關的語言學科。但是語料庫語言學與其它各種加修飾語的語言學科不同:別的語言學科基本上都是研究有關領域與語言之間的關係,例如,社會語言學研究的是社會與語言的關係,心理語言學研究的是人的心理活動與語言之間的關係。

而語料庫語言學則不同,它只是以語料庫為手段來研究語言。語料庫是載有語言資訊的大量語言資料的集合。語料庫中的語料可以是為了特定目的而收集的語言資料(如對講母語的發音合作人的採訪記錄,也可以是某一特定範圍的書面材料,如中古英語語料),也可以是為了一般語言研究的目的而收集的語言資料(如自然會話的轉寫資料和報刊雜誌書籍的文字資料)。

語料庫語言學的語料庫的發展

7樓:渾景山

語料語言學受行為主義的影響下,從60年代開始發展,迄今已經有近五十年的歷史。

語料庫在發展的初期,只進行詞的一般分析,如詞頻統計等,後來增加了詞的語法屬性標註(如,詞性等),直到現在,人們越來越開始重視對語料庫作不同層次的標註,如:語音、構詞、句法、語義以及語用等層次的標註。

語料語言學在其發展的初期並沒有引起太大的共鳴,但是現代語料語言學已經得到越來越多人的承認,其應用也越來越廣泛,從語言分析、語言教學、詞典編撰到人工智慧等領域都開始應用語料庫。

語料語言學經歷過這幾十年的發展,不論在理論上,還是在技術上,都已趨於成熟。在語言教學領域中的應用也開始引起注意。我國對語料語言學研究取得了一定的成果,如:

桂詩春教授主持的國家「九五」社科規劃專案「中國英語學習者語料庫」收集了從中學到大學的中國英語學習者的作文語料,共100多萬詞,並標註了學生在作文中常見的62類錯誤,錯誤型別包括了拼寫錯誤、詞語搭配錯誤、詞語用法錯誤以及語法結構錯誤等,這對於指導中國學生學習英語起到積極的作用。在語言教學中,可以應用語料庫來(1)分析學習者在語言學習過程中的常見錯誤;(2)確定語言學習專案的優先順序;(3)自動生成各種型別的練習等。

關於雅思王聽力真題語料庫的問題(作者 王陸)

雅思聽力在雅思備考中是很重要的一部分,雅思a類和g類的區別是有很多的,下面就給大家介紹一下關於雅思聽力填空題的解題思路的相關內容,希望可以幫助正在準備雅思備考的同學。不知道要考哪一種雅思?那麼你先弄清楚雅思a類和g類的區別吧!一般來說a類和g類之間的區別是有很多的,在雅思聽力考中,填空題是比較常見的...