新浪博客

转载:杨百翰大学BNC语料库使用说明

2018-12-25 23:07阅读:
杨伯翰大学语料库
https://corpus.byu.edu/
转载:杨百翰大学BNC语料库使用说明
由美国杨伯翰大学Mark Davies教授开发,语料库库容量为3. 6亿词汇,涵盖美国1990年至2007年间的各种类型语料,是当今世界上最大的英语平衡语料库。与其它语料库不同的是,它是免费在线供大家使用,给全世界英语学习者带来了福音,是不可多得的一个英语学习宝库,也是观察美国英语使用和变化的一个绝佳窗口。借用其官网自己的一句介绍,来看看它有多火多强大啊:The most widely used online corpora -- more than 130,000 distinct researchers, teachers, and students each month.是的,一个月超过13万师生科研人员都在使用!
转载:杨百翰大学BNC语料库使用说明

01:
主要搜索words、phrases、 lemmas、wildcards和其他更加复杂的字词
输入单词““mysterious”
转载:杨百翰大学BNC语料库使用说明
得到相关结果在各子库中的频率,每百万词使用的频率:
转载:杨百翰大学BNC语料库使用说明
02:
检索词组
如:输入词组“white+名词”
检索表达式为:white[n*]
转载:杨百翰大学BNC语料库使用说明
得到的结果为white后面跟的名词短语。
转载:杨百翰大学BNC语料库使用说明
03:
输入通配符
如分别输入un*ly和r?n*
结果为
转载:杨百翰大学BNC语料库使用说明
以及
转载:杨百翰大学BNC语料库使用说明
04:
输入lemma(即一个词的单复数、时态等所有形式)
如要得到sing这个单词的所有形式 转载:杨百翰大学BNC语料库使用说明
如果想得到一个词的单复数、时态等所有形式,在输入时,在这个单词外加[ ]
转载:杨百翰大学BNC语料库使用说明
05:
搜索搭配词和出现的频率
如“thick后面跟的名词”
转载:杨百翰大学BNC语料库使用说明
或“smile前面跟的形容词”
转载:杨百翰大学BNC语料库使用说明
06、输入某种词性且部分带有某些字母的命令
如要得到以un-开头、-ed结尾的所有形容词的所有形式
输入: un*ed.[aj*]
转载:杨百翰大学BNC语料库使用说明
又或得到动词+任何词+ground的所有词组
输入:[vv*]*[ground]
转载:杨百翰大学BNC语料库使用说明
前者用来研究词汇,后者用来查询特定词性的搭配。
07、搜索在子语料库(register)内出现的频率(或比较不同语域中的用法)。
如在Fiction和Newspaper子数据库中passionate后面可以跟任何名词的词及频率
Fiction:
转载:杨百翰大学BNC语料库使用说明
Newspaper
转载:杨百翰大学BNC语料库使用说明
但是也可以之间对两者子语料库中它们出现频率的对比。
操作:分别选择section1&2
转载:杨百翰大学BNC语料库使用说明
08、比较近义词
如:近义形容词hot和warm后面所跟名词的区别
转载:杨百翰大学BNC语料库使用说明
在words的 方格里分别输入hot和warm,再在context方框里输入[nn*],表示后面所跟任何名词。当然也可以比较在某个子语料库中出现的频率比较。
转载:杨百翰大学BNC语料库使用说明
09、比较反义词
如:woman和man前面所跟的形容词的区别
转载:杨百翰大学BNC语料库使用说明
在words的方格里分别输入woman和man,再在context方框里输入[aj*],选在左3,表示前面3个跨距内所有的形容词。当然也可以比较在某个子语料库中出现的频率比较。
10、搜索近义词
如:搜索beautiful的所有近义词
转载:杨百翰大学BNC语料库使用说明
规则:在words的方格里输入[=beautiful],表示和beautiful语义相近的所有形容词。
再如:搜索动词clean的所有近义词,
如下图:
转载:杨百翰大学BNC语料库使用说明
当然可以进一步搜索与clean语义相近的动词+the+名词的词组,[[=cleanl][v*] the [n*]
如下图:
转载:杨百翰大学BNC语料库使用说明
转载:杨百翰大学BNC语料库使用说明
转载:杨百翰大学BNC语料库使用说明
BYU-BNC词性附码的使用
1
查询多义词特定的词性,如for
2
某个词前/或者后面特定词性的若干搭配词,如confidence 前的形容词
3
词性附码放置的位置Words或者context处
以上方法

我的更多文章

下载客户端阅读体验更佳

APP专享