杨百翰大学BNC语料库使用说明中文版

上传人:cel****460 文档编号:243813323 上传时间:2024-09-30 格式:PPTX 页数:45 大小:1.34MB
返回 下载 相关 举报
杨百翰大学BNC语料库使用说明中文版_第1页
第1页 / 共45页
杨百翰大学BNC语料库使用说明中文版_第2页
第2页 / 共45页
杨百翰大学BNC语料库使用说明中文版_第3页
第3页 / 共45页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,杨百翰大学BNC语料库使用说明中文版,杨百翰大学BNC语料库简介,1.简介,1.1 通过这个网址,可以搜索到100 million词的British National Corpus(1970s-1993).当然现在Corpus of Contemporary American English(1990-2021)能在线免费提供 400+million 词,在线网址为:,2,3,选择学习BYU-BNC的原因,1.BYU-BNCm免费且在线方便,2.BYU 还有另外两个语料库TIME Corpus of American English 和Corpus of Contemporary American English(COCA),它们的使用方法根本一样,4,1.2 BYUBNC界面简介,5,2.主要搜索功能,2.1 搜索words、phrases、lemmas、wildcards和其他更加复杂的字词,2.1.1 输入单词“mysterious(图2.1.1-1):,得到相关结果(图2.1.1-2):在各子库中的频率,每百万词使用的频率,假设对图2中的相应条块进展点击,那么就可以看到KWIC,如图2.1.1-3(以点Fiction的条块为例):,6,7,使用CHART显示,8,图2.1.1-3,使用KWIC显示方式,9,2.1.2 输入词组“white+名词(图2.1.2-1),得到的结果都是white后面跟的名词短语(图2.1.2-2),检索表达式为:white n*,10,图2.1.2-1,规那么:输入名词的话用正那么表达式:n*;动词:v*;形容词:aj*;副词:av*,11,图2.1.2-2,White+名词的短语,12,2.1.3,输入通配符,13,图2.1.3-1,14,图2.1.3-2,15,2.1.4 输入lemma即一个单词的单复数、时态等所有形式,假设要得到sing这个单词的所有形式,可以如以下图所示图2.1.4-1,16,规那么:假设要得到某个单词的所有单复数和时态形式,那么就要在输入时,在这个单词外加 。,17,形容词early的圆形,比较级和最高级三种形式一次性检索出来检索,18,2.1.5 输入某种词性且局部带有某些字母的命令,如要得到以un-开头、-ed结尾的所有形容词的所有形式见图2.1.5-1和得到动词+任何词+ground的所有词组见图2.1.5-2:,规那么:假设要得到某种词性且词中带有局部带有某些字母的形式时,如要得到以un-开头、-ed结尾的所有形容词的所有形式,那么输入:un*ed.aj*;假设要得到动词+任何词+ground的所有词组,那么输入:vv*ground即可。前者用来研究词汇,后者用来查询特定词性的搭配。,19,图2.1.5-1,20,图2.1.5-2,动词+任何词+ground的所有词组,21,2.2 搜索搭配词和出现的频率,如“thick后跟的名词 图2.2-1,22,图2.2-1,规那么:在context里输入n*后选择4,表示在thic4后面4跨距范围内出现的任何名词,23,如跟在“smile前面的形容词 图2.2-2,规那么:在words里输入:smile.n*,表示作为名词的smile;在context里输入:aj*表示其前后出现形容词的语境。,24,25,2.3 搜索在子语料库(register)内(或之间)出现的频率(或比较)(不同语域中的用法),如在Fiction和Newspaper子数据库中passionate后面可以跟任何名词的词与频率,分别如两图(2.3-1和2.3-2),26,图2.3-2,27,但是也可以之间对两者子语料库中它们出现频率的比照,操作:分别选择section 1&2,如以下图(图2.3-3):,28,29,2.4 进展语义倾向比较,2.4.1 比较近义词,如:近义形容词hot和warm后面所跟名词的区别如图2.4.1:,30,规那么:在words的方格里分别输入hot和warm,再在context方框里输入nn*,表示后面所跟任何名词。当然也可以比较在某个子语料库中出现的频率比较。,31,32,33,2.4.2 比较反义词,如:woman和man前面所跟的形容词的区别如图2.4.2,规那么:在words的方格里分别输入woman和man,再在context方框里输入aj*,选在左3,表示前面3个跨距内所有的形容词。当然也可以比较在某个子语料库中出现的频率比较。,34,2.4.3 搜索近义词,如:搜索beautiful的所有近义词如图2.4.3-1,规那么:在words的方格里输入=beautiful,表示和beautiful语义相近的所有形容词。,35,再如:搜索动词clean的所有近义词,如以下图:,图2.4.3-2,36,当然可以进一步搜索与clean语义相近的动词+the+名词的词组,=clean.v*the n*如以下图:,37,38,39,40,BYU-BNC词性附码的使用,1)查询多义词特定的词性,如for,2)某个词前/或者后面特定词性的假设干搭配词,如confidence 前的形容词,3)词性附码放置的位置,Words或者context处,41,将BNC KWIC制作成mini text,需要工具:,1.文本编辑器,2.MS-word,42,以上方法同样可以用于检索代表当代美国的语料库,以与以不同年代的TIME做成的历史语料库,43,谢谢!,44,The End,谢谢您的聆听!,期待您的指正!,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 压缩资料 > 药学课件


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!