语料库与外语学习.ppt

上传人:sh****n 文档编号:8056732 上传时间:2020-03-27 格式:PPT 页数:44 大小:4.41MB
返回 下载 相关 举报
语料库与外语学习.ppt_第1页
第1页 / 共44页
语料库与外语学习.ppt_第2页
第2页 / 共44页
语料库与外语学习.ppt_第3页
第3页 / 共44页
点击查看更多>>
资源描述
基于语料库的词汇学习 方法与资源 内容提纲 语料库概念简介 3 5 国内外主要语料库 6 7 语料库在外语教学与学习中的应用 8 29 免费在线语料库简介 COCA BNC Lextutor 30 37 软件工具 38 43 资源分享 Whatisacorpus Corpus abodyofnaturallyoccurringtext ThetextswerenotproducedwithoutthecreatorknowingthattheywouldbeusedforlinguisticanalysisNewspapers magazinearticles shortstories academicjournals etcGoodgenrebalance spoken fiction magazines newspaper academic Current not100 year oldnovels 3 Large atleast100millionwordsMorewordsthanyouwouldsee hearinawholelifetimeAnnotated taggedforpartofspeechandlemma e g thebeat theybeat andbeatas 语料 corpus 是指收集的未经组织和加工过的语言材料和素材 戴炜栋 1999语料 corpus 又称为素材 是自然发生的语言材料 包括书面语和口语 的集合 可以用来作为描述一种语言的出发点或用于证实有关一种语言的假设的手段 陈建生 1989 语料库 按照特定目的与方法建立起来的存储语言材料的 仓库 语料库是按照一定的语言原则 运用随机抽样方法 收集自然出现的连续的语言 运用文本或话语片段而建成的具有一定容量的大型电子文本库 从其本质上来说 语料库实际上是通过对自然语言运用的随机抽样 以一定大小的语言样本代表某一研究中所确定的语言运用总体 杨惠中 2002 国外主要的语料库 Brown 1963 64 布朗大学当代美国英语标准语料库 TheBrownUniversityCorpusofPresentDayAmericanEnglish 含100万1961年前后的书面英语 由Francis与Kucera主持完成 COBUILD JohnSinclair主持 迄今最大的语料库之一 含的语料超过5亿词 COCA 美国当代英语语料库 收词四亿多 1990 2010BNC 英语国家语料库 收词一亿多 牛津大学 朗文 钱伯斯 哈洛普出版公司 ICE 国际英语语料库 口语和书面语各一库 收词1百万TheBankofEnglish 英语库 收词2 5亿 朗文 柯林斯 伯明翰大学 国内英语学习者语料库 名称类型建设单位母语背景容量 万词 HKUST书面语香港科技大学广东话 2500TSLC书面语香港大学广东话300CLEC书面语广东外语外贸大学等汉语100COLSEC口语上海交通大学等汉语50MSEE书面语 口语华南师范大学汉语87 6SWECCL书面语 口语南京大学汉语 200 中国英语学习者语料库 CLEC 桂诗春 杨惠中 2003 我国中学生 大学英语4 6级 英语专业低年级和高年级学生在内的100多万词的书面英语语料库 是一部含有言语失误标注的英语学习者语料库 中国英语学生口笔语语料库 SWECCL由 中国学生英语口语语料库 SpokenEnglishCorpusofChineseLearners SECCL 和 中国学生英语笔语语料库 WrittenEnglishCorpusofChineseLearners WECCL 二个子项目组成 总规模为200万词 南京大学主持 文秋芳 王立非 梁茂成2005 2 JDEST 20世纪80年代 中国第一个语料库 上海交大 桂诗春 杨惠中 学术 语料库在外语教学与学习中的应用 基于规则和基于概率的实际应用 比如机阅作文 机器翻译等语料库用于目的语和中介语研究词典编撰 如CollinsCobuildAdvancedLearner sEnglishDictionary测试教材编写翻译研究语料库用于语言学习 基于大量真实语言输入的自主性 研究型的语言学习比如 近义词辨析 语义韵 类联结 搭配研究 句法分析 话语分析等 应用举例 Quiz orderbyfrequency vigilantflabbergastedlostrinky dinkmiserable 9 Quiz orderbyfrequency lost 2691 miserable 5841 sad hopeless vigilant 11831 watchingover flabbergasted 21701 extremelysurprised rinky dink 44681 small cheap worthless 10 11 Obviouserrors notincorpus 12 CorpusofContemporaryAmericanEnglish COCA falldowncarefully nooccurrences 13 unrecycling Google unrecycling 100hits lot little theyrefertothattrashcanpicture 15 CorpusofContemporaryAmericanEnglish COCA nooccurrences 16 COCA otherwordswith recycl recycling nonrecyclable etc x recyclable negativewordsbeforerecyclable 18 Problems civilizedvisitor setuptheecosystem ecosystemscenery 19 setuptheecosystem verbswithecosystemasanobject 20 21 novirtuousnearduck 22 Wordmeaning collocates slippery nearcrafty 23 slipperynearcrafty nooccurrences 24 adjectivesnearslippery dangerous 25 arouse 26 collocates nearbywords neararouse suspicions sexually anger 外语学习的四大难点 native likepronunciationnativewayofthinkingdiscriminationofsynonymsidiomaticcollocation 近义词辨析 近义词的辨析可以从意义的不同类型入手 语法意义 grammaticalmeaning 词汇意义 lexicalmeaning 概念意义 denotativemeaning 联想意义 associativemeaning 内涵意义 connotativemeaning 语体意义 stylisticmeaning 情感意义 affectivemeaning 搭配意义 collocativemeaning 语料库方法在教学中的应用举例 高级英语词汇自主学习的语料库方法 SketchEngine工具在词汇搭配和同义词辨析教学上的应用 基于在线语料库的动 名搭配教学的实证研究 免费在线语料库简介 COCABNCLextutor CorpusofContemporaryAmericanEnglish COCA www americancorpus org 410 millionwords cf BritishNationalCorpus 100m MorewordsthanaveragespeakerwillhearinalifetimeFrommorethan160 000texts20millionwordseachyearfrom1990 2010Balancedacrossspoken fiction popularmagazines newspapers andacademicjournals 20 ineachgenreeachyear FreelyavailableonlinesinceMarch200860 000 70 000uniqueuserseachmonthComplete context sensitivehelpfilesonline 31 AgoodarticletolearnaboutCOCA inChinese Wang Xingfu LiuGuohui MarkDavies 2008 TheCorpusofContemporaryAmericanEnglish AUsefulToolforEnglishTeachingandResearch Computer AssistedForeignLanguageEducationinChina 5 24 31 32 CompositionofCOCA410 millionwords 1990 present samecompositioneachyear Spoken 83millionwords Transcriptsofunscriptedconversationfrommorethan150differentTVandradioprograms examples AllThingsConsidered NPR Newshour PBS GoodMorningAmerica ABC TodayShow NBC 60Minutes CBS HannityandColmes Fox JerrySpringer etc Fiction 79millionwords Shortstoriesandplaysfromliterarymagazines children smagazines popularmagazines firstchaptersoffirsteditionbooks1990 present andmoviescripts PopularMagazines 84millionwords Nearly100differentmagazines withagoodmix overall andbyyear betweenspecificdomains news health homeandgardening women financial religion sports etc AfewexamplesareTime Men sHealth GoodHousekeeping Cosmopolitan Fortune ChristianCentury SportsIllustrated etc 33 Newspapers 79millionwords TennewspapersfromacrosstheUS including USAToday NewYorkTimes AtlantaJournalConstitution SanFranciscoChronicle etc Inmostcases thereisagoodmixbetweendifferentsectionsofthenewspaper suchaslocalnews opinion sports financial etc AcademicJournals 79millionwords Nearly100differentpeer reviewedjournals ThesewereselectedtocovertheentirerangeoftheLibraryofCongressclassificationsystem e g acertainpercentagefromB philosophy psychology religion D worldhistory K education T technology etc bothoverallandbynumberofwordsperyear 免费在线语料库COCA检索方法 http www americancorpus org COCA在线检索首页COCA检索页COCA在线检索seldomseldom检索结果 list形式 seldom检索结果 chart形式 COCA在线检索seldom扩展语境举例 免费在线语料库BNC检索方法 http corpus byu eduBNC首页BNC检索页BNC在线检索outcomeBNC在线检索outcome检索结果 list BNC在线检索outcome检索结果 chart BNC在线检索outcome检索行扩展语境举例 免费在线语料库Lextutor检索方法 Lextutor的多语料库在线检索首页 http www lextutor ca concordancers concord e html Lextutor检索consequenceLextutor检索consequence检索结果Lextutor检索consequence检索结果refinedLextutor检索consequence扩展语境举例 软件工具 用语料库检索工具可以将关键词及其语境检索出来 让语言学习者直接而又集中地看到上述特征 用AntConc和Wordsmith检索词语Wordsmith 索引软件 提供关键词检索 语块检索等 关键词及上下文共显 英国 需付费 AntConc 日本早稻田大学教授Antony研发的检索软件 免费MicroConcord ConcApp6 0 VocabProfile PowerGrep KeywordsinContext KWIC Concordancelines索引行 检索行 AntConc使用步骤展示 打开Antconc打开openfiles 载入选定的语料库选定需要的选项卡 concordance wordlist keyword collocation等在下方输入要检索的词汇或短语运行显示结果对结果进行分析 ReadingConcordance Thankyou
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!