电脑技术的快速发展课件

上传人:hloru****lorv6 文档编号:240916338 上传时间:2024-05-17 格式:PPT 页数:98 大小:632.52KB
返回 下载 相关 举报
电脑技术的快速发展课件_第1页
第1页 / 共98页
电脑技术的快速发展课件_第2页
第2页 / 共98页
电脑技术的快速发展课件_第3页
第3页 / 共98页
点击查看更多>>
资源描述
1快速发展的因素快速发展的因素电脑技术的快速发展电脑的普及电脑知识的普及网络技术(光纤、网络协议等)的发展带宽的提高校园网、电信的ISDL用户对资源的需求知识的需求娱乐信息谢谢观赏2019-9-211快速发展的因素电脑技术的快速发展谢谢观赏2019-9-212引发一系列问题(引发一系列问题(1 1)信息发布网络IP地址的分配问题产生虚拟IP网络、IPV6等方法来解决信息获取如何从这些海量信息中查到自己感兴趣的资源如何获取这些信息产生搜索引擎、信息挖掘技术信息存储 如何存储海量信息 产生磁盘阵列、TB级存储器 谢谢观赏2019-9-212引发一系列问题(1)信息发布谢谢观赏2019-9-213引发一系列问题(引发一系列问题(2 2)信息传递采用何种工具传递网络信息产生FTP、BT等软件信息使用如何合法、正确使用网络信息产生网络信息监管的职能部门和法规产生针对用户(如儿童)权限等的信息过滤技术谢谢观赏2019-9-213引发一系列问题(2)信息传递谢谢观赏2019-9-214Web信息结构信息结构 大部分采用HTML(HyperTextMarkupLanguage)也采用XML(eXtensibleMarkupLanguage)HTML标记语言是在普通文本的基础上加上特殊标记(Tag)目的是运用标记使文件达到预期的显示效果方法是用“”扩住标记,起始标记用表示,终止标记用表示谢谢观赏2019-9-214Web信息结构大部分采用HTML(HyperTextM5HTML网页片断(网页片断(1)一个容器标记,用以指明这是表格,其它表格标记只能在这个标记范围内使用表示表格的行。表示表格行中的单元。谢谢观赏2019-9-215HTML网页片断(1)TABLEborder=0c6HTML网页片断(网页片断(2)用来划分框格,每个框格由一个标记来表示这里把页面分成上下两部分,上面显示a.html,下面显示b.html谢谢观赏2019-9-216HTML网页片断(2)framesetrows=“872.2 搜索引擎搜索引擎 从1995年开始逐渐发展产生原因用户要在如此浩瀚的信息海洋里寻找信息,必然会“大海捞针”无功而返。搜索引擎正是为了解决这个迷航问题而出现的技术目的以一定的策略在互联网中搜集、发现信息对信息进行理解、提取、组织和处理为用户提供检索服务谢谢观赏2019-9-2172.2搜索引擎从1995年开始逐渐发展谢谢观赏208现有的搜索引擎现有的搜索引擎 中文搜索引擎中文搜索引擎英文搜索引擎英文搜索引擎 百度中文搜索引擎Google搜索引擎北大天网中英文搜索引擎聪搜索引擎雅虎中国分类搜索引擎搜狐分类搜索引擎新浪搜索引擎 网易分类目录引擎 英文Google搜索引擎Inktomi/MSN搜索引擎 Fast/AllTheWeb搜索引擎AltaVista搜索引擎ASK/Temoa 搜索引擎英文Yahoo!分类目录Dmoz 人工分类目录LookSmart 分类目录 谢谢观赏2019-9-218现有的搜索引擎中文搜索引擎英文搜索引擎百度中文搜索引擎9Google 简简介介斯坦福大学的博士生LarryPage和SergeyBrin在1998年创立搜索时间通常不到半秒每天需要提供1.5亿次查询服务Google的技术代理搜索技术高级PageRank(网页级别)技术Google释义由英文单词“googol”变化而来表示1后边带有100个零的数字代表Google想征服网上无穷无尽资料的雄心PageRank利用巨大的网络链接结构网页A链接到网页B时,就认为“网页A投了网页B一票避免任何人为感情因素谢谢观赏2019-9-219Google简介斯坦福大学的博士生LarryPage10百度搜索引擎简百度搜索引擎简介介李彦宏先生及徐勇先生1999年底,百度成立于美国硅谷2000年百度公司回国发展百度的起名辛弃疾的青玉案中“众里寻她千百度”象征着百度对中文信息检索技术执著的追求竞价排名由用户为自己的网页出资购买关键字排名 按点击计费的一种服务 搜索结果的顺序将根据竞价的多少由高到低排列 谢谢观赏2019-9-2110百度搜索引擎简介李彦宏先生及徐勇先生谢谢观赏2019-11雅虎搜索引擎简雅虎搜索引擎简介介大卫费罗(DavidFilo)和杨致远(JerryYang)美国斯坦福大学电机工程系的博士生1994年4月建立了网络指南信息库分类目录站点目录分为14个大类,每一个大类下面又分若干子类连接速度快,包含范围广雅虎中国网站提供简单易用、手工分类的简体中文网站目录谢谢观赏2019-9-2111雅虎搜索引擎简介大卫费罗(DavidFilo)和杨12性能指标性能指标 召回率(Recall)检索出的相关文档数和文档库中所有的相关文档数的比率衡量的是搜索引擎的查全率 精度(Pricision)检索出的相关文档数与检索出的文档总数的比率衡量的是搜索引擎的查准率影响性能的因素文档和查询的表示方法评价文档用户查询相关性的匹配策略查询结果的排序方法用户进行相关度反馈的机制谢谢观赏2019-9-2112性能指标召回率(Recall)谢谢观赏2019-9-213搜索引擎的类别搜索引擎的类别 分类依据信息搜集方法服务提供方式类别目录式搜索引擎机器人搜索引擎元搜索引擎谢谢观赏2019-9-2113搜索引擎的类别分类依据谢谢观赏2019-9-2114目录式搜索引擎目录式搜索引擎 搜集信息人工方式或半自动方式信息处理由编辑员查看信息之后,人工形成信息摘要并将信息置于事先确定的分类框架中服务方式提供目录浏览服务提供直接检索服务优点讨论缺点讨论代表YAHOO、LookSmart、Dmoz等谢谢观赏2019-9-2114目录式搜索引擎搜集信息谢谢观赏2019-9-2115机器人搜索引擎机器人搜索引擎 搜集信息蜘蛛(Spider)的机器人程序以某种策略自动地在互联网中搜集信息信息处理建立索引库服务方式面向网页的全文检索服务优点讨论缺点讨论代表Google、天网等谢谢观赏2019-9-2115机器人搜索引擎搜集信息谢谢观赏2019-9-2116元搜索引擎元搜索引擎 技术方法将用户的查询请求同时向多个搜索引擎递交将返回的结果进行重复排除、重新排序等处理作为自己的结果返回给用户服务方式面向网页的全文检索本质特点没有自己的数据优点讨论缺点讨论代表WebCrawler、InfoMarket等谢谢观赏2019-9-2116元搜索引擎技术方法谢谢观赏2019-9-2117搜索引擎系统结构搜索引擎系统结构 搜索器索引器检索器用户接口谢谢观赏2019-9-2117搜索引擎系统结构搜索器谢谢观赏2019-9-2118搜索器搜索器 功能在互联网中漫游,发现和搜集信息尽可能多、尽可能快地搜集各种类型的新信息定期更新已经搜集过的旧信息搜集策略从一个起始URL集合开始,以宽度优先、深度优先或启发式方式循环地在互联网中发现信息 将Web空间按照域名、IP地址或国家域名划分,每个搜索器负责一个子空间的穷尽搜索信息类型HTML、XML、FTP文件、字处理文档、多媒体信息其它支撑技术分布式、并行计算技术谢谢观赏2019-9-2118搜索器功能谢谢观赏2019-9-2119索引器索引器 功能理解搜索器所搜索的信息从中抽取出索引项,用于表示文档以及生成文档库的索引表索引项客观索引项内容索引项支撑技术统计法、信息论法和概率法(计算索引项的权值)倒排表(InversionList),由索引项反过来查找相应的文档可以使用集中式索引算法或分布式索引算法谢谢观赏2019-9-2119索引器功能谢谢观赏2019-9-2120检索器检索器 方法根据用户的查询在索引库中快速检出文档进行文档与查询的相关度评价对将要输出的结果进行排序并实现某种用户相关性反馈机制如何实现多点的海量检索(讨论)集中式海量检索分布式海量检索谢谢观赏2019-9-2120检索器方法谢谢观赏2019-9-2121用户接口用户接口 作用输入用户查询显示查询结果提供用户相关性反馈机制目的方便用户使用搜索引擎高效率、多方式地从搜索引擎中得到有效、及时的信息简单接口只提供用户输入查询串的文本框 复杂接口让用户对查询进行限制,如逻辑运算、时间、长度等例子Google提供多种用户使用界面谢谢观赏2019-9-2121用户接口作用谢谢观赏2019-9-2122搜索引擎的研究动向搜索引擎的研究动向 提高信息查询结果的精度,提高检索的有效性基于智能代理的信息过滤和个性化服务采用分布式体系结构提高系统规模和性能交叉语言检索的研究和开发 国际会议 美国Infornotics公司主办的搜索引擎国际会议从1996年开始,每年举行一次IEEE主办的国际万维网会议、人机交互会议 谢谢观赏2019-9-2122搜索引擎的研究动向提高信息查询结果的精度,提高检索的有23当前搜索引擎的不足之处当前搜索引擎的不足之处(1)1)语义分析不足,缺少较好的中文分词技术支持用google搜索引擎,关键词“和服”,在第3页有如下结果:外交部公布新版中国境外领事保护和服务指南.外交部公布新版中国境外领事保护和服务指南(附全文),中国外交部通过其官方网站公布了中国境外领事保护和服务指南(2003年版),以帮助中国公民了解中国驻外使、领馆的领事保护和服务范围。.谢谢观赏2019-9-2123当前搜索引擎的不足之处(1)1)语义分析不足,缺少较24当前搜索引擎的不足之处当前搜索引擎的不足之处(2)2)智能化不足 都需要用户提供检索的关键词、关键词组,但还不能直接检索语句 要直接检索语句,需要更强的自然语言处理技术支持谢谢观赏2019-9-2124当前搜索引擎的不足之处(2)2)智能化不足谢谢观赏2252.3 Web信息提取信息提取 从提取规则角度,网页信息提取方法可分为两大类基于标识规则的方法应用网页文档的标识来提取网页信息基于内容规则的方法应用自然语言处理技术从关键词匹配到有层次的句法分析谢谢观赏2019-9-21252.3Web信息提取从提取规则角度,网页信26基于标识规则的方法基于标识规则的方法Harvest信息提取系统利用手工编写的wrappers分析一批固定的Web资源只能处理Web文档而忽略了Internet上提供的服务依赖于提前定义的文档类型,对新文档结构则无能为力斯坦福大学提出的对象交换模型(OEM)方法一个简单的、自描述、嵌套的对象模型一个带标记的有向图这个模型依赖于具体问题的分析DSE(Data-richsectionextraction)算法用树型结构表示HTML网页的布局实质是针对具体问题建立文档对象模型,提取网页信息谢谢观赏2019-9-2126基于标识规则的方法Harvest信息提取系统谢谢观赏27基于内容规则的方法基于内容规则的方法 Artequakt系统建立在自然语言处理技术和实体论基础上通过句法和语义分析来确定实体及关系根据用户要求,产生描述格式,从而描述出艺术家传记DL(description logics)方法建立在实体论基础上用DL方法从词汇关系、概念关系和上下文关系,抽取概念及其依赖关系树Diffusion webIE系统依照实例模型(又称IE规则)构出的框架依据关键词位置和值的特征的定位规则依据词类型和取值范围的表格提取规则句法分析规则谢谢观赏2019-9-2127基于内容规则的方法Artequakt系统谢谢观赏2028两种方法比较两种方法比较基于标识的方法不具有自适应能力准确定位信息段的起止位置基于内容的方法不易准确定位信息段的起止位置有一定自适应能力依赖较强的自然语言处理技术谢谢观赏2019-9-2128两种方法比较基于标识的方法基于内容的方法谢谢观赏201929信息提取的研究趋势信息提取的研究趋势融合两种规则一些网页信息提取方法把这两种规则融合在一起以求充分发挥着两种提取规则的特点来提高提取效率语义网改变现有网页信息结构XML语言把信息结构、内容与数据的表现形式进行分离RDF把信息转换成元数据 本体论把信息的结构与内容相分离信息具有计算机可理解的语义 谢谢观赏2019-9-2129信息提取的研究趋势融合两种规则谢谢观赏2019-9-21302.4 2.4 元数据元数据 定义dataaboutdata(关于数据的数据)是对web信息的一种描述方式是机器可理解的信息基本作用管理数据,从而实现查询、阅读、交换和共享组成一系列元素或属性例子:图书馆目录如:作者,书名,出版日期,主题,分类排架号等元素谢谢观赏2019-9-21302.4元数据定义谢谢观赏2019-9-2131元数据与资源之间的关联方式元数据与资源之间的关联方式 独立方式元素可包含在独立于该项资源的记录中例如:图书馆目录嵌入方式数据可嵌在资源本身中例如:印在书内封上的在版编目(CIP)数据例如:电子文本的标题关联方式的确定不预先规定由具体情况决定谢谢观赏2019-9-2131元数据与资源之间的关联方式独立方式谢谢观赏2019-32元数据的主要作用元数据的主要作用 用来组织和管理网络信息,并挖掘信息资源准确地识别、定位和访问信息(举例讨论)帮助用户查询所需信息可按照不同的地理区间、指定的语言以及具体的时间段来查找信息资源(举例讨论)组织和维护一个机构对数据的投资可方便创建网页(举例讨论)用来建立信息的数据目录和数据交换中心可以共享信息、维护数据(举例讨论)提供数据转换方面的信息通过元数据,用户可以接受并理解信息(举例讨论)谢谢观赏2019-9-2132元数据的主要作用用来组织和管理网络信息,并挖掘信息资33如何获取元数据如何获取元数据 元数据的编写标准目的为实现领域中的数据信息交换和共享,为研究和生产服务不同领域会根据不同的需求定义一个标准或几个标准如MARC(Machine-ReadabIeCataloging,机器可读编目)和DublinCore等实现的技术手段XMLRDF谢谢观赏2019-9-2133如何获取元数据元数据的编写标准谢谢观赏2019-9-34XML技术技术特点从数据与文档的底层实现格式化,保证了从里到外、从处理到交换的一致性实现自动抽取采用XML解析器开发的工具,可以从网上Web服务器的HTML、XML和数据库中自动抽取并索引元数据谢谢观赏2019-9-2134XML技术特点谢谢观赏2019-9-2135RDF 技术技术元数据的互操作性要求在由不同的组织制定与管理且技术规范不尽相同的元数据环境下,能够作到对用户保持一致性的服务可同时携带多种元数据来往于互联网的架构RDF特点提供能对结构化元数据进行编码,交换及再利用的体系框架可使不同的用户或团体在这一框架下定义他们自己的元数据元素提供了各种不同的元数据体系之间的互操作性谢谢观赏2019-9-2135RDF技术元数据的互操作性谢谢观赏2019-9-2136元数据映射元数据映射(Metadata Mapping)原因存在元数据的互操作性问题定义利用特定转换程序对不同元数据标准进行转换方法一(元数据标准的特定转化程序)DublinCore与USMARCDublinCore与EA方法二(中介元数据格式)如UNIverse项目利用GRS格式进行MARC格式和其他记录格式的转换 比较方法一转换准确、转换效率较高 谢谢观赏2019-9-2136元数据映射(MetadataMapping)原因谢谢37元数据类型元数据类型 内容元数据描述对象内容的信息如大字标题、主题、引导段落、图像、影片管理元数据描述和电子文档相关的信息如作者、创建者、创建日期等负载信息元数据提供电子文档的物理属性如文本中表示强调的粗体标识,电子邮件系统中邮件的大小标识参考信息元数据源自电子文档中的超链接扩展到表达任何万维网信息、文档和资源的参考链接包括环境信息,以及文档的结构信息如经常出现电子文档中指向各章节的链接谢谢观赏2019-9-2137元数据类型内容元数据谢谢观赏2019-9-2138元数据表示语言元数据表示语言 标记语言标准通用标记语言SGML超文本标记语言HTML可扩展标记语言XML虚拟现实模型语言VRML无线标记语言WML元数据标准DublinCoreHL7(描述医学网络资源的元数据)教育资源元数据机读目录(MARC)谢谢观赏2019-9-2138元数据表示语言标记语言谢谢观赏2019-9-2139SGML 标准通用标记语言是一种描述语言的语言,定义了以电子形式表示文本的方法特点正式的,能允许验证文档的正确性结构化的,能够处理复杂的文档可扩充的,能够支持大型信息存储的管理组成部分SGML声明,设定基本情况 定义DTD文档类型,设定标记语言结构的语法 描述用于标记的语义规格说明,做出了DTD表达的语法限制 描述用于标记的语义规格说明,做出了DTD表达的语法限制应用实例HTML、XML 谢谢观赏2019-9-2139SGML标准通用标记语言谢谢观赏2019-9-2140其它标记语言其它标记语言虚拟现实模型语言VRML用于对3维虚拟场景进行建模的描述性语言HTML定义2维,而VRML定义3维无线标记语言WML类似于HTML的测览语言提供测览支持、数据输入、超级链接、文本和图像表现以及表格交互 应用于“无线应用软件”环境下的网页语言 为WAP(WirelessApplicationProtocol)协议所包括的一种标记协议语言谢谢观赏2019-9-2140其它标记语言虚拟现实模型语言VRML谢谢观赏2019-941Dublin CoreDublin Core元数据标准元数据标准 背景搜索引擎的查准率比较低创建者OCLC(OnlineComputerLibraryCenter,Inc.,美国在线计算机图书馆中心)目的从用户的角度出发创建了一种新的网络资源描述标准或格式第一次国际研讨会1995年3月,在都柏林(Dublin)召开探讨如何建立一套描述网络上电子文件特征、提高信息检索效果的方法开始启动电子图书馆对象元数据标准的研究项目谢谢观赏2019-9-2141DublinCore元数据标准背景谢谢观赏2019-42DC元数据集元数据集 包括15个核心元素按照信息的类型和范围分为三个子集数据资源内容数据知识产权数据实体特点简练、易于理解、可扩展能与其他元数据形式兼容被称为一个良好的网络信息资源描述元数据集 谢谢观赏2019-9-2142DC元数据集包括15个核心元素谢谢观赏2019-9-43数据资源内容子集数据资源内容子集 元元 素素定定 义义TITLE(数据集名称)由数据生产者或分发者确定的数据集名称SUBJECT(主题)数据集的主题,可以是说明数据集主题或内容的关键字或短语,最好使用规定的缩写词或统一分类名称DESCRIPTION(描述)数据集内容的简要说明SOURCE(数据源)生产数据集的原始资料说明,包括原始资料出版日期、生产者、格式、标识码或其他说明信息LANGUAGE(语言)数据集使用的语言,该元素的内容应当与“语言标识码”标准(RFC1766)一致,如en(英国)、de(德国)、fr(法国)等RELATION(关系)其他生产者标识码及其与数据生产者之间的关系COVERAGE(时空覆盖范围)数据集内容的空间和时间覆盖范围。空间覆盖范围可以用坐标或地名表示;时间范围是指数据的现势性,按ISO 8601日期和时间格式标准,即YYYY-MM-DD谢谢观赏2019-9-2143数据资源内容子集元素定义TITLE(数据集44数据知识产权子集数据知识产权子集 元元 素素定定 义义CREATOR(数据生产者)负责生产数据的主要单位或个人PUBLISHER(出版者)将数据集提供用户使用的负责单位,如出版社等CONTRIBUTOR(其他生产者)除数据生产者元素中说明以外的其他参与生产者(如编辑、转换等)RIGHTS(版权)版权说明。与版权管理声明链接的标识码,或与提供数据集版权管理信息的服务链接的标识码谢谢观赏2019-9-2144数据知识产权子集元素定义CREATOR负责45数据实体(形式)子集数据实体(形式)子集 元元 素素定定 义义DATE(日期)数据集生产或提供使用的日期,按ISO 8601日期和时间格式标准,即YYYY-MM-DDTYPE(类型)数据集的类型FORMAT(格式)数据集的数据格式,用于识别显示或操作数据集的软件及硬件。IDENTIFIER(标识码)唯一标识数据集的字符串或数字,对于联网数据资源,包括URL和URN,或ISBN谢谢观赏2019-9-2145数据实体(形式)子集元素定义DATE(日期46DCMI DCMI(DublinCoreMetadataInitiative)都柏林核元数据研究行动已经成为一个国际性的电子数据对象标准研究组织 有来自英国、澳大利亚、芬兰、加拿大、美国等国的具有多种不同专业背景的个人和团体参加 从事元数据标准、实践指南、支撑技术及相关政策的研究与开发 成立了一个教育工作组DCE 从数字图书馆元数据标准中筛选出上述DC中的15个核心元素作为学习对象数据要素 谢谢观赏2019-9-2146DCMIDCMI(DublinCoreMetada47HL7(Health Level 7)开发机构1987年,由美国国家标准局(ANSI)授权的HL7(HealthLevelSevenInc)开发领域专门用于医疗卫生机构及医用仪器、设备数据信息传输的标准支持的国家在1994年HL7已纳入美国ANSI国家标准澳洲、加拿大、德国、以色列、日本、纽西兰、荷兰及英国用途适用于医院内部的信息交换适用于医院与医院之间,医院与保险公司、医院与上级主管部门之间的大量信息交换 谢谢观赏2019-9-2147HL7(HealthLevel7)开发机构谢谢观48HL7技术技术参考了OSI的通讯模式HL7纳为最高的一层,也就是应用层 谢谢观赏2019-9-2148HL7技术参考了OSI的通讯模式谢谢观赏2019-9-49HL7HL7标准的內容标准的內容(1)(1)Ch1:Introduction(概述与HL7历史)Ch2:Control(控制)Ch3:Patient Administration(病患管理,挂号)Ch4:Orders(医令)Ch5:Query(查询)Ch6:Financial Management(病患帐务)Ch7:Observation Reporting(检验报告传送)Ch8:Master Files(参考档同步机制)谢谢观赏2019-9-2149HL7标准的內容(1)Ch1:Introductio50HL7HL7标准的內容标准的內容(2)(2)Ch9:Medical Records/Info.Management(病历)Ch10:Scheduling(排程)Ch11:Patient Referral(转诊)Ch12:Patient Care(病患看护)附录A:Data Definition Tables(参考表)附录B:Lower Layer Protocol(LLP)附录C:Network Management附录D:BNF Message Descriptions附录E:Glossary谢谢观赏2019-9-2150HL7标准的內容(2)Ch9:MedicalReco51HL7 HL7 特点特点可应用于多种操作系统和硬件环境所有不同平台的医院信息管理系统通过HL7都可以顺利沟通设备可以做到无缝联接和医学数据信息的无障碍交换汇集了的一些标准接口格式针对不同厂商设计应用软件谢谢观赏2019-9-2151HL7特点可应用于多种操作系统和硬件环境谢谢观赏2052教育资源元数据教育资源元数据 IEEE LOM学习对象元数据IMS教学管理系统CELTS中国教育信息化技术标准谢谢观赏2019-9-2152教育资源元数据IEEELOM谢谢观赏2019-9-53IEEE LOM(1)由IEEE学习技术标准委员会P1484.12学习对象元数据工作组建立目的使用最小属性集完成对学习对象的管理、检索和评估便于将来对其属性进行扩展目标定义学习对象元数据的语法与语义对安全、隐私、商业和评估等应用提供了描述符 学习对象指一切可为教学和培训目的服务的对象 可以是物理的:如实验器材、课本 可以是数字的:如教学软件,网络课件 谢谢观赏2019-9-2153IEEELOM(1)由IEEE学习技术标准委员会P154IEEE LOM(2)元素9个基本类别(即通用类、生命周期类、宏元数据类、技术类、教育类、权利类、注解类、关系类、分类类)每个类别包括若干元素对每个元素定义了其名称、解释、值域、数据类型、附注和示例作用在不操作学习对象的情况下通过元数据信息来了解学习对象的一些有用的属性可以对学习对象进行有效的分类管理和查找可以从元数据信息中获取学习对象的评价信息,也可以把自己的评价加入到元数据谢谢观赏2019-9-2154IEEELOM(2)元素谢谢观赏2019-9-2155IMS 1997年美国EDUCOM(美国多所大学联合组成的联盟)专门对电子学习(e-Learning劫标准进行研究项目目的能达成各校间网络化教材的共享目标达成分布式学习环境下之应用系统或服务的互操作性,定义、发展所需的技术规范协助其他单位,将IMS规范纳人产品或服务中 主要任务主要发展和推广有关教育的开放规范促进线上分布式的学习活动如搜寻和使用教育用途的内容、追踪学习者的学习进度性质并非开放性组织所制定的规范还未成为正式的标准谢谢观赏2019-9-2155IMS1997年美国EDUCOM(美国多所大学联合组56IMS 规范规范用于内容描述、发现和交换的规范IMS内容包装说明(IMSContentPackagingSpecification)IMS问题与测试互操作性说明(IMSQuestion&TestInteroperabilitySpecification)IMS学习资源元数据说明(IMSLearningResourceMetadataSpecification)数字资源库互操作(Digital Repositories Interoperability)用于内容交互与跟踪的规范简易串序/简易排序(Simple Sequencing)能力(Competencies)学习设计(Learning Design)可用性(Accessibility)用于应用系统互操作的规范IMS学习者信息包装说明(IMSLearnerInformationPackageSpecification)IMS企业说明(IMSEnterpriseSpecification谢谢观赏2019-9-2156IMS规范用于内容描述、发现和交换的规范谢谢观赏2057中国教育信息化技术标准中国教育信息化技术标准 2001年开始启动基于LOM目标实现资源共享支持系统互操作保障网络教育服务质量方法跟踪国际标准研究工作和引进相关国际标准根据我国教育的实际情况修订与创建各项标准谢谢观赏2019-9-2157中国教育信息化技术标准2001年开始启动谢谢观赏2058CELTS 体系体系学习对象元数据(CELTS-3)规定了描述学习对象的基本方法与准则 属于CELTS体系中的基础标准 教育资源建设技术规范(CELTS-41)面向资源建设领域包括基础教育、高等教育、职业教育和培训等领域)是对学习对象元数据与具体应用领域结合的产物 基础教育教学资源元数据规范(CELTS-42)应用领域则更为具体主要面向基础教育的资源建设 关系一脉相承的都是以LOM为核心建立的 谢谢观赏2019-9-2158CELTS体系学习对象元数据(CELTS-3)谢谢59机读目录(机读目录(MARC)广泛用于图书馆书目记录数据是目前图书馆描述、存储、交换、处理以及检索信息的基础特点可变长字段的记录格式采用目次方式 每条MARC记录分三个区(头标区,目次区,数据区)谢谢观赏2019-9-2159机读目录(MARC)广泛用于图书馆书目记录数据谢谢观602.5 XML2.5 XML 性质W3C于1998年2月发布的一种标准是SGML的一个简化子集可扩展标记语言特点较好地解决了HTML无法表达数据内容等问题允许各个组织、个人建立适合自己需要的标记集合 谢谢观赏2019-9-21602.5XML性质谢谢观赏2019-9-2161XML与与HTML比较比较文档的3个要素数据、结构以及显示方式HTML显示方式内嵌在数据中在创建文本时,要时时考虑输出格式创建文档的重复工作量大不易抽取语义信息XML显示格式从数据内容中独立出来,保存在样式单文件(StyleSheet)中自我描述性质能够很好地表现许多复杂的数据关系谢谢观赏2019-9-2161XML与HTML比较文档的3个要素谢谢观赏2019-9-62XML结构结构 文件头与HTML类似,是可选的文件主体包括一个或多个元素形式是一棵分级的树混杂的“结尾部分”由注释、处理指令和空白组成注释用表示,可在文档中任意位置谢谢观赏2019-9-2162XML结构文件头谢谢观赏2019-9-2163元素元素(Element)表示方法由开始标记、结束标识以及标识之间的数据构成标记之间的数据被认为是元素的值每个元素都有不同的标记名王力元素名是director元素值是“王力”王力元素名是actor元素值是“王力”谢谢观赏2019-9-2163元素(Element)表示方法谢谢观赏2019-9-264元素要点元素要点关键的3点所有元素必须有结束标记所有元素必须正确嵌套,不允许交迭所有属性值必须加引号注意点XML文档主体有且仅有一个XML根元素可以嵌套XML元素,形成一棵树形结构谢谢观赏2019-9-2164元素要点关键的3点谢谢观赏2019-9-2165XML文档文档例子例子 数据结构 许卓群等 数据挖掘 韩家炸等 谢谢观赏2019-9-2165XML文档例子谢谢观赏2019-9-2166例子的例子的树状结构树状结构 谢谢观赏2019-9-2166例子的树状结构谢谢观赏2019-9-2167XML属性属性 给元素提供进一步的说明信息必须出现在起始标记中以名称/取值对出现,属性名不能重复名称与取值之间用等号“=”分隔用引号把取值引起来例如 100000说明了工资的货币单位是人民币元谢谢观赏2019-9-2167XML属性给元素提供进一步的说明信息谢谢观赏201968XML处理器处理器 目的解析XML文档提供对XML文档内容和结构的访问文档对象模型(DocumentObjectModel,DOM)将完整的XML转换成一棵树的形式放在内存中供随机访问元素、属性XML简单API(SimpleAPIforXML,SAX)采用事件驱动模型通过标记的起止来触发事件DOM与SAX的比较(讨论)谢谢观赏2019-9-2168XML处理器目的谢谢观赏2019-9-2169处理指令处理指令(Processing Instruction)目的给XML处理器提供信息,使其能够正确解释文档内容表示起始标记是“”方法XML分析器把这些信息原封不动地传给应用程序由应用程序来解释这个指令遵照它所提供的信息进行处理谢谢观赏2019-9-2169处理指令(ProcessingInstruction)70两种处理指令两种处理指令XML声明必须包括version属性,指明所采用的XML的版本号,而且它必须在属性列表中排在第一位standalone属性表明该XML文档是否和一个外部文档类型定义DTD配套使用encoding属性则指明了数据所采用的编码标准XSL样式单引用告诉XSL样式单解析器,样式单的类型是text-xsl类型text-xsl可以在文档contacts.xsl中找到谢谢观赏2019-9-2170两种处理指令XML声明谢谢观赏2019-9-2171XML的名字空间的名字空间 背景由于XML对互操作性的支持,每个人都可以创建属于自己的XML词汇不同的开发者会用相同的元素来代表不同的实体作用为XML文档元素提供了一个上下文允许开发者按一定的语义来处理元素为什么引入NS(命名空间)讨论谢谢观赏2019-9-2171XML的名字空间背景谢谢观赏2019-9-2172XML NS XML NS 例子例子?xml version=1.0?hamburgersxmlns:purchase=xmlns:purchase=http:/fastfood.org/franchise/pricesxmlns:sales=xmlns:sales=http:/fastfood.org/customer/priceshamburger lowfat=dream onnameCowBurger/namedescriptionGreasy and good./descriptionpurchase:pricepurchase:price0.99/pricesales:pricesales:price2.99/price/hamburger/hamburgers谢谢观赏2019-9-2172XMLNS例子?xmlversion=1.073XSL(Extensible Stylesheet Language)背景用标准的DOMAPI来实现XML数据的交互,是十分单调乏味的如想找到所有满足某些条件的元素,或转换为简单的HTML表格,必须手工书写代码遍历整棵树来寻找 目的为标准化及简化人们完成这些任务所需做的工作谢谢观赏2019-9-2173XSL(ExtensibleStylesheetLa74食品的例子食品的例子 XML文档 月饼 中秋节食用的传统食品 2.99 HTML文档 食品 月饼,中秋节的传统 食品,2元 谢谢观赏2019-9-2174食品的例子XML文档HT75XSL文件文件 选取了当前结点的所有食品子结点选取了当前结点的所有食品子结点 hamburgers xsl:for each select=hamburgerslowfat=dream on 标识出符合给定条件的结点标识出符合给定条件的结点 ,取结点中各个元素的值 谢谢观赏2019-9-2175XSL文件?xmlVersion=1.0?76XSLXSL用途用途增强了互操作性XML数据转换为HTML从一种XML格式到另一种XML格式之间的转换开发人员不用为了描述某种类型的数据而采用通用的词汇某个人向你的系统发送了一篇XML文档,而你的系统不认识它所采用的XML词汇只要进行一次简单的XSL转换就可以得到自己熟悉的词汇 谢谢观赏2019-9-2176XSL用途增强了互操作性谢谢观赏2019-9-2177文档类型定义文档类型定义 DTD 目的定义XML文档结构,即其中的元素、属性以及元素之间关系的定义了文件中的元素能用什么名字,能放在什么位置,应该怎样组合可以检测XML文档的结构是否正确例如描述一组,其中每个又可以包含若干个DTD中 应 该 有 语 句:生成的表:管乐弦乐器乐谢谢观赏2019-9-2177文档类型定义DTD目的谢谢观赏2019-9-2178DTD DTD 引用引用内部引用包含在XML文档的前导说明部分如 文档体外部引用作为一个外部文档被引用如 文档体SYSTEMSYSTEM指一个作者或组织所编写的通用的DTD 或是PUBLIC 指由权威机构制订的、提供给特定行业或公众使用的DTD谢谢观赏2019-9-2178DTD引用内部引用谢谢观赏2019-9-2179DTDDTD中中ETD(元素类型声明元素类型声明)作用声明所有有效的文档元素结构类型空元素类型使用空元素标记,元素中没有内容ANY元素类型元素中可以包含任何内容父元素类型元素中可以包含子元素在DTD中通过正则表达式规定子元素出现的顺序和次数混合元素类型 元素中可以包含文本文本之间可以有选择地插入子元素,子元素出现的顺序和次数不受限制谢谢观赏2019-9-2179DTD中ETD(元素类型声明)作用谢谢观赏2019-9-802.6 XML Schema2.6 XML Schema DTD缺点采用了非XML的语法规则不支持数据类型扩展性较差XML模式己经渐有取代DTD的趋势拥有比DTD更强大的功能用于更精确和有效地描述XML文档结构谢谢观赏2019-9-21802.6XMLSchemaDTD缺点谢谢观赏20181XML模式的优点模式的优点一致性直接借助XML自身的特性利用XML的基本语法规则定义XML文档的结构不必再利用一种特定的形式化的语言扩展性引入了数据类型、命名空间在基本数据类型基础上用户可自己扩展数据类型 互换性利用模式能够书写XML文档并验证文档的合法性对不同的模式进行转换,以实现更高层次的数据交换规范性利用元素的内容和属性来定义XML文档的整体结构 基于XML,更具有规范性谢谢观赏2019-9-2181XML模式的优点一致性谢谢观赏2019-9-2182数据类型数据类型 用途为ElementType和AttributeType指定数据类型基本数据类型(10种)entity,entities,enumeration,id,idref,idrefs,nmtoken,nmtokens,notation和string扩展数据类型bin.baSe64,bin.heX,boolean,char,date,dateTime,dateTime.tz,fixed.14.4,float,int,number,timetime.tz,i1,i2,i4,r4,r8,ui1,ui2,ui4,uri,uuid谢谢观赏2019-9-2182数据类型用途谢谢观赏2019-9-2183XMLS元素类型元素类型基本格式 取值及含义(略)谢谢观赏2019-9-2183XMLS元素类型基本格式谢谢观赏2019-9-2184XMLS属性类型属性类型基本格式 取值及含义(略)谢谢观赏2019-9-2184XMLS属性类型基本格式谢谢观赏2019-9-2185数据类型的使用例子(数据类型的使用例子(1 1)定义元素“名字”和“生日”其中string和date类型都是Schema中自带的基本数据类型 minOccurs和maxOccurs是最少和最多出现次数的约束,这里表示有而且只出现一次 谢谢观赏2019-9-2185数据类型的使用例子(1)定义元素“名字”和“生日”谢谢观86数据类型的使用例子(数据类型的使用例子(2 2)扩展数据类型Schema中没有规定的类型,如“性别”类型定义例子 注释name属性是该数据类型的名称数据类型由restriction子元素进行约束该元素中的base属性是基类型谢谢观赏2019-9-2186数据类型的使用例子(2)扩展数据类型谢谢观赏2019-9872.72.7元数据自动抽取技术元数据自动抽取技术 预处理剔除在格式、内容、语言等方面存在问题或严重缺失的文档产生格式相对规整的文本文档提取元数据由数字化文档元数据的规范定义,产生提取元数据的各种模式依据元数据模式进行数字化文档的挖掘与匹配利用与数字化文档相关的启发式规则和经验规则,有效提取元数据谢谢观赏2019-9-21872.7元数据自动抽取技术预处理谢谢观赏2019-9-88MathML含义Mathematical Markup Language用途用来描述数学符号、纪录其结构和内容目标是在Web上实现能像HTML处理文本一样,处理数学问题谢谢观赏2019-9-2188MathML含义谢谢观赏2019-9-2189例:例:x2+4x+4=0 applyplus/plus/applypower/power/cix/cicn2/cn/applyapplytimes/times/cn4/cncix/ci/applycn4/cn/apply谢谢观赏2019-9-2189例:x2+4x+4=0apply谢谢观赏90SMIL含义Synchronized Multimedia Integration Language用途一种基于XML的表述多媒体演示的语言将一组独立的多媒体对象整合为一个多媒体演示谢谢观赏2019-9-2190SMIL含义谢谢观赏2019-9-2191SMILSMIL例子例子HTMLHEADSTYLE.time behavior:url(#default#time);/STYLE/HEADBODYDIV CLASS=time t:timeline=seqDIV CLASS=time t:timeline=seqP class=time t:dur=1 This appears for one second and goes away/P P class=time t:dur=1 This appears after one second,remains visible for one second and goes away /PP class=time t:dur=1 This appears after two seconds,remains visible for one second and goes away/P/DIV/BODY/HTML谢谢观赏2019-9-2191SMIL例子HTMLHEADSTYLE谢谢92CDF 含义Channel Definition Format一种开放的规格允许Web的发布者经常更新信息或是频道CDF起到了频道内容目录的作用用户仅需选择一下频道信息就会从Web服务器定时的传递到客户端谢谢观赏2019-9-2192CDF含义谢谢观赏2019-9-2193问题讨论问题讨论1.1.什么是元数据(什么是元数据(metadata)?)?2.元数据与数据是什么关系?元数据与数据是什么关系?3.元数据(元数据(metadata)概念提出的背景是什么?)概念提出的背景是什么?4.元数据能解决什么问题?元数据能解决什么问题?5.元数据是新概念吗?元数据是新概念吗?谢谢观赏2019-9-2193问题讨论1.什么是元数据(metadata)?谢谢观赏94问题讨论问题讨论6.数字图书馆和元数据的关系是什么?数字图书馆和元数据的关系是什么?7.什么是元数据的语义、结构和句法?什么是元数据的语义、结构和句法?8.如何使用元数据?如何使用元数据?9.元数据可以应用哪些置标语言?元数据可以应用哪些置标语言?10.什么是什么是RDF?谢谢观赏2019-9-2194问题讨论6.数字图书馆和元数据的关系是什么?谢谢观赏95问题讨论问题讨论11.什么是语义万维网(什么是语义万维网(Semantic Web)?语义万维网与语义万维网与元数据有什么关系?元数据有什么关系?12.什么是本体什么是本体(Ontology)?元数据与本体有什么关系?元数据与本体有什么关系?13.存在多个元数据格式存在多个元数据格式,解决互操作问题通常有哪些方解决互操作问题通常有哪些方法?法?14.14.元数据映射解决系统互操作问题有什么优缺点?元数据映射解决系统互操作问题有什么优缺点?谢谢观赏2019-9-2195问题讨论11.什么是语义万维网(SemanticWe96ReferencesW.Song,M.Zhang.AFirstSteptowardtheSemanticWeb,HigherEducationPress,2004Bernard-Lee,T.(2000).SemanticWeb-XML2000.Available:XMLSchemaPart0:Primer,W3CRecommendation,May2001谢谢观赏2019-9-2196ReferencesW.Song,M.Zhang.97Enjoy this Study.谢谢观赏2019-9-2197EnjoythisStudy.谢谢观赏201998谢谢观赏2019-9-2198谢谢观赏2019-9-21
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!