资源描述
人工智能、模式识别与医学专家系统,第一节 人工智能,“智能化”是当前新技术、新产品、新产业的重要发展方向、开发策略和显著标志,例如:智能控制(Intelligent Control)、智能自动化(Intelligent Automation)、智能管理(Intelligent Management)、。因此,人工智能具有广泛的用途。可以说,哪里有计算机应用,哪里就在用人工智能;哪里需要自动化或半自动化,哪里就在应用人工智能的理论、方法和技术。,一.人工智能概述 什么是智能 智能(Intelligence)即智力功能,是人类大脑所具有的感知、认识、学习、理解、分析、综合、判断、推理、创造等局部功能的总和与它们的有机综合的统称;因此,完善的智能中不能不包含有人类的情感、意识、意志等这种高级因素。,智能究竟是什么? 智能是解决感性问题的能力。所谓感性就是个别的、特殊的、随机的、模糊的、感官的、情绪化的、个人意志的。解决这类问题需要经验的积累和归纳推理并形成新的经验。也就是具有自动学习、经验积累和应用知识的能力。 对电脑而言,智能就是必须具有优化、扩展和改变主体已有程序和创建新程序的能力,即具有我们过去常说的主观能动性。智能可以利用一般经验或理论解决特殊问题,也可以归纳总结个别的经验使之上升到普遍的理论。,人的行为可分为社会行为和个人行为。 智能在人的社会行为中的作用主要是制定社会规则、探索和发现自然规则以及选择和套用这些规则。 而智能在人的个人行为中主要是通过个人情感和意志起作用以处理新鲜感受。,什么是人工智能 人工智能(Artificial Intelligence) 是利用设备或机器,用人工的方法,对人脑的思维活动过程进行模拟;当使得设备或机器的功能与脑功能大体等价时,这种设备或机器的功能就可以认为是具有某种程度的人工智能。人工智能应该以平均智力商为评定标准,并在与对比者(人)同等条件状况下进行全面地综合测试或进行某几种局部功能的单项测试;当测试结果不低于规定的智力商数时,应当承认该设备或机器具有某种程度或某种意义的人工智能。,所谓人工智能,又称为智能模拟,是计算机技术的一个分支,它研究如何利用计算机来完成用人的智慧才能完成的工作。 人工智能问题是一个古老的但又是十分新颖的研究课题。近十多年来,各国研究人员在人工智能的研究上都已经获得巨大的进展。然而各种传统的或新颖的智能模型迄今还不能完全而圆满地对大脑思维活动的过程进行解释和模拟,人们还不十分了解信息在大脑中的底层结构和编码方法;其中特别是象人们的概念、意识、情感和创造性思维过程等,还根本无从着手;同时关于这一方面,在哲学上、自然科学上还有很大的争论,还不能得到哲学界和自然科学界的一致认同。,人工智能与计算机 人们早已习惯于把计算机称之为“电脑”,但是人们忽略了这样一个事实无论电脑的功能有多么强大,用途有多么广泛,它也不过是个具有超级能力的白痴。 严格地讲,电脑只能执行特定的指令,而人脑则是处理所有感受到的信息。所谓“特定的指令”是指电脑程序可接受的或可执行的外部输入。显然执行指令与处理信息有着本质的不同。 这并不是否认电脑具有处理信息的能力,这里说的电脑处理信息与人脑处理信息是不同的概念。其实电脑处理信息过程也是在执行外部指令或给定程序中的指令。,电脑的软硬件都不是自发进化而成的。电脑程序是人根据自然规律、法则和社会经验的归纳总结,是由人编制的。 电脑程序集中的是人的经验总结,其本质是理性的。所谓理性就是理论的、有序的、精确的、数字化的、结论性的、有规律的、普遍性的、公共的、合乎逻辑的。简单类比就如同是一本操作手册,人们只要照它去做就是了。 显然智能不是被用来解决这类理性化的问题的。(智能是解决感性问题的能力。)因为当一切都规定好了、程序化了,就根本不需要智能了。由此我们得出一个结论无论电脑的功能有多么强大,只要它只能按给定的程序来工作,它就不能算作具有智能。,记忆、归纳推理与信息处理 通常记忆内容包括两个部分一是记录所接受或感受到的信息,这主要是指外部进来的信息。二是自动记录主体自身的活动过程。电脑只能记忆前者,而不能记忆后者。而人脑则两者都可以做到。电脑的记忆过程是被动地执行指令,它所能记住的东西仅仅是工作所需的程序和要处理的数据。而人脑所记录的东西不仅仅是感受到的信息,而且最重要的是能够记录处理信息的过程,或者说能够记录大脑自身有意识的活动内容。记忆内容第二部分所指的过程是自动的、不受控的,而第一部分则是可以被控制的。,记忆、归纳推理与信息处理 利用已有的经验来解决新的问题需要归纳和推理。人的这种能力是由人脑的记忆构造决定的。人脑在发育的早期阶段记忆过程主要是素材和基本经验块堆的建立和积累,即机械记忆。人脑在成熟阶段记忆过程主要是经验块堆的关联和重组,即关联记忆。由关联记忆形成的人脑活动使人的思维模式天生具有归纳推理能力。经验的重组使人得到了新的经验,获得了进步。人脑的这种记忆构造的优点是具有模糊识别和记忆修补能力,缺点是老的关联成分会因打散而消退, 即产生忘却。,记忆、归纳推理与信息处理 人记住一张脸至少不比记住一个外语单词要难,而电脑恰恰相反,它宁愿去记一个城市的电话簿。电脑几乎完全靠机械般的精确记忆,而且不能利用记忆进行归纳推理,因而无法实现智能所必须的利用自身经验之功能。电脑虽能记忆,但不能具有经验。 电脑在记忆时会把所有的素材都记录下来。严格地讲,电脑中的磁盘并不完全属于它的脑子,磁盘中的数据部分就象人的笔记本和资料库那样,是脑外之物。而我们人脑中已经固有了基本素材和经验,记忆时只需要把已有的各个素材和经验的关联记录下来。这里所说的素材就是人对最基本物理感受的机械记忆。,记忆、归纳推理与信息处理 其实这些素材的量并不是很多,当出生的婴儿一开始感受这个世界,只需要不长的时期就可以得到他一生所需的基本记忆素材。其他时间的记忆就是把这些素材关联成块,再把块关联成堆。块块堆堆之间的再关联就构成了我们脑袋里的复杂记忆。对人类大脑的解剖分析也支持这一论点,另外人的记忆和经验的增加并没有使大脑越长越大,这还可以解释我们大脑在工作时为什么消耗很小的物理能量。关联记忆使得我们成年人脑袋的大小并不与记忆的多少成正比。要是我们把所有的感受象录音、录像那样全都记下来,要么把我们的脑子胀爆,要么我们的脑袋长得比楼房还大。,记忆、归纳推理与信息处理 人类的情感和智能都与我们大脑的记忆特性密切相关,我们大脑有意识的活动在相当程度上是记忆活动。探索和认识人脑的记忆原理是实现人工智能的重要一环,也是电脑模拟或实现人脑智能的必经之路。任何试图逃避这一关的做法都不会成功。 电脑科技的高速发展并未导致电脑在智能化方面有什么进展,其重要原因之一就是电脑的记忆方式一直停留在它的初始阶段。,二、人工智能的发展轨迹,(1) 模拟人类的思维规律,即推理方法的研究和程序化;(2) 正确的知识表示,运用知识进行推理,即知识的形式化;(3) 从大量已有的知识推出新的知识,即专家系统。,三、人工智能的基本方法,人工智能的基本方法有以下几种:1、启发式搜索:人们解决问题的基本方法是方案-试验法,对各种可能的方案进行试验,直至找到正确的方案。搜索策略有盲目搜索、启发式搜索之分。盲目搜索是对可能方案进行顺序的试验;启发式搜索是依照经验或某种启发式信息,摒弃希望不大的搜索方向。启发式搜索大大加快搜索过程,使得人们处理问题效率得到提高。,2、规划:人们待解决的问题一般可以分解转化为若干小问题,对于每个小问题还可以进行分解。由于解决小问题的搜索大为减少,使得原问题的复杂度降低,问题的解决得到简化。规划要依靠启发式信息,成功与否,很大程度上决定于启发信息的可靠程度。3、知识的表达技术:知识在计算机内的表达方式是用计算机模拟人类智能必须解决的重要问题。问题解决的关键是如何把各类知识进行编码、存储;如何快速寻找需要的知识;如何对知识进行运算、推理;如何对知识进行更新、修改。,四、人工智能的研究和应用领域,人工智能的研究和应用领域概括起来有8个:1、问题求解:我们通过对人们求解问题的一般规律、求解问题的思路的研究,编制一个智能程序,依照人们解决问题的方法与步骤,解决问题。2、自然语言处理:自然语言处理是研究计算机如何运用已有的词法和语法规则,正确理解人们的自然语言,以方便用户的使用与表达。3、模式识别:模式识别是研究如何从庞大的信息中提取特征,根据特征识别不同事物的基本原理。,4、智能数据库:智能数据库是研究利用人的推理、想象、记忆原理,实现对数据库的存储、搜索和修改。智能数据库通过有效的组织,能够满足人们快速检索和修改数据库的要求。 5、智能机器人:智能机器人能够对外部环境具有一定的适应能力,根据实际的环境信息进行综合处理,并做出正确的响应。这种机器人用于航天、军事、工业制造等领域。6、博奕:博弈是研究使自己取胜、战胜对手的策略。在决策过程中要对形势做出恰当的估计,搜寻各种可能的策略组合,通过对比分析确定对自己最有利的策略。其中运用到问题求解、模式识别等方法。,7、程序自动设计:程序自动化是为了设计一种算法。该算法是分层结构的,先提出一些规定,形成最高一级的算法,并提出下一层算法的规定,然后按照这些规定形成下一级的算法和再下一级的规定,最后完成整个程序。程序自动化较多的研究工作放在了自动程序验证方面,即让计算机自动查找程序中的错误。8、定理的自动证明:计算机通过模仿人的推理和演绎过程,从最基本的公理出发,证明定理的正确性。现在信息技术的飞速发展,使得Al有更广泛的研究和应用领域,如专家咨询系统、组合调度问题、虚拟现实等等。,五、应用举例,指纹识别技术是指利用计算机进行的指纹自动识别技术,它是一项综合技术,其研究发展涉及到多个前沿及边缘科学,如模糊数学、数学形态学、神经网络、模式识别、计算机视觉、人工智能、数据压缩、并行处理以及网络技术等。这种技术的原理是通过指纹扫描仪上的光电识别器(摄像头)对人指尖的卷状纹理和涡进行扫描后,计算机把特定的隆起部位的位置制成表和记录下来而形成一个对每一个人来说都是唯一的一个压痕模式,存入计算机指纹数据库。,计算机指纹扫描仪能够区分人的手指与伪造的如蜡制的手指或橡胶手套上的指纹,这是由于对人的手指其扫描仪传感系统能分辨出血液的流动情况、血压等信息。当进行身份认证时,指纹自动识别系统会将人现场通过指纹扫描仪收集到的指纹经软件系统与数据库的指纹相对照而进行确认,对主流机型只需2秒左右的时间。由于两个人拥有完全相同指纹的概率估计少于10亿分之一,因此识别率极高,如美国Identix公司的指纹扫描设备在用一个右手指正确匹配上接近100%。指纹相对人的其它生物特征具有个体差异大、实现识别所需的软硬件资源较小等优势,因此具有较大的应用空间。,第二节 模式识别,人工智能中有一个很重要的领域就是模式识别。但对于什么是“模式”,或者什么是机器能够辩别的“模式”,迄今尚无确切的定义。我们只能形象地解释说,人之所以能识别图像、声音、动作、文字、面部表情等,是因为它们都存在着反映其特征的某种模式。但这一解释根本没有诠释模式的内涵和外延。,一模式识别与模式识别的定义与目的 按照广义的定义,模式是一些供模仿用的、完美无缺的标本。 模式识别就是识别出特定客体所模仿的标本。,识别能力是人类和其它生物的一种基本属性,根据被识别的客本的性质可以将识别活动分为两个主要类型:具体的客体和抽象的客体。 字符、图画、音乐是具体的客体,它们通过对感官的刺激而被识别;论点、思想、信仰则是非物质的客体,对它们的研究主要属于哲学、政治学的范畴。 我们主要是研究具体客体的识别,而且仅局限于研究用机器完成与识别任务有关的基本理论与实用技术。这一类课题属于工程学、计算机科学、应用数学的范畴。对我们将要讨论的内容,我们对模式、模式识别作如下狭义的定义:,模式是对某些感兴趣的客体的定量的或结构的描述,模式类是具有某些共同特征的模式的集合。 模式识别是研究一种自动技术,依靠这种技术,机器将自动地(或人尽量少地干涉)把待识模式分配到各自的模式类中去。 但模式识别不是简单的分类学,其目标包括对于识别对象的描述、理解与综合。,模式识别是伴随着计算机的研究、应用日益发展起来的。其应用领域涉及社会生活的各个方面,而且还在不断扩大。人们亲切地称计算机为电脑,几乎所有本来由人脑实现的功能,都谋略用“电脑”来完成。而且已经取得,并不断取得令人振奋的成就。,但比起人脑来,电脑毕竟是小巫见大巫,不仅仅在于人脑约有10111012个脑细胞(被称为神经元),更在于每个神经元约有103104个突触,即一个神经元可通过突触与8000 个其它神经元交换信息,当生物电流通过某一突触时,神经元就将信息传送到下一神经元。所以人脑有极丰富的联想能力。可以超越时空,任意跳跃。因此计算机的联想、判别与推理能力远不如人脑,特别是在对外界信息的感知能力方面,更远不如人脑。,识别是人对感觉的认知和判断能力。 识别能力的高低体现了智能水平。识别由低到高分为三个层次。 仪器水平物理识别 动物水平模糊识别 人类智能水平情感识别,物理识别是对接受到的信息实现物理、化学和生物学的量化认识。视觉包括明暗、颜色、大小、形状、远近、运动状态等。听觉包括声音大小、频率、方位、波形等。触觉包括温度、导热率、硬度、粘度、大小、形状、受力、活动状态等。嗅觉和味觉包括物质的组成及化学成分。 现代科技与电脑相结合在物理识别范围和识别精度方面早已大大超过人自身的能力。几乎所有的科学仪器都是用于这种识别。这种识别的特点是识别内容分别独立互不相关,事件具有精确的重复性,无需经验和智能,完全可以程序化。所以它是最低层次的识别。,模糊识别是在大量复杂的信息中识别出有用的部分,即对接收的信息与以往的记忆和经验进行关联认识,剔除无关的信息。视觉包括在复杂的背景中辨认特定的人和物或以往经历过的人和物。听觉包括在嘈杂的背景中辨别出特定的声音,特别是不同人的讲话声。模糊识别可解决有谁、有什么、是谁、是什么的问题。这种对人来说轻而易举的能力对电脑来说真是太难了。目前电脑可通过对照记录的方式实现单一识别能力,例如指纹、图形、语音等。由于电脑不能实现关联记忆,所以它在模糊识别方面难以有突破性进展。这个层次的识别与我们常见的宠物、牲畜、鸟、昆虫的识别能力大致相当,因此它不能产生高级智能。,情感识别是最高级的识别。它是完全的感性识别。这种识别主要是针对人际之间的信息交流。它包括文字、语言、歌曲、表情、外表、气味和动作所表达的含义,既识字又听得懂说话,甚至包括自然现象、事件、环境和物品的人文美学含义。这种识别已经超出了人工智能的模糊识别,达到了人工高级生命的能力。以单一语音识别为例初级识别能够知道有声音,模糊识别能够知道说什么或谁在说话,而高级识别则能通过说话的内容、音调、节奏知道说话者的情绪和态度。这种识别要求电脑具有人类的情感。由此可见,高级智能与情感是完全相关的。,二模式识别的全过程,模式识别的全过程可用下图简要的表示:,以上过程中,每一阶段设计的好坏都会对全盘的工作产生严重的影响,所以每一阶段都应争取尺可能完美的效果。,由于被识别的对象多半是具有不同特征的非电量,如灰度、色彩、声音、压力、温度等,所以第一步就要将它们转变为电信号,然后经A/D转换,将它们转换为能由计算机处理的数字量。 数字化后的电信号需经预处理,以滤除样品采集过程中掺入的干扰、噪声,并人为地突出有用信号,以得到良好的识别效果。,经改善后的有用信号,还要作特征抽取或基元抽取,才能对其分类。由于特征的抽取与待识模式的类别密切相关,很难有某种泛泛的规律可依循。随着工作的深入,要不断修改与完善此阶段的工作,这也是图8.1 中虚线回溯的含义。 模式分类就是在前几步准备工作的基础上,把被识别对象归并分类,确认其为何种模式的过程。这是模式识别“出成果”的阶段,直接以其分类结果表明本次识别的结束。,模式分类按其方法,大致可分为四大类 统计决策法 句法结构法 模糊判决法 人工智能法,电脑模式识别技术最初起源于图像识别的需要,比如协助警方根据照片从茫茫人海中搜寻某个罪犯,或者帮助医生把显微镜下的细菌进行分类。 人脑在接受到视觉器官传递来的信息时,是怎样识别和区分大千世界的万物的呢? 一种方案是,大脑用一个神经元与图像上的每一点一一对应并逐一判别,最后综合为整体;但既使只描述图像局部的大致轮廓,神经元的数目仍不够使用。,另一种更符合实际的方案是:大脑感知的不是图像上的所有的点,而是轮廓中最典型的特征,如线段、角度、弧度、反差、颜色等,把它们从图像中抽取出来,然后结合头脑中过去的记忆和有关经验和知识分析判断。这种“特征抽取”也是电脑图像识别的基础。 要根据一张照片让电脑在一群人中辩认出某个人,可以先把这张照片输入电脑,抽取照片上人像上的特征,如鼻子、嘴巴、眼睛和轮廓特点,进行分类和加工,存放在机器里作为识别那个人的“模板”。然后,让所有人都接受光电设备的描扫,把他们的图像与机器事先存放的“模板”一一匹配。,只要待辩认的人躲在这群人中间,哪怕他化了装,留了长发,蓄了胡须,也逃不脱电脑的“火眼金睛”。这种图像处理方法也叫“模板匹配”,它已广泛应用于公安部门识别犯罪嫌疑人的侦破工作。 图像识别技术比较成功的运用领域是文字识别。如果把每一个汉字或西文字母都视为一个小图形,模板匹配的方法自然可以移植到文字识别过程中。目前印刷体文字识别软件早已进行商品化阶段。,通常将印刷品上的文字用扫描仪输入,首先经过特征抽取处理,例如,某字的笔画有几笔,收尾端点有几个,拐角有多少等。在电脑中已预先保存了各种字的图形和它们的特征,也称为“模板”,全部模板就构成一部“模板字典库”。由于要考虑字体、字号、纸张、油墨等因素影响,每个字都有若干套不同的模板。接下来就是将抽取到的文字特征与模板字典逐一匹配,直到在字典库中找到最接近的模板为止。运用这种方法,对于印刷体文字,电脑能够以“一目十行”的速度进行阅读。,电脑的语音识别也是一个非常重要的人工智能技术,是人工智能多年追逐的目标。与“视觉”输入设备扫描仪对应的“听觉”输入设备是话筒,语音识别的基础技术也是模式识别。由于每个人说话的音色和音调都有一定的差异,发声频率各不相同。人脑对语音似乎有一种自适应的能力,既能区分不同性别、不同年龄的语音差异,又能调整为能够理解的音素,从而听懂各色人说出的话语。采用模板匹配方式的电脑不可能具备这种本领,它通常只能“听懂”特定某人的声音,而且是经过了一段时间的“学习”的结果。学习过程称为“训练”即对着电脑大声重复地讲述某些字词,直到它把这些字词的声音频谱特征“记住”,存放在参考样本库作为识别这个字词的模板。当换了另一个人说话,电脑的正确识别率可能就会下降。,此外,语音识别对说话者使用的词汇必须作出限制,否则要求电脑具有极大的存储容量和极高处理速度。 1998年IBM公司发布ViaVoice98,使中文语音识别技术取得了实质性突破,该软件具有语音导航功能,在普通话的基础上能适应广东、四川、上海三种口音,用平常速度口音读一般文章的识别率达到85%95% ,并具有自适应功能,快速口音适应只需训练5个词、3句话,5分钟左右即可建立一个语音模型。已被广泛使用。,人工智能模式识别的进展,已经在一定程度上使电脑具备了“听”、“说”、“读”的能力,但距离理想的目标还有较长的路程。对人类来说,哪怕你把字写得龙飞凤舞,哪怕你把话说的含糊不清,我们也能根据对上下文的理解做出正确的识别。这表明人脑模式识别的方法不是或者不完全是“模板匹配”,对模糊信息的处理,人脑比电脑要强得多。此外,电脑储存的模板库或样本库,与它的判断识别机构两相分离,当模板库容量十分庞大时,搜索匹配就显得力不从心;而人脑记忆的知识与其判断机构浑然一体,它的模式识别是寻找、运用知识的思维决策。,模式识别已广泛应用于生物医学工程领域。生物医学信号的自动分类和识别,医学图像的识别都有相当多的应用实例。随着计算机的发展与普及,模式识别的应用必定会越来越广泛。,第三节 专家系统,所谓的专家系统实质上是某一专门知识,例如某种疾病的诊断、处方,某些矿物的资源勘探数据分析等的计算机咨询系统(软件)。 专家系统的基础是专家知识。专家知识可以分成两大类,一类是已经总结在书本上的定律、定理和公式等,另一类是专家们在实际工作中长期积累的经验、教训。这后一类知识往往难以总结成书面的规律或条文,但这类知识却是十分宝贵的,它们在专家做出决策、指导工作和解决疑难问题等方面起着重要作用。,第三节 专家系统,什么是专家系统:“专家系统”(Expert System)是指具有相当于专家的知识和经验水平,以及解决专门问题能力的计算机系统,通常指计算机软件。,自一九六八年由费根鲍姆主持研制完成的第一个专家系统DENDRAL(质谱数据分析、推断化学分子结构的系统)以来,已经在各行各业中研制了大量的专家系统。专门为专家系统设计的语言软件Lisp和Prolog也已诞生。尽管有报道说某些专家系统的分析判断能力超过了专家水平,并创造了大量社会财富。但是绝大多数的专家系统只能达到或接近专家水平。 在专家系统的研制过程中,人们越来越感到专家知识的获取并转换成计算机能够接受的形式是专家系统研究的瓶颈。,在研究人工智能的过程中,神经生理学和心理学等方面的研究也是一个重要的侧面。现代脑科学已证实,人脑在结构上是左脑和右脑左右对称的器官,但左右脑的功能却截然不同。左脑主司读、写、听、说这类文字、语言理解和生成的功能,专门处理逻辑推里、数学运算等“串行”任务。右脑主要负责形象思维的任务,例如图像识别与处理、模式识别、音乐与艺术、模糊推理与学习等“并行”任务。当我们力图用当代最先进的串行计算机来实现右脑的形象思维功能时遇到了极大困难。,一个对人来说是非常简单的识别或判断的任务,串行计算机却要用大量的内存和漫长的计算时间才能完成,以至当问题获得解答时已没有实际使用的价值。因而许多研究人员力图模拟神经系统的工作原理来研制新一代的计算机,这种计算机将与传统计算机有完全不同的工作原理,它是全并行式运行的具有分布式存储能力,这就是在目前吸引了大量研究人员关注的人工神经网络。人工神经网络具有自学习的能力,不需要复杂的编程,可以解决当前专家系统研制的知识获取和语言软件两大瓶颈问题。,专家系统的一个重要应用领域就是医疗诊断系统。早在一九七一年就由斯坦福大学的EHShortiffe等研制了血液感染病医疗诊断系统MYCIN,它已成为成功的专家系统的一个典型。此外,世界上比较著名的医疗诊断系统还有青光眼医疗诊断系统CASNET,内科病医疗诊断系统INTERNIST,肾病医疗诊断系统PIP,处理精神病的系统PARRY等。我国的研究者根据我国的特点,在中医专家系统方面做了大量的工作,有一些已投入实际应用。,MYCIN系统研制发起人EHShortiffe(爱德华持肖持利夫)是哈佛大学数学系毕业生,他获得了斯坦福大学面向医学的计算机应用方面的奖学金,到斯坦福大学当研究生。他在计算机科学和医学之间的边缘领域一一医疗诊断的研究中,进行了开创性的工作。当他在一九七一年完成MYCIN系统时,他只是一名研究生,到了一九七九年成为斯坦福大学的内科副教授。一九八零年召开第二届医疗中的人工智能(AIM)学术会议时,他成为大会的组织委员会主席。,MYCIN是有关传染病诊断和治疗的咨询系统。它能教会不擅长诊治传染病的医生,怎样从患者症状出发,确定病的种类及相应的治疗方法。我们知道,传染病种类繁多,与其相应的抗生素种类也不少。要在限定的时间内确定病症,选择出恰当的治疗方法,决非易事。似乎这就是开发MYCIN系统的着眼点。,MYCIN系统存放有大量传染病专家长期积累的知识,它们是肖特利夫与许多著名的传染病专家交谈,推理和总结得到的,他把这些知识归纳成200多条规则(后扩充至500多条)存放在计算机中,这些规则具有“如果那么”这种形式,称为产生式规则。这是目前专家系统使用得最广泛的推理方式之一。当系统获得一个数据且与某个“如果”相一致时(称为匹配),则相应的“那末”就代替了该数据,再继续搜寻是否存在与这个新数据匹配的“如果”,这样一个过程含有“产生”、“做出”的含义,因此获得“产生式”的名子。当使用MYCIN进行医疗诊断时,医生通过计算机的人机交互接口,将病人数据送入计算机,MYCIN系统将外来数据不断与内部知识进行匹配,直到获得最终结果。,人工神经网络,1 神经元模型的提出“人工神经网络”(ARTIFICIAL NEURAL NETWORK,简称A.N.N.)是在对人脑组织结构和运行机智的认识理解基础之上模拟其结构和智能行为的一种工程系统。早在本世纪40年代初期,心理学家McCulloch、数学家Pitts就提出了人工神经网络的第一个数学模型,从此开创了神经科学理论的研究时代。其后,F.Rosenblatt、Widrow和Hopf、J.J.Hopfield等学者又先后提出了感知模型,使得人工神经网络技术得以蓬勃发展。,神经系统的基本构造是神经元(神经细胞),它是处理人体内各部分之间相互信息传递的基本单元。据神经生物学家研究的结果表明,人的一个大脑一般有10101011个神经元。每个神经元都由一个细胞体,一个连接其他神经元的轴突和一些向外伸出的其它较短分支树突组成。轴突的功能是将本神经元的输出信号(兴奋)传递给别的神经元。其末端的许多神经末梢使得兴奋可以同时传送给多个神经元。树突的功能是接受来自其它神经元的兴奋。神经元细胞体将接受到的所有信号进行简单地处理(如:加权求和,即对所有的输入信号都加以考虑且对每个信号的重视程度体现在权值上有所不同)后由轴突输出。神经元的树突与另外的神经元的神经末梢相连的部分称为突触。,大脑之所以能够处理极其复杂的分析、推理工作,一方面是因为其神经元个数的庞大,另一方面还在于神经元能够对输入信号进行非线性处理。,2 人工神经网络的工作原理人工神经网络首先要以一定的学习准则进行学习,然后才能工作。现以人工神经网络对手写“A”、“B”两个字母的识别为例进行说明,规定当“A”输入网络时,应该输出“1”,而当输入为“B”时,输出为“0”。所以网络学习的准则应该是:如果网络作出错误的的判决,则通过网络的学习,应使得网络减少下次犯同样错误的可能性。首先,给网络的各连接权值赋予(0,1)区间内的随机值,将“A”所对应的图象模式输入给网络,网络将输入模式加权求和、与门限比较、再进行非线性运算,得到网络的输出。在此情况下,网络输出为“1”和“0”的概率各为50%,也就是说是完全随机的。这时如果输出为“1”(结果正确),则使连接权值增大,以便使网络再次遇到“A”模式输入时,仍然能作出正确的判断。,如果输出为“0”(即结果错误),则把网络连接权值朝着减小综合输入加权值的方向调整,其目的在于使网络下次再遇到“A”模式输入时,减小犯同样错误的可能性。如此操作调整,当给网络轮番输入若干个手写字母“A”、“B”后,经过网络按以上学习方法进行若干次学习后,网络判断的正确率将大大提高。这说明网络对这两个模式的学习已经获得了成功,它已将这两个模式分布地记忆在网络的各个连接权值上。当网络再次遇到其中任何一个模式时,能够作出迅速、准确的判断和识别。一般说来,网络中所含的神经元个数越多,则它能记忆、识别的模式也就越多。,人工神经网络的特点和优越性,主要表现在三个方面: 第一,具有自学习功能。例如实现图像识别时,只在先把许多不同的图像样板和对应的应识别的结果输入人工神经网络,网络就会通过自学习功能,慢慢学会识别类似的图像。自学习功能对于预测有特别重要的意义。预期未来的人工神经网络计算机将为人类提供经济预测、市场预测、效益预测,其前途是很远大的。,第二,具有联想存储功能。人的大脑是具有联想功能的。如果有人和你提起你幼年的同学张某某,你就会联想起张某某的许多事情。用人工神经网络的反馈网络就可以实现这种联想。 第三,具有高速寻找优化解的能力。寻找一个复杂问题的优化解,往往需要很大的计算量,利用一个针对某问题而设计的反馈型人工神经网络,发挥计算机的高速运算能力,可能很快找到优化解。,几种典型神经网络简介,(1)多层感知网络(误差逆传播神经网络):在1986年以Rumelhart和McCelland为首的科学家出版的Parallel Distributed Processing一书中,完整地提出了误差逆传播学习算法,并被广泛接受。多层感知网络是一种具有三层或三层以上的阶层型神经网络。典型的多层感知网络是三层、前馈的阶层网络,即:输入层I、隐含层(也称中间层) J、输出层K。相邻层之间的各神经元实现全连接,即下一层的每一个神经元与上一层的每个神经元都实现全连接,而且每层各神经元之间无连接。,除了竞争的方法外,还有通过抑制手段获取胜利的方法,即网络竞争层各神经元抑制所有其它神经元对输入模式的响应机会,从而使自己“脱颖而出”,成为获胜神经元。除此之外还有一种称为侧抑制的方法,即每个神经元只抑制与自己邻近的神经元,而对远离自己的神经元不抑制。这种方法常常用于图象边缘处理,解决图象边缘的缺陷问题。竞争型神经网络的缺点和不足:因为它仅以输出层中的单个神经元代表某一类模式。所以一旦输出层中的某个输出神经元损坏,则导致该神经元所代表的该模式信息全部丢失。,(3)Hopfield神经网络:1986年美国物理学家J.J.Hopfield陆续发表几篇论文,提出了Hopfield神经网络。他利用非线性动力学系统理论中的能量函数方法研究反馈人工神经网络的稳定性,并利用此方法建立求解优化计算问题的系统方程式。基本的Hopfield神经网络是一个由非线性元件构成的全连接型单层反馈系统.,神经网络的研究内容相当广泛,反映了多学科交叉技术领域的特点。迄今为止,在人工神经网络研究领域中,有代表性的网络模型已达数十种,而学习算法的类型更难以统计其数量。神经网络研究热潮的兴起是本世纪末人类科学技术发展全面飞跃的一个组成部分。它与多种科学领域的发展密切相关,纵观当代新兴科学技术的发展历史,人类在征服宇宙空间、基本粒子、生命起源等科学领域的进程之中历经了崎岖不平之路。我们也会看到,探索人脑功能和神经网络的研究将伴随着重重困难的克服而日新月异。,学习规则及过程:它以一种有教师示教的方式进行学习。首先由教师对每一种输入模式设定一个期望输出值。然后对网络输入实际的学习记忆模式,并由输入层经中间层向输出层传播(称为“模式顺传播”)。实际输出与期望输出的差即是误差。按照误差平方最小这一规则,由输出层往中间层逐层修正连接权值,此过程称为“误差逆传播”。所以误差逆传播神经网络也简称BP(Back Propagation)网。随着“模式顺传播”和“误差逆传播”过程的交替反复进行。网络的实际输出逐渐向各自所对应的期望输出逼近,网络对输入模式的响应的正确率也不断上升。通过此学习过程,确定下来各层间的连接权值之后就可以工作了。,由于BP网及误差逆传播算法具有中间隐含层并有相应的学习规则可寻,使得它具有对非线性模式的识别能力。特别是其数学意义明确、步骤分明的学习算法,更使其具有广泛的应用前景。目前,在手写字体的识别、语音识别、文本语言转换、图象识别以及生物医学信号处理方面已有实际的应用。但BP网并不是十分的完善,它存在以下一些主要缺陷:学习收敛速度太慢、网络的学习记忆具有不稳定性,即:当给一个训练好的网提供新的学习记忆模式时,将使已有的连接权值被打乱,导致已记忆的学习模式的信息的消失。,(2)竞争型(KOHONEN)神经网络:它是基于人的视网膜及大脑皮层对剌激的反应而引出的。神经生物学的研究结果表明:生物视网膜中,有许多特定的细胞,对特定的图形(输入模式)比较敏感,并使得大脑皮层中的特定细胞产生大的兴奋,而其相邻的神经细胞的兴奋程度被抑制。对于某一个输入模式,通过竞争在输出层中只激活一个相应的输出神经元。许多输入模式,在输出层中将激活许多个神经元,从而形成一个反映输入数据的“特征图形”。,竞争型神经网络是一种以无教师方式进行网络训练的网络。它通过自身训练,自动对输入模式进行分类。竞争型神经网络及其学习规则与其它类型的神经网络和学习规则相比,有其自己的鲜明特点。在网络结构上,它既不象阶层型神经网络那样各层神经元之间只有单向连接,也不象全连接型网络那样在网络结构上没有明显的层次界限。它一般是由输入层(模拟视网膜神经元)和竞争层(模拟大脑皮层神经元,也叫输出层)构成的两层网络。两层之间的各神经元实现双向全连接,而且网络中没有隐含层,如图5。有时竞争层各神经元之间还存在横向连接。,竞争型神经网络的基本思想是网络竞争层各神经元竞争对输入模式的响应机会,最后仅有一个神经元成为竞争的胜者,并且只将与获胜神经元有关的各连接权值进行修正,使之朝着更有利于它竞争的方向调整。神经网络工作时,对于某一输入模式,网络中与该模式最相近的学习输入模式相对应的竞争层神经元将有最大的输出值,即以竞争层获胜神经元来表示分类结果。这是通过竞争得以实现的,实际上也就是网络回忆联想的过程。,
展开阅读全文