资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,词计算和语言动力学系统的根本问题和争论,王飞跃,中国科学院自动化争论所,简单系统与智能科学重点试验室,2023年6月1日,目 录,一.问题背景,二.词计算和语言动力学理论的简洁回忆,三.从数计算到词计算:语言动力学的根本框架,四.基于胞空间和胞映射的LDS计算方法,五.语言动力学系统的根本问题及其争论方法,六.总结与展望,问题背景,马克思:,“一门科学只有在成功地运用数学时,才算到达了真正完善的地步”,模糊集合的提出者Zadeh教授:,“科学界有一种根深蒂固的传统看法,即在科学理论中使用自然语言是数学不成熟的表现”,为什么进展词计算和语言动力学争论,现实性缘由,人类已习惯于用自然语言描述和分析事物,特殊是涉及社会、政治、经济和治理中的简单过程,排解自然语言的代价太大了。,本质性缘由,感性信息或学问通常只能用自然语言来描述,由于人类区分细节和存储信息的认知力量的内在限制,感性信息在本质上是不准确的。,进展词计算和语言动力学争论的实质:信息的有效利用,数计算:,主要处理基于测度的信息,Measurement-based Information,词计算:,主要处理基于感知的信息,Perception-based Information,利用词计算和语言动力学系统的根本原则,不知道原则(The dont know rationale),不能够以足够的精度确定变量或参数的值,进而用数来描述。,不需要原则(The dont need rationale),不需要数值,语言值就足够了。,不想要原则(The dont want rationale),太细节的学问反而无效。,不确定原则(The cant define rationale),无法准确定义的概念,例如因果关系等。,我们的生疏,由于信息正交性,我们必需利用感性信息来猎取更多的信息,人类最终会生疏到,利用自然语言的词计算,不是可有可无的可选项,而是必需的。引用Zadeh,这似乎是一场“回归”自然语言的运动,但决不是科学上的倒退或马克思所认为的学科不成熟的表现:“周而复始”,但处于不同的层次,是螺旋式进展。,利用自然语言学问和信息,建立以词计算为根底的系统描述,分析,掌握和综合的语言动力学系统,是将来系统争论,特殊是简单系统争论的一个重要而有意义的方向。这一点,在处理社会,经济,生态等人造简单系统的动态描述和分析时,尤为显著。,词计算和语言动力学理论的简洁回忆:词计算,1996,年由,Zadeh,提出,见:,“,Fuzzy Logic=Computing with Words”,IEEE Transactions on Fuzzy Systems,Vol.4,,,No.4,pp.103-111,,,1996.,词计算是语言变量概念的直接扩展,词计算和语言动力学理论的简洁回忆:语言动力学系统,1995年由王飞跃提出,见:,“Modeling,Analysis and Synthesis of Linguistic Dynamic Systems:A Computational Theory”,Proc.of IEEE Intl Workshop on Architecture for Semiotic Modeling and Situation Control in Large Complex Systems,Monterey,CA,1995,pp173-178.,是试图用一种类似于求解微分差分方程的方式解决规律推理过程的副产物,语言动力学系统的,狭义,应用高层决策的语言动态模拟和分析,语言动力学计算实例,语义稳定,LDS,语义周期变化,LDS,语义收敛,LDS,语义发散,LDS,狭义语言动力学的一般例子,语言动力学系统消失在很多简单系统的分析与掌握应用之中。例如,在对一个简单问题制定掌握策略或规章的过程中,通常用语言或词来表达问题,描述情形,提出目标,制定策略,明确并实施评价程序。这一过程可以看作是一个语言动力学过程:,用词描述问题和情形:语言过程描述,用词提出目标:语言目标函数,用词制定策略:语言掌握设计,用词确定评价程序:语言状态反响,狭义语言动力学争论的核心内容,基于词和数的混合计算,由系统的静态描述转为动态描述和推理,由非完整的开环系统转为完整的闭环系统,语言动力学系统的,广义,应用,人机的智能交互,在物理系统中的模拟信号与数字计算机中的数字信号之间通讯时,我们要使用模拟/数字A/D和数字/模拟D/A转换器,它们已变成了无所不在的标准硬件,其性能由转换精度而定。,我国学者已经指出,为了有效地利用信息,我们必需在硬件和软件之后,建立“知件”体系,而语言动力学可能会进展成为有效开发、综合利用各特地领域“知件”的一种解析且可计算的通用工具。,可以设想,在将来的人机交互中,特定领域的文字/数字W/N和数字/文字(N/W)转换器,将同A/D与D/A转换器一样重要和广泛,不同的是它们是软件而不是硬件,其性能将由其语法和语言处理的智能水平所打算。,从硬件、软件到知件,语言动力学的可能应用,专家评论,有关LDS争论文章数目分布9份相关杂志会刊统计,IEEE Transactions on Systems,Man,and Cybernetics 主编 Larry O.Hall教授对本工程工作的评价是:“A piece of solid and quality work,and may lead to a whole new field.”(一项扎实且有品位的工作,可能会导致一个全新的争论领域。),Taylor Franklin Best Paper Award,国际大会特邀报告 1 次,2023年IEEE SMC Taylor Franklin最正确论文奖 1 项,(每年在IEEE SMC学会会议会刊的500余篇文章中选出),语言动力学的根本框架从词到点的转换,模糊集合的Kosko几何表示,语言和数值动力学系统的映射表示及相互关系,从数值动力学到语言动力学,由多维空间到超立方体单元的转换完成了由传,统数值动力学系统到语言动力学系统的转变。,在理论上,全部传统动力学系统的概念和方法,,都可以依据这一转换而直接推广到语言动力学,系统中。,语言动力学和词计算的根本公式,LDS状态方程:,LDS输出方程:,LDS反响掌握:,这里:,IN,IM,IP和IQ都是超立方体,Z是非负整数集合,,F,H,R是模糊规律算子。,相应词的模糊集合定义,状态词:,输出词:,掌握词:,输入词:,语言动力学系统的稳定性概念和解析定义,LDS的轨迹,词的极限值,正负不变词集,平衡词,P-K轨迹,LDS的稳定性,LDS的渐进稳定性,LDS的全局稳定性,主要问题,量的问题:,精度要求,Nn,带来的计算量问题,质的问题:,语义要求带来的词之不连续区分的问题,模糊超立方体中的两个相邻点必需是看作两个不同的点。这样的话,一个在两个相邻点之间摇摆的LDS就被认为是不稳定的。然而,这两个点可能是同一个点由测量误差造成的两个表现,或者是由隶属函数的主观性表现出两个点,或者是由于信息的颗粒性所造成的。因此,从应用角度来看,这两个只能作为一个点来考虑。也就是说,从这两个点所表示的两个字来看,在实际意义它们是一样的,因而系统应当看成是稳定的。,点与词的实际不对称映射,基于胞空间和胞映射的LDS计算方法及其应用,超立方体上的胞空间构造及对应词的隶属函数族,基于胞映射的语言动力学根本方程,LDS状态映射:,LDS输出映射:,LDS反响映射:,其中tk 是胞空间新的时间区间,Zk,Qk,Pk 和Wk 分别是状态、掌握、输出和输入词胞,CF,CH和CR是由F,H和R构造出的胞映射。,胞空间构造的根本问题,对于指定用于描述简单系统的K个词,如何构造一个胞构造使得这K个词可以合理地分布在超立方体中?,最正确或均匀格点词胞分布,定义合理性的一种方法是将这些词尽可能地均匀分布,但对于高维超立方体,简洁的均匀分割是无效的。此时,可利用数论中高维空间数值积分的最正确或均匀格点集来实现词的合理地分布。,Halton 格点集:,从词胞到词,再到数的清晰化算法,基于胞空间和胞映射的LDS的分析与设计,利用在胞空间的搜寻算法分析LDS的全局动态特性,利用离散动态规划设计LDS的最正确语言掌握算法,语言动力学系统的根本问题及其争论方法,常规数值动力学系统的词化及其相关的动力学特性分析,词计算和语言动力学系统的动态特性分析,多映射和马尔可夫过程在语言动力学中的应用,在数据挖掘中的应用,在简单系统的建模、分析掌握和综合中的应用,常规数值动力学系统的词化及其相关的动力学特性分析的目的,可以验证语言动力学系统的概念和分析方法是否正确合理,由于我们对数值动力学的特性已特别了解和清晰,可以探究一条将低层数值模型抽象总结为高层语言模型的途径,这在很多领域,特殊是在生态、社会系统中特别有价值,可以建立一种新型的动态数据挖掘和学问觉察的方法,假设成功,这将有助于争论海量信息的处理和表示,词计算和语言动力学系统的动态特性分析,常规数值动力学系统词化后,其原有的混沌和分叉现象在对应的语言动力学系统描述中是否连续存在?同词化的区分率、粒度和表达规章有什么关系等,一般语言动力学系统本身在其超立方体空间中是否存在不动点、混沌和分叉现象?如何进展判定和分析等,在已有工作的根底上,探讨如何有效地在语言动力学系统中引入胞空间和胞映射,并建立系统的指标体系和数值方法,验证胞空间和胞变换的靠近精度、稳定和敏感特性,计算语言动力学系统在引入胞空间和胞变换后,如何建立有效的搜寻和数值分析方法,系统地在胞空间中分析不动点、混沌和分叉等动态现象,四片混沌的虫口数值模型,虫口模型 ,m=3.58,初值x,0,=0.55,对应四片混沌的虫口语言模型,虫口模型 ,M=,“近似为3.58”,初值,x,0,“近似为0.5”,。,语言清晰化后的数值虫口混沌特性,多映射和马尔可夫过程在语言动力学中的应用,常规数值动力学系统词化后,不行避开的会消失计算词可能与几个规定的词相关,因此转化成一个规定词是一种近似,在语言动力学系统中引入胞空间和胞变换后,一个胞被映射之后可能与几个细胞有交合,因此转化成一个胞是一种近似,问题是这种近似有时不见得合理或有意义,所以我们必需争论映射多值性所带来的问题。,争论这一问题的一个特别自然的工具就是马尔可夫过程,最直截了当的方式就是将计算词与规定词的相关程度作为马尔可夫过程中状态转移概率,或者把被映胞在映射后与其它胞的交合局部大小作为转移概率,如此一来,我们就可以通过马尔可夫过程理论和方法争论“随机”语言动力学系统,在数据挖掘中的应用,这方面的主要思想是通过语言动力学系统动态分析的特性,将数据挖掘中的一些方法,特殊是聚类分析的方法词化,并进一步挖掘出基于词计算的状态模型、输出模型和反响模型,从而形成学问的动态表示和分析利用。,在简单系统的建模、分析、掌握和综合中的应用,针对一些具体的简单系统应用LDS。目前,我们已开展在经济系统、生态系统、人口系统、以及智能交通系统的诱导“软”掌握策略的制定中的初步应用。,总结与展望,语言动力学系统是在词计算概念正式提出之前就提出的概念。,与国际上其它很多词计算方法不同,基于词计算的语言动力学系统,强调实际的可计算性,突出动态计算,而不是静态推理。,这一特色是由于借用了常规数值动力学系统中的概念,方法和体系而造成的。,这方面工作的连续和深入,可形成有特色的关于简单系统建模、分析、掌握和综合的理论和方法体系,并应用于解决实际简单问题、智能人机交互系统和知件的设计与分析。,感谢各位专家!,:/,
展开阅读全文