资源描述
第第4节节 地理建模方法概述地理建模方法概述数据分析法机理分析法量纲分析法类比分析法仿真模拟方法(一)探索性数据分析n数据分析的目的,是从大量杂乱无章的数据中发现隐藏的规律。一、数据分析法一、数据分析法 探索性数据分析是对测量、调查、实验所得到的一些初步的杂乱无章的数据,在尽量少的先验假定下进行处理,通过作图、制表等形式和方程拟合、计算某些特征量等手段,探索数据的结构和规律的一种数据分析方法。n探索性数据分析的主要特点探索性数据分析的主要特点:(1)探索性数据分析主要是“让数据说话”(2)不执着于方法的理论根据研究目的研究目的地理现象地理现象杂杂乱乱无无章章的的地地理数据理数据筛选模型筛选模型收集收集资料资料不不做做假假设设或或少少做假设做假设耐抗性分析耐抗性分析残差分析残差分析重新表达重新表达图表启示图表启示让让数数据据说说话话检检验验修修正正模型模型揭示规律揭示规律 隐藏的规律隐藏的规律图3.4.1 探索性数据分析的地理建模方法探索性数据分析的地理建模方法(二)数据分析的地理建模实例1.城市体系的位序规模法则 1913年,奥尔巴哈(F.Auerbach)指出,在一定地域范围内,城市人口规模与位序之间呈现出一定规则。通常人口规模居第2位的城市其人口为居第1位城市人口的一半,第3位城市为第一位城市人口的1/3,以下类推。这种城市位序与人口规模之间的关系,称为等级规模,或位序规模法则(rank-size rule)。1949年,济普夫(G.K.Zipf)更加明确了这一规律,其的数学表达为(Zipf,1949):式中:n为城市数目;r为各城市按人口从大到小排列的顺序;Pr为第r个城市的人口数;k为常数,一般可取首位城市的人口数;q为大于0的待定指数。若q1,说明城市体系规模分布相对均匀,规模结构呈序列型;若q1,说明规模结构呈首位型。2.霍登定律 描述河流网络系统数量关系的三定津,即霍登(R.E.Horton)三定律,是数据分析法建立地理模型的又一成功实例。这三个定律,是霍登在20世纪40 年代(Horton,1945),通过大量的数据统计研究得到的,其数学表述如下:河流数定律河流数定律:式中,Nu是在m级水系中u级河流数,Rb为分叉系数,即:.。河流长度定律河流长度定律:式中,Lu 是u级河流的平均长度,L1是一级河流的平均长度,为河流长度系数,即:。流域面积定律:流域面积定律:式中,是u级水系的流域平均面积,是一级水系的流域平均面积,为流域面积系数。n所谓机理,是指事物变化的理由与道理。机理分析,就是分析现实系统(或过程)的因果关系,作用原理。n机理分析法建立地理模型的过程,就是构建在结构上或功能上与真实地理系统同构的原型系统的过程。二、机理分析法二、机理分析法(一)结构分析法 结构的系统概念,指将系统理解为由诸要素相互联系、相互依赖、相互作用、相互耦合而成的整体。系统的整体属性大于组成系统各要素属性的总和。其数学的逻辑表述为:设:系统是由N个事物(要素)组成,用Ai表示第i 个事物孤立状态时所具有的属性的全体所构成的集合(=1,2,.,N),用A表示系统的属性的全体所组成的集合,则有如下关系存在(郭俊义,1987):,且 对于地理系统,设a为系统统一的某功能属性度量单位的数量,度量系统中第i(i1,2,N)个组成事物的这一功能属性的数量为ai,则客观情况表示a和 的关系有如下三种可能情形:(I)该式中表示的情形表明系统内部结构比较台理,各要素之间的关系比较协调,功能比较完善。(II)该式表示系统维持其存在,不至于解体的基本要求。(III)该式表示系统的结构不合理,诸要素之间的关系互不协调,功能缺损;这种情形发展的必然结果是系统走向崩解和灭亡。基于以上事实,结构分析方法在研究地理系统时,注重系统的结构。这一分析法认为,地理系统分析就是要在其结构现状分析与评价的基础上,寻求一个最优结构,从而以保证系统功能的最优。因此,立足于结构分析法建立的地理模型往往是结构优化模型。一般而言,优化模型即可以是单目标的,也可以是多目标的。譬如,对于某区域(生态经济)系统而言,其系统的优化目标选择可以是在维持生态平衡的条件下,使经济收益最大,当然也可以选择生态效益和经济收益作为系统优化的双重目标。(二)功能分析法 功能分析法的基本理论依据来自于功能的系统概念。所谓功能的系统概念,系指暂时不管事物的本质、只着重研究行为的操作问题。功能分析法,只注重地理系统的输入、输出行为,而并不注重、也不去研究实现这种输入输出变换的系统结构与过程,只把注意力集中到输入与输出之间的关系上。地理系统X2 .XnY1Y2Yn .X1图3.4.2 地理系功能分析(三)过程分析法 过程分析法强调研究对象的历时性。这就要求我们在进行地理建模分析时,不仅要注重系统与要素、要素与要素、系统与环境之间的相互联系,而且还要注重地理系统的演化过程。微分方程建模方法,又是过程分析建模法常用的建模方法之一。城市化问题是城市地理学关注的主要问题之一。几十年来,许多学者曾从不同的角度和侧面,致力于城市化模型研究。其中,Keyfitz模型,是一种基于过程分析的人口城市化模型。如果记U为城市人口,R为农村人口,则:城市人口与农村人口的比率为X=U/R,城市化水平为ZU/(U+R).(3.4.9)(3.4.10)式中,为农村人口的自然增长率,为城市人口的自然增长率,m是农村人口向城市的迁移率。根据(3.4.9)式和(3.4.10)式,做简单的推导运算,可以得到描述城市人口与农村人口的比率(X)的微分方程:(3.4.11)对方程(3.4.11)式积分,得到方程(3.4.12):(3.4.12)经过简单地推导可以知,对应于(3.4.11)式,城市化水平(Z)随时间的动态过程可以用如下微分方程表示:(3.4.13)为了求得Z的稳定状态或均衡水平,可以把(3.4.13)式进一步写成:(3.4.14)容易求得,Z的稳定值为 或 。可以通过线性稳定分析确定系统的稳定状态,即任何对于稳定值的偏离将随着时间递减,从而使系统回到稳定状态。时,城市化水平的稳定值为 。这就是说,按照Keyfitz模型预测,城市化水平的极限值将达到1。Keyfitz模型没有考虑城市人口向农村迁移的情况,Rogers(1984)对Keyfitz模型做了进一步修正。Rogers模型的数学表达如下:在(3.4.15)和(3.4.16)式中,表示城市人口向农村的迁移率,其它变量的含义与Keyfitz模型中相同。显然,当 时,Rogers模型就变成了Keyfitz模型。(3.4.15)(3.4.16)根据(3.4.15)式和(3.4.16)式,进行推导运算,可以得到描述城市人口与农村人口的比率(X)的微分方程:推导运算可知,城市化水平(Z)随时间变化的动态过程,可以用如下微分方程表示:(3.4.17)(3.4.18)在Rogers模型中,除了常数迁移率外,引入以相互作用为基础的引力常数,就得到联合国模型:在(3.4.19)和(3.4.20)式中,为引力作用常数,其它变量的含义与Rogers模型中相同。(3.4.19)(3.4.20)与(3.4.17)式对应,描述城市人口与农村人口的比率(X)变化的微分方程为:与(3.4.18)式对应,描述城市化水平(Z)变化的微分方程为:(3.4.21)(3.4.22)在实际中,各参数的变化取决于自然资源、环境条件和社会经济诸多方面(Ledent,1982)。因此在实际中,这些参数应该都是时变参数,它们都应该与时间变量t有关,所以对应于(3.4.19)、(3.4.20)、(3.4.21)和(3.4.22)式,它们分别应该被表达为:这样,就增加了模型的灵活性和使用范围。当各个时变参数为已知函数式,上述方程就描述了农村人口、城市人口、城市人口与农村人口的比例、以及城市化水平的变化轨迹。(四)实例:地理过程中人类活动的作用 从功能的系统理论来看,任何自然地理过程(无人类活动参与的自然过程)都可以看作是将一组自然输入要素转化为某种输出的过程(如果某自然过程有许多输出,则可以将它分解为若干个只有一种输出的自然过程)。如果用x1,x2,xn代表一组自然输入要素,y代表与该组输入要素相对应的输出,则这一自然地理过程可以描述为:(3.4.27)(3.4.27)式中,x1,x2,xn都是时间t的函数。由上述分析我们知道,对于有人类活动参与的地理过程来说,人类活动的作用实际上相当于一个调节器,它使自然过程的“激励响应”效果得以放大,从而使一定自然要素输入下的输出发生改变。这种输入输出关系可以由下图(图3.4.3)来描述。图3.4.3 地理过程的输入输出变换自然过程x1.人类活动M4x2xn这种关系可以被定量的描述为:(3.4.28)(3.4.28)式中,M 表示该地理过程中人类活动的强度。对(3.4.28)式求导得:上式两端同除y,并定义xi对y的输出弹性系数为:则可以得到:(3.4.29)为了计算方便,(3.4.29)式可用下述差分方程代替:如果在分析问题时,上式各项中的时间步长t 相同,则有:(3.4.30)(3.4.30)式左端为输出y的相对增长率,右端第一项为人类活动强度的相对增长率,第二项为诸输入要素相对增长率与其相应的弹性系数的乘积之和。在实际问题的分析中,诸自然输入要素的度量值xi(i=1,2,.,n)和输出y都可以通过其观察值求出它们在时段t 内的相对增长率。因此,只要能设法确定出诸弹性系数i(i=1,2,.,n)的值,就可以由(3.4.30)式,用余值法求得在时段t内,人类活动强度的相对增长率M/M。这样,人类活动对输出y变化的贡献率就是:(3.4.31)由以上分析推导过程可以看出,弹性系数i实际上是输出y的相对变化率与输入要素xi的相对变化率的比值,即:事实上,若将i与地理过程的类型(如侵蚀过程、堆积过程等)及其发生的环境背景(如地貌形态、植被覆盖状况等)联系起来考虑,那么弹性系数i则是与地理过程的类型及其发生的环境背景有关的综合性参数,它反映的是与环境背景有关的地理过程的输出y 对输入要素xi变化的敏感程度。一般地,在较小的时间尺度和空间范围内,地理过程发生的环境背景可以认为是不变的。因此对某一特定的地理过程而言,从系统分析的敏感性分析角度来看,诸弹性系数i(i1,2,.,n)的微小变化不会引起输出y的巨变。根据(3.4.9)式和(3.4.10)式,做简单的推导运算,可以得到描述城市人口与农村人口的比率(X)的微分方程:(3.4.11)当 时,最终可以达到一个稳定状态:。但是当 时,将随着时间不断增加。(一)量纲与基本量纲n量纲分析(Dimension Analysis),是20世纪初提出的在物理领域中建立数学模型的一种方法,它是在经验和实验的基础上,根据量纲齐次性原则,确定各物理量之间关系的分析方法。三、量纲分析法三、量纲分析法 为了用数学来描述物理对象,需要对其定量化。物理对象的定量化需要有单位和数值,单位是作为度量标准的某个物理量。每个物理量都可以由其他物理量导出。如果规定一组基本物理量,那么其他的物理量均可以表述成这组基本物理量的幂次组合。这种基本物理量的幂次组合,就称作该物理量的量纲。通常用量来表示物理量的量纲,不同的物理量往往有不同的量纲。例如,小时、分、秒是时间的不同测量单位,但这些单位属于同一种类,均为时间单位,用T表示,T 就是上述时间单位的量纲。同理,米、厘米、毫米等同属长度单位,用L表示长度量纲。吨、千克、克同属质量单位,用M表示质量量纲。无单位的物理量的量纲记为1。(二)量纲齐次性原则与相似定律1.量纲齐次性原则 用数学公式来描述任何一个客观规律时,等式两边的量纲必须一致,这个要求称为量纲一致原则。量纲一致原则告诉我们,一个物理方程式的等式两边应该具有相同的量纲。否则,就是错误的物理方程式。也就是说,如果用一个数学方程描述一个物理过程,则方程中各项的量纲必定相同,用量纲表示的物理方程必定是齐次性的。量纲齐次性原则,用数学语言可以表述为(胡云,2006):假设某系统(过程)有n个物理量Q1,Q2,.,Qn;其中基本量的数目为m,它们对应的量纲分别为X1,X2,.,Xm。那么,任一个物理量Q的量纲式可表示为这一组基本量的量纲的幂次积,即(3.4.32)式中,幂次指数1,2,m称为量纲指数。(3.4.32)式两端取对数,得到:(3.4.33)量纲分析法中更为普遍的方法是著名的定理,又称泊金汉定理,它是泊金汉(E.Buckingham)于1951年提出的,应用广泛。定理可以表述如下:某系统(过程)如果包含有n个有量纲的物理量Q1,Q2,.,Qn,它们之间的关系为 其中可选出m(mn)个在量纲上互相独立的物理量,其余(n-m)个物理量在量纲上是非独立的。那么,这个系统(过程)等价地可由这n个物理量组成的(n-m)个相互独立的无量纲(量纲为1)的量,.,所表示的表达式来描述,即(3.4.34)(3.4.35)式(3.4.35)与式(3.4.34)相比,所包含的变量数目减少了m个,并且无论选取怎样的量纲系统,它们之间的函数关系都是相同的。因此,关系式(3.4.35)比有量纲的关系式(3.4.34)应用更为广泛,如果据此进行试验或模拟,可以使工作量大大减少。2.相似性定律 两个同类的物理系统(过程)的量纲为1的量的 值如果相同,则它们的系统状态亦相似。因此,量纲为1的量的 值相同的模型实验的结果,可以用来推测原型。由于物理量成立的关系式是对基本方程进行数学运算得到的,所以关系式中出现的数值系数的数量级多为1。相反地,在几个量之间进行量纲分析时,如果根据实验结果所决定的系数值过大或过小,则可断定在这几个量之间可能存在相关性。3.地理相似准则 马蔼乃(1997,2001)研究认为,由于数理方程及其求解的条件极其苛刻,只适合极少数的简单地理现象研究。而对于众多的复杂地理现象与地理过程,应该用量纲分析的方法找出地理相似准则,再进行数据统计分析得到地理模型。(一)科学发现中的类比分析法四、类比分析法四、类比分析法 类比分析法,是依据两个对象的已知的相似性,把其中一个对象的已知的特殊性质迁移到另一对象上去,从而获得另一个对象的性质的一种方法。严格来说,类比法是一种寻求解题思路、猜测问题答案或结论的发现的方法,而不是一种论证的方法,作用是启迪思维,帮助我们寻求解题的思路。它是一种从特殊到特殊的推理方法,是一种或然性推埋,其结论是否正确,还需要经过严格的证明。(二)类比法的地理建模实例 1.熵的概念及其产生与发展 熵,最初是在人们研究热机效率时引入的一个物理概念。第,次使用熵这个名词的是物理学家克劳修斯(Clausius R.)。1865 年,为了区别“守恒”和“可逆性”两个概念,他引入了一个不同于能量的新概念,即熵。熵仅与系统现时存在的状态有关,而与系统过去经历的热力过程无关。大约在1870 年前后,玻尔兹曼(Boltzmann L.)从分子运动论的角度对热力学熵作出了新的微观解释,使熵的含义得到了第一次扩展。他认为熵是分子运动混乱程度大小的一种测度。系统吸收了热量,系统物质的内能增加,分子运动速度就增大,这样分子运动就更加混乱,因而系统的熵值就增大了。如果承认分子的每种微观状态出现的机会都相等的话,那么人们就会发现,系统的每一个宏观状态都与极其众多的微观状态相对应,那么,这时,熵就与该宏观状态下对应的微观状态的个数的对数之间存在线性关系,即:(3.4.44)(3.4.44)式中,K 就是玻尔兹曼常数。从概率论角度来看,每一种微观状态出现的机会都相等,即意谓着每一种微观状态出现的概率为:这样,(3.4.44)式可以进一步写为:从上式我们可以看出,熵原来是从微观状态的分布对系统宏观状态的一种描述。由此我们可以看到,玻尔曼兹的解释已使熵这一概念从对热力过程(卡诺循环过程)中能量耗损的描述,扩展到从微观状态描述系统宏观表现的一个新领域。(3.4.45)现代信息论创始人申农(Shannon,1948)不仅把他的目光投向了信息的概率分布,而且天才般地指出,如果一个信息中某种信号出现的概率为Pi,那么它所带的信息量就是,因此,这一信息所含的全部信息量就是 ,于是他定义信息熵为:(3.4.46)式中,C是一个单位常数。当H的单位取纳特(nat)时,C1;当H的单位取比特(bit)时,。那么,当H的单位取比特(bit)时,(3.4.46)式也可以写成:(3.4.46)(3.4.47)对于连续性分布,仿(3.4.46)式,其信息熵也可以被定义为:(3.4.48)式中,p(x)是随机变量x的分布密度函数。申农把熵的概念用于信息论研究中,使熵的概念又一次得到扩展。在这个扩展过程中,我们可以看到,熵不仅不必与热力学过程相联系,而且也不必与微观的分子运动相联系,而是与事物的分布紧密相关的。熵最本质的东西就是对系统状态的科学计量描述。(3.4.48)2.地理系统的熵模型 地理学家都希望将墒这一概念引入自己的研究领域,以推动当代地理学的发展。斯特拉勒曲线是20世纪50 年代美国理论地貌学家斯特拉勒提出的流域地貌的面积高程分析(The area-altitude analysis)方法。图3.4.4 斯特拉勒曲线1.0y 0old ageyouthmaturityx1.0 艾南山曾根据斯特拉勒(Strahler,1952)曲线对地貌系统的状态描述,建立了地貌系统的信息熵。艾氏地貌系统的信息熵为:(3.4.58)式中,(3.4.58)蒋忠信(1987)研究发现,滇西北的金沙江、澜沧江、怒江及其支流河谷纵剖面的演化,可用伊凡诺夫(.B.BaOB)的河流纵剖面方程来描述:(3.4.59)式中,h 为纵剖面上某点与河口的高差,l为该点与河口之间的水平距离,H和L分别为河源与河口之间的高差和水平距离,形态指数N 恒为正。当0N1时,剖面下凹。(3.4.59)由于受艾氏地貌系统信息熵的启示,蒋先生也将河谷纵剖面发育的伊凡诺夫曲线描述转化为信息熵描述。其作法是:设x=(L-l)/L,y=h/H,则(3.4.59)式就变成:显然,。这样,仿艾氏地貌系统的信息熵,蒋忠信(1989)定义了河谷纵剖面演化的信息熵为:(3.4.61)式中,(3.4.60)(3.4.61)无论是用斯特拉勒曲线,还是用伊凡诺夫曲线定义的信息熵,都表示了地貌系统演化的阶段。各个演化阶段与信息熵及有关指标的对应比较关系如下(见表3.4.1)。表3.4.1 信息熵与河谷纵剖面和流域地貌演化阶段 五、仿真模拟方法五、仿真模拟方法 模拟是用计算机对一定环境下各要素相互作用的真实系统或过程,进行尽可能最大程度的再现或重复。它不同于一般求解确定性的、静态的线性问题的数学解析法,能比较真实地描述和近似地求解复杂系统的问题。在地理学研究中,仿真模拟的作用是:可以对高度复杂的内部交互作用的系统进行研究和实验;可以设想各种不同方案,观察这些方案对系统的结构和行为的影响;可以反映变量间的相互关系,说明哪些变量更重要,如何影响其它变量和整个系统;可以研究不同时期相互间的动态联系,反映系统行为随时间变化而变化的情况;可以检验模型的假设,以便进一步改进模型的结构。仿真模拟也有局限性方案的选择,可能遗漏掉最优方案;应用的范围只限于能够考察的情况,一旦出现不能模拟的特殊情况时,就会发生困难;当模拟的系统规模很大时,资料难以取得,难以模拟细节。地理系统仿真模拟的步骤,包括确定问题、收集资料、建立模型、编制模型运行的计算程序、检验和证实模型、模拟试验设计、模拟运行、模拟结果分析等一系列紧密相关的环节(图3.4.5)。分析系统结构与运行机理反馈修正模型通过检验输出多方案的仿真结果研究目的确定系统边界建立系统模型系统仿真模型编写计算程序模型有效性检验运行仿真模型未通过检验图3.4.5 地理系统仿真模拟的步骤
展开阅读全文