资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,洛特卡定律,小组成员:,王 琦,刘 娟,谭 琴,目录,洛特卡其人,洛特卡定律概述,洛特卡定律的研究(侧重国外部分),洛特卡定律的应用,洛特卡定律的特点与注意事项,1,、洛特卡其人,籍贯:,1880,年,3,月生于奥地利的伦伯格,父母都是美国人。,履历:,早期教育是在法国和德国接受的。毕业后,先后在美国化学总公司、国家专利局、国家标准局等机构工作。,1938-1939,年任美国人口协会主席、,1942,年任美国统计协会主席。,成就:,洛 特卡,(A l f r e J,h a k a),是美国著名学 者和科学计量学家。他擅长于统计研究,在科学上的兴趣首先集 中在生物体总数的动态状况研究,并发展 了一 种用出生率、死亡率和年龄分布函数表示的“人 口分析理论”。,1 9 2 6,年,他天 才地提出了用一对联立微分方程表示的“竞争增长律”。后来 他又将统计研究 的方向转移 到科学 家与其发 表的科学文献之间 的数量关系上,进行 了开剖性 的研 究工作,并发表了“科学生产率的频率分布”等著名论文,从而较早地创立了世界 闻名 的 洛特卡定律”,为文献计量学的诞生和发展作出了创造性 的贡献。,1926,年,在美国一家人寿保险公司供职的统计学家洛特卡经过大量统计和研究,在美国著名的学术刊物,华盛顿科学院报,上发表了一篇题名为,科学生产率的频率分布,的论文,旨在通过对发表论著的统计来探明科技工作者的生产能力及对科技进步和社会发展所作的贡献。这篇论文发表后并未引起多大反响,直到,1949,年这一成果才引起学术界关注,并誉之为“洛特卡定律”。文中他统计了,化学文摘,190716,年索引中的以,A,和,B,开头的,6,891,名作者及其论著数,并统计了奥尔巴赫(,Auer,bach,)的,物理学史一览表,(,1919,)中的,1,325,位科学家及其论著数。,在上述统计分析的基础上,他发现:“写了,2,篇论文的科学家人数大约是写了,1,篇论文科学家人数的,1/4;,写了,3,篇论文的科学家人数大约是写了,1,篇论文科学家人数的,1/9;,写了,n,篇论文的科学家人数大约是写了,1,篇论文科学家人数的,1/,n,2,”,。这就是著名的洛特卡定律。,趣味小故事,布拉德福定律、齐普夫定律、洛特卡定律被认为是文献计量学中最基本的三个定律,.,他们之间的关系就像欧洲的一个传统的三角恋爱的故事,这个故事如下:,故事取自,:车尔尼雪夫斯基 的小说,怎么办,故事背景,:小说描写的是十九世纪五十,-,六十年代的俄国。在这个时,期,一切社会问题都归结为与农奴制及其残余作斗争。,故事如下,:,房产管理人的女儿韦拉在医学院学生洛普霍夫的帮助下拒绝了父母包办婚姻的企图,脱离家庭,与原医学院学生洛普霍夫结合并创办了一所实行社会主义原则的缝纫工场。两年后,韦拉与洛普霍夫的好友基尔萨诺夫相爱,洛普霍夫感到韦拉与基尔萨诺夫性情相投,他们在一起生活会更幸福,于是毅然出走,假装自杀,使他们能够结合。以后,洛普霍夫受职业革命家拉赫梅托夫的委托,出国进行革命活动,数年后由美国回到彼得堡,与波洛佐娃结婚,并同基尔萨诺夫和韦拉重新会面,两对夫妇幸福地生活在一起,共同进行着他们所热爱的事业。,2,、,洛特卡定律,概述,诞生:,1926,年,洛特卡最先研究了科学文献数 量与著作数量之间的关系,并创造性地提出,“科学生产率”的概念,即指在一定时间内科学工作者在科学上所表现出的能力和工作效果,通常,用其生产的科学文献数量来衡量。,在提出科学生产率概念的同时,洛特卡就围绕它进行了统计研究。选用,化学文摘,与,物理学史一览表,来研究科学家的著述数量,以此经过数据统计、归纳分析及运用数学工具的推算得出洛特卡定律,,即写有,x,篇论文的作者频率与,x,的平方呈反比。,频数,频率,这就是科学生产率的“平方反比定律”的表达式。,2,、洛特卡定律概述,公式 表述:,理论意义:,1 9 2 6,年洛特卡,(D a r k a),定律创立 至今已整整,8 0,年,是文献计量学 中创立最早 的一个定律,洛 特 卡定 律也 是 文献 信 息 计 量学 的 经 典 定 律 之 一。为文献计量学的诞生奠定了一定的基础,其创立是值得纪念的。,2,、洛特卡定律概述,布拉德福定律、齐普夫定律、洛特卡定律被认为是文,献计量学中最基本的三个定律。,研究对象:,1,期 刊上刊载的论文,2,文章中每个词的出现频次,3,科学工作者 的著述,分析单元:,1,期刊数,2,单词量,3,著者群,计量方法:,都是通过对文献的调查和统计,取得数据并进行,分析归纳来定量地认识文献情报流。,总结:,这三个定律最初都是 按照某一具体事项在其主体来源中的出现频,率排序而导出 来的,然后通过数学工具来进一步求出其分布函数。,通过 微分处理和分区处理发现,这三种分布函数具有相似性,,可以认为它们是一种分布规律的不同表现形式。,三,大,定,律,的,对,比,2,、洛特卡定律概述,洛特卡定律的命运,由于多种原因,洛特卡定律沉睡了,30,多年,后来由于普赖斯等人的发掘,自,60,年代起引起人们的重视。,今天,洛特卡定律仍然经常被科学学家、情报学家等引证和研究。,引自,科学的计量研究,北京大学科学与社会研究中心 周 程,2,、洛特卡定律概述,3,、关于,洛特卡定律的,研究(侧重国外),1926,年,,Lotka,发表关于科学生产率的著名文章后,刚开始并未引起学术界重视。,一直到,1949,年,洛特卡的研究结论才被称为,“洛特卡定律”。,在,人类行为和最省力法则,一书中,,齐普夫,较早将其称作“平方反比定律”,60,年代初期,由于,普赖斯的两部重要著作的出版,,使洛特卡的研究工作和成果随之得以广泛传播,有力地推动了这一定律的研究和发 展。,1969,年,,费尔桑,(,Foirthorne,)首次将布拉德福、齐普夫以及芒代尔布罗分布同洛特卡的频率分布联系起来,,指出洛特卡的关系式对低产作者来说是适合的。,By,刘娟,70,年代,研究较深入的:,科尔(,RCCoile,)和弗拉奇(,JValchy,)。,前者找到了一种判断某组实验数据是否符合洛特卡分布的鉴定方法;,后者则探讨了洛特卡定律的影响因素及作用。,对美国国会图书馆和伊利诺斯大学图书 馆的图书进行统计研究。,因 国会图书馆的统计数据只取自十年的机读著者目录,结果不严格符合洛氏分布,,而伊利诺斯大学的,数据覆盖了有史以来出现的所有作者及论著,,因而严格符合洛特卡分布定律。,3.1,、对,洛氏分布一般公式的研究,f,(,x,)=,c/x,n,f(x,):,写了,x,篇论文的作者占所有作者数的百分比,C,为某主体领域的特征常数,,Lotka,:,a=2,确定,a,和,C,?,实际上,它仅局限于,a=2,的情形;确立的只是科学生产率的平方反比律。一些学者探讨了洛氏定律的普遍性意义。,a,并不一定都等于,2,,,C,会在,0,6079,附近上下波动。,指数,a,,通常采用最小二乘法估算。公式;,N,为被考察的数据对的数量,指数,C,:洛特卡和弗拉奇的推导,洛:,f,(,x,)=c/x,2,弗:,a,为任意值,a=2,时,即,C=f(1)=60.79%,a=4,,,C=,4,/90=1.08241,a,为其他非负分数值时,用下列公式先求出级数之和,再计算,C,C=,2,/6=60.79%,弗拉奇的研究结论,不同的,a,值将产生一个显著不同的常数,c,而且,a,的较小变化,(,特别是在,a,2,时,),就会引起,C,值的明显的变化。,下面列举了,a,的部分样本值和对应的,C,值;其中常数,C,可以通过前面的公式计算。,指数和常数的对应值,2.86%,2.58%,2.43%,4.26%,3.2,、洛氏定律的适用性研究,洛特卡定律是对两个,学科抽样统计的推广,,在其他情况下是否适用?,研究学者:,休伯特(,Hubert,)、德莱斯顿(,Dresden,)、戴维斯(,Davis,),等都进行过研究,涉及到不同学科、时期、国家或单位、类型的科学文献的作者分布规律。从各个不同角度来检验或修正洛氏定律。,有的还深入到文献的某些子集,如某一年度,/,某一类型的文献,如会议文献、图书等;或某一单位收藏的文献等,进行作者分布的探讨;,有的则对洛氏定律提出了修正的可能性,如普赖斯(,Price,)、布克斯坦(,Bookstein,)、阿利森(,Allision,)等人的论著研究了这一课题,特别是,Price,的研究取得了重要成果。,目前,一般认为,在一定统计条件下,洛氏定律在大多数学科领域是适用的,能够描述科学文献作者分布规律和科学家著述的行为模式。,国外学者在经济学、生物学、情报学、图书馆学、法医学、人类学、计算机学等不同学科领域分别对其进行了适用性验证,并以此为基础,提出了修正洛特卡定律的可能性。,其中最具影响力的是,1986,年,帕欧,利用包括,20,个学科和,3,个大型图书馆目录在内的,48,组有关文献作者分布的数据验证洛特卡定律,并重新界定了洛特卡分布中,参数的取值范围,,推动了洛特卡定律的发展,3.3,、洛氏分布机理的研究,大量修正性实验总结:,影响洛特卡平方反比律,f,(,x,)=c/x,2,的因素:,学科特征。,统计研究的学科的性质、范围、特点、发展阶段以及与其他学科的相关度等都会对其分布产生本质上的影响。,原因:,一方面,科学的,分化,趋势显著,一个学科内部可能会不断产生新的发展点;另一方面,科学研究的,综合化,趋势也在加剧,边缘科学不断得到发展。各学辩的研究方法也产生了一些新的特点。,而,洛特卡定律掩藏了不同学科、同一学科在不同发展阶段上文献与作者分布间的差异性,缺乏对学科发展及文献增长的动态性描述,;此外,洛特卡定律对,合作现象,的研究较少,对合著者的科学贡献研究不足。因此,随着现代研究环境的不断变化,洛特卡定律的普适性受到了一定的限制。,以主题数据拟合洛特卡分布需要注意进行数据的甄别和选取,,样本容量的控制,。,影响表现:,研究表明,,基础理论学科与应用技术,学科之间、比较,成熟的学科与新兴学科,之间、范围,宽广的学科与较窄,的学科之间,其文献的作者分布呈现出一定的,差别,。,就物理学而言,,a=2,是合理的;对于技术科学、社会科学和人文科学来说,,a,值将增大;而规模较大和科研合作程度较高的学科,,a,会变小。,在很长一段时期内,对洛特卡定律的验证基本上是在理论科学领域进行的,大多数情况下符合洛 氏分布。,例:,1979,年,加拿大学者将洛氏定律引入到应用科学和工程技术领域,发现存在着一定偏差。但他们认为这可能是,理论科学和技术科学,之间的差异而引起的。,统计条件,统计时,影响平方反比定律的主要有两个量,统计研究的时间跨度和作者数量,。一般来说,若统计的时间较长(如,10,年以上)、作者集合较大(如,1000,人以上),其研究将会得到比较客观的结论。,罗兰德,w,D,Roland),认为,,数据样本的时间选择对洛持卡定律的拟合非常重要。,特别是当一个学科的学术研究进入到成熟期之后,由于产文量较小的低产作者人数的增加,时间因素的影响更加明显。事实上,每一个学科都存在着各自不同的发展阶段,洛特卡定律对,不同阶段,的科学生产率的描述能力不同。,萌芽期,,其作者数量很少,研究成果微乎其微;,而一旦发现了,学科“先锋”,,将很快取得突破性的学术进展,洛特卡不能很好地描述这两个时期的作者分布。,论文作者数量剧增,出现核心律者的高峰期,,洛特卡定律则体现出对作者分布良好的描述力。,基于以上分析,,要对某学科领域进行洛特卡分布的拟合以对其研究状况和科学生产率有全面准确的了解,必须注意其数据的来源,包括时间范围的界定、学科内分支研究领域的选取、来源期刊的学术水平等因素。,C,值越大,说明作者的分布越平均,高产作者的贡献越小。,国外提供的一些数据,其症结一般都在一篇论文作者分布比率偏高上。如洛特卡数据应为,60.79%,,而利夫斯(,DHLe
展开阅读全文