资源描述
,Your site here,同济大学数学系,*,同济大学数学系,Your site here,LOGO,Your site here,LOGO,Your site here,LOGO,Your site here,LOGO,Your site here,LOGO,Your site here,LOGO,Your site here,LOGO,Your site here,LOGO,Your site here,LOGO,Your site here,LOGO,同济大学数学系,陈博文 姚震洲 王腾蛟,2010,.7,基因序列分析的,数学模型和聚类算法研究,同济大学数学系,国家大学生创新性实验项目,基因序列分析的数学模型和聚类算法研究,1.,背景及概述,2.,团队 介绍,3.,项目 方案,4.,创新与特色,5.,预期 成果,6.,进程 安排,同济大学数学系,项目背景及概况,指导教师,许威,数学工具,生物信息学知识,两年期,同济大学数学系,项目背景及概述,生物学数据库的发展,近年来,随着分子生物学和现代医学的迅速发展,特别是人类基因组计划的实施和完成,人类已获得大量的生物分子数据,成百上千的生物学数据库迅速出现和成长,并且其积累速度仍在不断的提高,如何利用好获得的数据并且取出隐藏在其中的对人类有用的信息则是一个迫切需要解决的问题。,DDBJ,欧洲,EMBL,日本,GeneBank,美国,同济大学数学系,项目背景及概述,模拟计算的方法大规模研究基因表达调控成为可能,与此同时,大规模测定基因水平的基因芯片技术的出现和高性能计算机的使用使得用模拟计算的方法大规模研究基因表达调控成为可能。一些研究者已经开始研究某一类疾病病人组和对比组的基因序列对比分析,并通过控制疾病的基因序列组的表达方式来治疗疾病。由此可见,用数学模型的方法进行基因序列比对是目前生物信息学研究的热点之一。,LOGO,项目背景及概述,我们要做的,我们要做的就是建立一个基因序列分析的数学模型并设计高效算法,应用到基因序列分析以及疾病预测中。,LOGO,国家大学生创新性实验项目,基因序列分析的数学模型和聚类算法研究,1.,背景及概述,2.,团队 介绍,3.,项目 方案,4.,创新与特色,5.,预期 成果,6.,进程 安排,同济大学数学系,数学功底格外扎实,对数学建模有浓厚兴趣,踏实严谨,姚震洲,计算机软件有一定研究,,善于利用软件解决问题,擅长文书撰写,应变能力和创新精神,王腾蛟,团队介绍,对生物信息学知识,有浓厚兴趣,数学基础扎实,博览群书,理论分析能力强,陈博文,数学系,09,级,西南二楼,541,寝室,同济大学数学系,国家大学生创新性实验项目,基因序列分析的数学模型和聚类算法研究,1.,背景及概述,2.,团队 介绍,3.,项目 方案,4.,创新与特色,5.,预期 成果,6.,进程 安排,项目方案,同济大学数学系,基因序列分析的,数学模型和聚类算法研究,什么是序列分析?,项目方案,同济大学数学系,蛋白质,基因,研究蛋白质性质的方法,生物学实验,基因序列分析,转录翻译,对应于,序列分析的方法,建立数学模型,项目方案,同济大学数学系,碱基对序列,数学语言,蛋白质的性质,已有算法的缺陷,研究极小片的基因,不适应强大的基因库的分析,在复杂的基因团分析时不够准确,项目方案,同济大学数学系,聚类算法,四步骤:,确定聚类分析的观察数据(类比点的坐标,把蛋白质如点般固定),度量指标(类比距离,蛋白质间的联系),度量指标的选取(类比内积,结合具体聚类分析),选取聚类中心和临界范围,找出聚类,项目方案,聚类算法效果图,项目方案,同济大学数学系,马尔可夫聚类算法,马尔可夫矩阵,项目方案,同济大学数学系,目,同济大学数学系,同济大学数学系,国家大学生创新性实验项目,基因序列分析的数学模型和聚类算法研究,1.,背景及概述,2.,团队 介绍,3.,项目 方案,4.,创新与特色,5.,预期 成果,6.,进程 安排,创新与特色,同济大学数学系,Markov,聚类算法,运用数学模型(图论),理论研究与实际相结合,将蛋白质性质预测用可计算的数学语言刻画,同济大学数学系,国家大学生创新性实验项目,基因序列分析的数学模型和聚类算法研究,1.,背景及概述,2.,团队 介绍,3.,项目 方案,4.,创新与特色,5.,预期 成果,6.,进程 安排,预期成果,同济大学数学系,模型,建立基因序列分析的数学模型,算法,作出相关算法程序并起到一定的运用效果,模拟,选取常见的疾病相关基因序列进行模拟实验,得出一些初步结论,为医学治疗提供一定的参考,论文,撰写相关论文,争取在权威期刊上发表,同济大学数学系,国家大学生创新性实验项目,基因序列分析的数学模型和聚类算法研究,1.,背景及概述,2.,团队 介绍,3.,项目 方案,4.,创新与特色,5.,预期 成果,6.,进程 安排,进程安排,同济大学数学系,第一阶段(,2010.92011.3,)研究计划如下:,2010.9,王腾蛟同学关于生物信息学领域基本概念以及常用研究手段的介绍,2010.11,姚震洲同学关于马尔科夫链随机游走过程的数学模型及其在序列分析领域应用的主题报告,2011.1,陈博文同学关于基因序列数据库以及现有蛋白质类聚的分类标准的介绍,进程安排,同济大学数学系,第二阶段(,2011.42011.12,)研究计划如下:,2011.4,建立马尔可夫随机游走过程的数学模型,模拟并设计算法,面向更真实的蛋白质序列,分析和预测蛋白质序列的性质。王腾蛟、姚震洲同学关于该工作的主题报告,2011.6,分析算法模型中不同长度和结构的蛋白质序列对预测效果的影响,陈博文同学关于该问题的主题报告,2011.7,将我们的算法与已有的成熟算法进行对比,并作想过模拟测试,发现不足进行弥补,及时完善算法和模型。陈博文同学关于该工作的相关主题报告,进程安排,同济大学数学系,第三阶段(,2012.12012.6,)研究计划如下:,2012.3,整理已得到的数据,运用相关分析软件和数据库进行深入分析。王腾蛟同学做相关主题报告,开一个研究总结讨论会听取更多意见,进一步完善算法模型。王腾蛟负责会议进程并作总结报告,2012.5,结合肥胖糖尿病等现有疾病,找出并分析致病的蛋白质所具有的性质,并对此类疾病的治疗提供相关建议。陈博文同学关于该工作的相关报告,进程安排,同济大学数学系,第四阶段(,2012.72012.9,)研究计划如下:,2012.7,运用我们的数学专业背景,进一步论证建立的模型在理论上的优缺点,并给出数学证明。姚震洲同学做相关报告,2012.89,总结前面所做工作,形成论文。,Thank You!,同济大学数学系,
展开阅读全文