Plink命令汇总情况情况

上传人:彩*** 文档编号:73139607 上传时间:2022-04-11 格式:DOC 页数:4 大小:313KB
返回 下载 相关 举报
Plink命令汇总情况情况_第1页
第1页 / 共4页
Plink命令汇总情况情况_第2页
第2页 / 共4页
Plink命令汇总情况情况_第3页
第3页 / 共4页
点击查看更多>>
资源描述
实用标准文案关联分析步骤个人总结,还一些问题待解决已有 1570次阅读2013-2-6 20:34| 个人分类 : 科学笔记 | 系统分类 : 科研笔记 | 关键词 : 安装软件个人总结 style希望查看此贴的同仁们对步骤提出改进,指出不足,谢谢!一、软件安装和存放1.将 plink文件直接放在 D盘;将 map和 ped 文件拷贝到 plink文件下面,保证和在一起;2.Ped文件的格式和 map文件都是先弄成 txt 文件,再直接更改文件后缀。可以在 excel 里先将需要的格式把数据排列好, 再将 excel 保存为 txt ,再改 txt 后缀为 ped 或 map.1) (.PED) 文件的前六列是强制的格式,依次为:ped 文件包含内容的顺序依次为以下信息备注Family ID可以用 1,2,3,4 表示Individual ID用入库编号表示Paternal ID可以用 0 表示Maternal ID可以用 0 表示Sex1=male; 2=female; other =unknownPhenotypecontrol 设定为 1,case 设定为 2Genotype如 A T,中间空一格,缺失用0 补平2) (.MAP) 文件包括以下的四项:map文件包含内容的顺序依次为以信息备注下chromosome1-22, X, Y or 0 if unplacedrs# or snp identifierrs 号Genetic distance (morgans)可以用 0 代替Base-pair position (bp units)用 NCBI上的染色体起始位置3)协变量信息:协变量先单独建立一个文件,要 txt格式的,比如有 10个协变量,我命名为var01.txt。这个文件必须放在和 ped,map和 plink.exe 文件一起。Var 文件是先在 excel 格式里面整理好,删除第一行协变量的表头,但自己要单独记下来每列代表的意思,然后转化成txt文本格式,就是另存为txt 。顺序依次为 :family ID ,个体 ID ,后面就是协变量了( number1-10),空缺的信息的用 -9 补全。二、软件启动开始运行 cmd精彩文档实用标准文案C:Documents and settingsAdministratorcdC:Documents and settingsAdministratorC:Documents and settingsAdministratord:D:cd plink三、软件运行的命令前提是冠心病数据文件分别为 1.ped和 1.map;用file1和 bfile 3的结果相似,那些限制性条件只是去掉了3 个对照;单倍型分析,在同一染色体上且位置较近的SNP分析单倍型才有效,不同染色体上 SNP的分析那是联合效应分析运行命令功能plink -file 1 -make-bed -out 2转成二进制文件, 2 即为二进制文件了plink -bfile 2 -maf 0.01 -geno 0.05 -mind 0.05设定过滤数据-hwe 0.001 -make-bed -out 3plink -bfile 3 -filter-controlshardy计算 control 的hw,将 hwe0.05的位点过滤掉,23个 SNP又去掉了2个SNPplink -bfile 3 -assoc -adjust -out assoc1等位基因的关联分析,每运行后及时更改文件名称(assoc1+时间)plink -bfile 3 -filter-females assoc -adjust女性样本关联-out 333分析plink -bfile 3 -filter-malesassoc -adjust男性样本关联-out 444分析plinkbfile 3assoc permpermutation 检验,就是模特卡罗模拟分析经验性的 P值plinkbfile 3all -missing缺失率或得出率( call rate )分析,查看 log文件结果plinkbfile 3model out model 1默认是卡方检验plinkbfile 3model fisherfisher 检验,但是结果比卡方检验差plinkbfile 3logistic-ci 0.95 -covar分析所有的协精彩文档实用标准文案var01.txt变量plinkbfile 3logistic covar var01.txt只分析 1,3,5这covar-number 1,3,5几个协变量plinkbfile 3logistic sexplinkfile 1 logisticci 0.95加性模式下分析plinkfile 1 logisticci 0.95dominant显性模式下分析plinkfile 1 logisticci 0.95recessive隐性模式下分析plinkfile 1 logisticci 0.95基因型分析genotypicplink -file 1 logisticci 0.95covar加性模式下分var01.txtcovar-number 1,2,4-6析plink -file 1 logisticci 0.95covar显性模式下分var01.txtcovar-number 1,2,4-6 dominant析plinkfile 1 logisticci 0.95covar隐性模式下分var01.txtcovar-number 1,2,4-6 recessive析plinkfile 1 logisticci 0.95covar基因型下分析var01.txtcovar-number 1,2,4-6 genotypicplinkbfile 3hap-snps rs653667,rs2261434单倍型分析hap-assocPlinkbfile 3filter-cases只包含 casesPlinkbfile 3filter-controls只包含controlsPlinkbfile 3filter-males只包含 malesPlinkbfile 3filter-females只包含 femalesplinkbfile 3 -filter-females logistic ci默认加性模型0.95plinkbfile 3 -filter-females logistic ci0.95dominantplinkbfile 3 -filter-females logistic ci0.95recessiveplinkbfile 3 -filter-females covar var01.txt默认加性模型-covar-number 1,2,4,8,9 -logisticci 0.95plinkbfile 3 -filter-females covar var01.txt-covar-number 1,2,4,8,9 logistic ci 0.95dominantplinkbfile 3 -filter-females covar var01.txt-covar-number 1,2,4,8,9 logistic ci 0.95recessive四、结果查看可以先用 notepad 打开看一下,也可以用excel 打开,打开步骤:精彩文档实用标准文案用 excel 的文件,打开 分隔符号 下一步 空格 完成,再另存为即可。看到 unjust 对应的 P 值是未校正的, plink 默认 Bonf 校正,非常严格,校正后基本没有显著的了。如果文章中不用 plink 校正后的结果的话,前面的分析也不要用 plink的结果,不然别人会问你为什么不用plink校正。 Log文件是保存运行过的命令,如果不及时更名,就被后面的log 文件给覆盖掉了。五、关于单倍型的分析过程分型数据结果出来后,首先要做的是按照染色体将 SNP位点分类(在位点位于不同染色体的情况下),1)如上图所示,按照不同染色体分好位点数;2)首先分析的是 control 数据里的 LD,如果存在 LD,即 D接近 1,r2 大小似乎关系不大,就可以判定有 LD,这个在 Haploview 软件里面分析。分析时的数据格式整理成 Linkage format 。可以把一个数据弄成 ped,一个是 map的。 ( 奇怪的是我用 plink format ,系统总说我少 SNP column,给 ped 加 head,genotype 那里换成 rs 号或 SNP1,SNP2之类的都不行, map文件是标准的 plink 格式, headless) ,有时间再找出问题在哪。Map的文件:只有 2 列,一列是 rs 号,一列是染色体上的起始位置,至于这个位置,我用的是 Hapmap数据库上的。 不同数据库之间的相差不大, 起始需要的是每 2 个 SNP之间的相对距离,估计软件自己会计算。Ped 文件:前 6 列是固定的,一次为 FID,IID , father ID, mother ID, sex(1 male; 2 female) ,phenotype (1 control ; 2 case ),后面就是基因型的了。按照SNP号排列好,但是不要表头。注意在 map文件中,SNP的顺序要和这个对上。3)结果可以看到 LD,右键点击,可以看到 D,r2 ;点 Haplotype ,不知道怎么有的没有结果出来,可能是没有单倍型?对于有单倍型的,比如,对照中有这样的结果, 我再计算 case 中的单倍型结果。 得出这些数据后, 我是再把数据导入到 SPSS,运用卡方分析 case control 中数据是否有差异。可惜今天分析的结果都没有差异, 奇怪为什么直接用 plink 的 haps 命令结果有一个是单倍型显著的呢?( P=0.045)。精彩文档
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 演讲稿件


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!