资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,电子病历搜索系统的开发与应用,汤学民,主要内容,主要内容,需求及开发背景,系统流程及架构,功能界面效果演示,应用分析,开发背景,临床需要,多种字段或任一字段查询,实现全文检索,组合查询,对技术的好奇,Google,的神奇魅力,系统流程及架构,HIS,中电子病历,数据预处理,HTML,电子病历库,索引建立模块,全文索引库,全文检索模块,病历检索界面,用户,主要模块,数据预处理:将各种原始电子病历加工为,HTML,文件(网页文件),然后储存于,HTML,电子病历库中,索引建立模块,(,基于,Lucene),:对,HTML,文件进行索引,建立全文索引库。,全文检索模块,(,基于,Lucene),:根据用户提交的关键词检索索引库,并对结果进行排序,用户界面:接受用户查询,并显示查询结果,主要算法,分词:中文采用正向最大匹配法分词;连续的英文或数字作为分词单位,词库:现代汉语常 用词表、病历书写规范、,ICD10,、深圳市人民医院病历、检查检验项目、药品名、深圳市医疗机构名称,特殊处理,B,超和,X,线(,X,光)为专用名词,最好不要分开(分开后检索的准确度差),汉字间的空格的处理(如,”,民,族,”,,如分开,检索时输入“民族”则查不到),对姓名的分词处理,对否定意思的认定,如“否认高血压、糖尿病、肾病、结核等疾病病史”,地名、医疗机构的分词处理,功能界面及效果演示,应用分析,
展开阅读全文