面向信息隐藏的文本特征值性质研究.ppt

上传人:zhu****ei 文档编号:5433092 上传时间:2020-01-29 格式:PPT 页数:32 大小:293KB
返回 下载 相关 举报
面向信息隐藏的文本特征值性质研究.ppt_第1页
第1页 / 共32页
面向信息隐藏的文本特征值性质研究.ppt_第2页
第2页 / 共32页
面向信息隐藏的文本特征值性质研究.ppt_第3页
第3页 / 共32页
点击查看更多>>
资源描述
2009 11 29 第一届中国 杭州 安全电子商务学术会议 1 面向信息隐藏的文本特征值性质研究 申请者 戴祖旭工作单位 武汉工程大学电子邮件 zuxudai 申请日期 2009 11 29 2009 11 29 第一届中国 杭州 安全电子商务学术会议 2 摘要 文本作为一种重要的信息传输载体 文本信息隐藏研究在信息安全等领域应用价值极高 目前对照信息隐藏的要求 数据有效载荷 不可感知性 鲁棒性 安全性等 去研究携带秘密信息的特征值的性质并评价相应算法的工作还很缺乏 本项目采用数理统计方法研究基于词性标记串序关系 语法结构关系以及其他统计特性的载体特征值的概率分布与冗余性质 对词性标记串按文本编辑相互转化关系分类 研究特征值在文本编辑下的变换性质 将这些变换性质作为信息隐藏的噪声 建立不同类型特征值的信道模型 估计容量 设计信道编码方法 本研究为基于词性标记工作域的文本信息隐藏技术提供理论基础 2009 11 29 第一届中国 杭州 安全电子商务学术会议 3 1 研究意义及国内外研究工作现状 信息隐藏是以多媒体信号作为宿主载体 利用多媒体数据的冗余特性和人类感知觉的冗余特性来隐藏秘密信息的技术 在开放式网络环境中 信息隐藏技术主要用于 1 隐秘通信 2 数字作品完整性与版权保护 作为一种重要的信息存储与传输媒体 文本载体信息隐藏理论与技术的研究是信息隐藏学科的一个重要分支 2009 11 29 第一届中国 杭州 安全电子商务学术会议 4 基于格式的方法 将文本解释为二值或灰度图像 通过调整行间距或单词和字符间距 修改字符轮廓与拓扑结构 调整字符亮度或颜色 以及格式化文本的脚本控制符来隐藏信息 选择行 字 间距 字符结构 字符亮度等物理量作为载体特征值来携带秘密信息 利用人类视觉保真度量模型计算特征值调整幅度 隐藏过程不改变人眼对文本外观的感知效果 这类方法有科学的人类视觉模型做基础 易于实现自动化 在信息隐藏技术出现的初期发展较快 缺点是隐藏容量较小 抵抗文本重新录入 复印等再生操作的鲁棒性较差 2 文本信息隐藏的代表性方法 2009 11 29 第一届中国 杭州 安全电子商务学术会议 5 基于内容的方法 建立在文本内容理解的基础上 主要通过修改自然语言语句来隐藏信息 利用同义词替换 可选择同义词 同义词频率 同义词语义歧义等特征值携带秘密信息 利用语句结构的变化 可选择句法分析树和词性标记串等特征值携带秘密信息 更高级的是利用文法来生成含密文本 2009 11 29 第一届中国 杭州 安全电子商务学术会议 6 例 汉语语句 风景优美的房间请给我 部分改写实例 1 风景优美的房间请给我 2 请把风景优美的房间给我 3 我想要风景优美的房间 4 请给我风景优美的房间 5 房间请给我风景优美的 6 把风景优美的房间给我 7 风景优美的房间给我 8 风景优美的房间我要 9 我要风景优美的房间 10 给我风景优美的房间 2009 11 29 第一届中国 杭州 安全电子商务学术会议 7 我们可以有10种改写方式 或许还有更多的其它方式 10个句子的语法都正确 意思也相似 因此 采用定长编码方法 一个句子用句法分析树可携带3比特信息 再考虑到用 优美 的同义词 美丽 漂亮 好看 悦目 美妙 幽美 优美 做替换 则可增加到70个改写句子 一个句子就可携带6比特信息 当然还可以进一步综合利用词性标记等其它特征值来携带信息以提高容量 2009 11 29 第一届中国 杭州 安全电子商务学术会议 8 3 信息隐藏算法的两个基本要素 秘密信息的隐藏空间与隐藏方式是信息隐藏算法的两个基本要素 隐藏空间称为嵌入工作域 人们总是利用工作域中的各类特征值来携带秘密信息 隐藏方式由数据嵌入方式实现 包括叠加嵌入和映射嵌入 叠加嵌入中 秘密信息作为弱信号用叠加的方式嵌入到宿主信号的特征值中 映射嵌入中 宿主信号的系数被映射函数映射到由嵌入比特确定的特征值 嵌入方式直接受特征值性质制约 2009 11 29 第一届中国 杭州 安全电子商务学术会议 9 目前的文本信息隐藏研究一般集中在寻找文本的各种特征值并设计相应的信息隐藏方法等较为基本的内容上 而对照信息隐藏的要求 数据有效载荷 不可感知性 鲁棒性 误判率 安全性 计算效率和成本等 去研究特征值的性质并评价相应信息隐藏算法的研究工作还很缺乏 2009 11 29 第一届中国 杭州 安全电子商务学术会议 10 4 项目研究内容 目标 文本载体信息隐藏过程一般包括以下步骤 秘密信息编码 映射 为载体特征值 格式参数 同义词 语法树 逆序数等 根据特征值修改载体得到含密载体 受文本不可感知性条件约束 公开发送含密载体以及文本编辑处理等噪声干扰 接收方计算特征值并译码提取秘密信息 2009 11 29 第一届中国 杭州 安全电子商务学术会议 11 设信息隐藏函数为 1 其中分别表示秘密信息 原始载体 含密载体和载体特征值 分别表示编码密钥和嵌入密钥 函数d表示不可感知性约束条件 为常数 另设噪声干扰为 2 其中是加噪含密载体 2009 11 29 第一届中国 杭州 安全电子商务学术会议 12 项目组成员经过多年研究 找到了基于词性标记工作域的部分特征值 并据此提出了若干文本信息隐藏新算法 在前期研究工作的基础上 本项目将深入研究如下内容 1 研究现有文本载体特征值的性质 公式 1 中t是载体特征值 是秘密信息的携带者 也是噪声干扰的目标 针对文献已提出的特征值 比如语法树 逆序数 信息熵等 重点研究t在常规文本编辑 比如语句或语句中词的增加 删除与移位等 处理下的变换性质 它是进一步评估相关隐藏算法鲁棒性 安全性和计算复杂性的理论基础 特征值t的分布性质 它是设计秘密信息编码函数f的基础 也是度量不可感知性的基本因素之一 2009 11 29 第一届中国 杭州 安全电子商务学术会议 13 2 研究文本载体信息隐藏信道模型 信道模型是噪声对特征值的作用方式 是计算信息隐藏容量的基础 公式 2 描述了文本编辑噪声对含密文本的干扰作用 这种干扰作用传递到不同的特征值上会有不同的影响 对于逆序数 语法树等来说 干扰导致离散状态之间的转换 对于信息熵等取非负实数的特征值来说 干扰导致熵值的波动 因此信道模型可能是状态转移矩阵 需要具体研究同一类特征值之间的转移概率 也可能是具有加性或乘性噪声的连续信道 需要建立噪声分布函数关系式 2009 11 29 第一届中国 杭州 安全电子商务学术会议 14 5 本项目预期目标 1 针对2 3种文本载体特征值建立文本编辑变换模型 据此建立相应的信道模型 2 针对2 3种文本载体特征值建立统计模型及其相关性模型 2009 11 29 第一届中国 杭州 安全电子商务学术会议 15 6 拟采取的研究方法和技术路线 本项目总的研究方案是以词性标记工作域上的特征值为中心 收集大容量的文本样本 将文本按文体分类 首先研究各类特征值的分布规律与冗余性质 研究文本编辑操作对词性标记串的改变规律 对词性标记串按文本编辑相互转换关系进行分类 根据分类情况研究各类特征值的变换性质 将这些性质作为噪声 得到信道模型 2009 11 29 第一届中国 杭州 安全电子商务学术会议 16 1 关于数据统计分析工作本项目的研究内容涉及大量不同类型数据的统计分析工作 可以利用成熟的数理统计方法 关键点在于合理规划数据采集 存储与处理等实验方案 科学选择统计指标与统计模型 保证数据处理工作有序 高效且准确 2009 11 29 第一届中国 杭州 安全电子商务学术会议 17 研究载体特征值概率分布模型时 计划将载体按文体分为小说 散文 新闻报道 文史哲类学术论文四类 每类文体样本量在1000篇左右 分别对词性 词性标记串及其信息熵 逆序数等进行统计处理 分门别类地建立这些特征值的概率分布类型与冗余模型 测定各种分布参数 把特征值理解为一个句子固有的属性 而这些特征值都具有随机性 因此可以用特征值随机向量来描述样本 2009 11 29 第一届中国 杭州 安全电子商务学术会议 18 设是特征值构成的随机向量 其中是统计相关的 是联合分布 2009 11 29 第一届中国 杭州 安全电子商务学术会议 19 采集各特征值的样本 建立特征值的一维分布和高维联合分布 联合分布可由样本统计得到 而相应低维分布就是边际分布 即 2009 11 29 第一届中国 杭州 安全电子商务学术会议 20 分析特征值之间的相关关系 由于各特征值统计上是不独立的 所以携带秘密信息的主特征值的分布改变后 其它特征值的分布也会改变 因此我们要知道其它特征值的分布的变化规律 这样才能控制其它特征值分布的变化 这个变化规律就是主特征值与其它特征值的相关关系 对于一个好的信息隐藏系统来说 这种关系在信息隐藏前后应该是不变的 可采用两种方法表示这种相关关系 2009 11 29 第一届中国 杭州 安全电子商务学术会议 21 例句 他 r买 v了 u一 m把 q裁 v纸 n的 u刀 n w 他 r买 v了 u一 m把 q裁 v纸 n刀 n w 去掉 的 则句法分析树变了 词性标记串也由 r v u m q v n u n w 变为 r v u m q v n n w 词性标记串的逆序数也由偶数20变为奇数19 采用字典序 2009 11 29 第一届中国 杭州 安全电子商务学术会议 22 一个是函数关系 我们可以由采集到的样本回归出与的函数关系 2009 11 29 第一届中国 杭州 安全电子商务学术会议 23 另一个是条件概率 比如条件概率反映了真实文本中特征值子向量对的依赖关系 2009 11 29 第一届中国 杭州 安全电子商务学术会议 24 2 关于信道建模工作以词性标记串逆序数 逆序数奇偶性 词性标记串信息熵等特征值来携带秘密信息 文本编辑 语句增删与移位 语句中词的增删与移位等 可能引起特征值的改变 改变的规律即为相应的信道模型 2009 11 29 第一届中国 杭州 安全电子商务学术会议 25 设标记串集合为 文本编辑为公式 1 中映射 定义A上的关系即两个标记串具有关系当且仅当它们可以通过文本编辑相互转换 显然具有对称性和传递性 可根据对A分类 2009 11 29 第一届中国 杭州 安全电子商务学术会议 26 设有共n个划分块 设要计算的特征值类型为T 若T为离散型 则根据T的值进一步将分为共个子块 每个子块有相同的特征值 由此可按如下方法定义子块间特征值的转移概率 2009 11 29 第一届中国 杭州 安全电子商务学术会议 27 最后可通过对划分块加权的方式定义特征值转移概率 若为连续型 比如信息熵 则划分块的基数可用于标记串频数变化范围估计 据此可对特征值波动做出误差估计 采用误差分析理论建立信道模型 2009 11 29 第一届中国 杭州 安全电子商务学术会议 28 7 与本项目有关的工作条件 项目组已购置了由北京大学计算语言学研究所开发的汉语自动分词与词性标注软件 现代汉语语法信息电子词典等自然语言处理工具 为项目实施提供了计算语言学方面的技术支持 项目依托武汉工程大学理学院信息与计算科学专业实验室 具有高性能计算设备和科研团队的支持 2009 11 29 第一届中国 杭州 安全电子商务学术会议 29 8 项目申请人简介 戴祖旭 男 博士 副教授 2008 9 2009 7在北京大学计算语言学研究所作为期一年的访问学者 在俞士汶教授指导下从事文本信息隐藏的有关基础理论研究工作 2007年毕业于华中科技大学计算机科学与技术学院 获得计算机软件与理论专业博士学位 研究方向为信息隐藏与数字水印 1999年7月毕业于大连理工大学应用数学系 获得应用数学专业理学硕士学位 2009 11 29 第一届中国 杭州 安全电子商务学术会议 30 项目申请人主持的相关科研项目 湖北省教育厅科学技术研究项目 D20081506 已结题 该项目主要研究了文本词性标记的数学性质 寻找适合携带秘密信息的特征值 标记串逆序数 信息熵等 在此基础上设计了若干新的信息隐藏算法 2009 11 29 第一届中国 杭州 安全电子商务学术会议 31 发表与本项目相关的论文有 1 戴祖旭 高精度模拟函数 J 数学的实践与认识 2009 第一届中国 杭州 安全电子商务学术会议录用论文 2 戴祖旭 抵抗同义词替换攻击的文本信息隐藏算法 J 四川大学学报 工程科学版 EI收录 2009 41 4 186 190 3 戴祖旭 洪帆 崔国华 信息熵方程求解算法及其应用 J 高校应用数学学报 2008 23 3 277 281 4 Daizuxu Hongfan Yangmuxiang TextInformationHidingBasedonPartofSpeechGrammar C InYupingWang QingfuZhang HailinLiu andXiamuNiu ed 2007InternationalConferenceonComputationalIntelligenceandSecurityWorkshops 2007 632 635 EI收录 5 ZuxuDai FanHong WatermarkingTextDocumentsBasedonEntropyofPartofSpeechString J JournalofInformation ComputationalScience 2007 4 1 21 25 EI收录 2009 11 29 第一届中国 杭州 安全电子商务学术会议 32 6 戴祖旭 洪帆 崔国华 付敏 基于词性标记串统计特性的文本数字水印算法 J 通信学报 2007 28 4 108 113 EI收录 7 戴祖旭 洪帆 李小刚 文本文档水印质心检测方法的改进 J 计算机应用 2007 27 5 1064 1066 8 戴祖旭 洪帆 基于词性标记序列逆序数的文本信息隐藏算法 J 计算机工程与应用 2007 43 14 160 161 198 9 戴祖旭 洪帆 基于句型Huffman编码的文本信息隐藏算法 J 计算机工程 2007 33 15 147 148 10 Ruan Chi Zuxu Dai Correlationanalysisonpartitionofrareearthinion exchangeablephasefromweatheredcrustores J TransactionsofNonferrousMetalsSocietyofChina 2006 6 1461 1465 EI收录 11 戴祖旭 洪帆 用yacc实现基于词性标记文法的文本信息隐藏 J 计算机应用与软件 2006 23 11 40 42
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!