信息隐藏基本原理.ppt

资源描述

信息隐藏原理及应用第2章信息隐藏基本原理本章目标在读完本章之后你应该能够 1 理解信息隐藏的基本原理 2 了解隐写系统的分类 3 理解一般的数字水印系统 4 理解隐写术的主要术语和基本分类 5 理解数字水印技术的主要术语和基本分类信息隐藏技术是近几年来国际学术界兴起的一个前沿研究领域特别是在网络技术迅速发展的今天信息隐藏技术的研究更具有现实意义目前为保证数据传输的安全需要采用数据传输加密技术信息隐藏技术数据完整性鉴别技术为保证信息存储安全必须保证数据库安全和终端安全信息安全的研究包括两个主要研究方向信息加密与信息隐藏在信息安全的研究理论体系和应用体系中密码技术已经历了长期的发展形成了较完整的密码学理论体系有一系列公认的经典的可靠的算法然而在现代信息科学技术的条件下的信息隐藏虽然可以追溯到公元前但其完备的理论体系还尚未建立在本章中将详细地阐述信息隐藏的基本术语基本原理的分类等基础知识 2 1信息隐藏的基本原理与分类 LisaM Marvel博士于1999年提出了SSIS spreadspectrumImagesteganogrphy扩展频谱的图像信息隐藏中阐述了信息隐藏的基本原理那就是先将秘密信息嵌入到噪声信号中然后再随噪声信号嵌入到数字图像中因为数字图像中存在着噪声信号如果噪声的容量不大在没有原始图像比较的情况下一般人类视觉和计算机统计分析都无法感知到秘密消息的存在这样隐写就成功了在提取秘密信息时需要图像恢复和差错控制编码技术前者得到原始图像的近似估计并对嵌入的秘密信息容量进行估计然后根据相应的算法进行提取这种方案的位错率较高所以必须对秘密信息也进行低比率差错编码才能较完善地提取秘密信息目前隐写术的基本原理可以概括为首先对欲嵌入的秘密信息进行预处理预处理包括加密编码然后生成伪随机数然后将预处理后的秘密信息根据相应的嵌入算法嵌入到载体中载体可以包括文本图像语音和视频等多种格式的多媒体然后在通信中可以使用隐蔽信道进行通信最后在提取中根据相应的提取算法和密钥提取秘密消息这样就可以达到三层安全对相应的嵌入算法和提取算法都要分析不可感知性容量和鲁棒性三者之间的关系理论上使三者之间平衡并性能达到最佳图2 1信息隐藏主要分支信息隐藏的主要分支如图2 1所示根据分类的依据不同可以将隐写术分为以下几类可以按隐写系统结构分类分为纯隐写术密钥隐写术和公钥隐写术按隐写空间分类可以分为空域隐写变换域隐写按隐写载体分类可以分为文本隐写图像隐写语音隐写视频隐写和二进制隐写首先分析理论上完美的隐蔽通信隐写术将包含在其中为了透彻地阐明这个概念假设有三个人分别为Alice Bob和Denmy Alice想发送秘密信息 M 给Bob 使用无害消息作为载体 C 然后秘密消息嵌入到C中形成伪装载体伪装载体将发送给Bob并且没有引起任何怀疑这是纯隐写的过程或者 Alice使用隐写密钥 stego key K 将秘密消息 M 嵌入到载体 C 中生成伪装载体 S 然后Alice将伪装载体 S 发送给Bob而没有引起Denmy的任何怀疑而Bob能够阅读秘密信息因为Bob有相同的隐写密钥 stego key K 但在通信双方必须对密钥进行协商达成一致后双方能才进行通信这是密钥隐写过程如果在这个过程中Alice在嵌入秘密信息时使用的是公钥而Bob在提取信息时使用的是与公钥为一对密钥的私钥那么这是公钥隐写过程在公钥体制中为了防止篡改必须要借助于证书体系来验证公钥无论是哪种秘密通信从理论上隐蔽通信是很完美的就如FabienA P Petitcolas所指出的 ina perfect system anormalcovershouldnotbedistinguishablefromastego object neitherbyahumannorbyacomputerlookingforstatisticalpatterns 也就是说在完美的系统中无论是人或者计算机通过统计分析都不能区分出是一般载体还是伪装载体但在实际中情况并非总是这么完美为了将秘密消息嵌入到载体中载体必须包含足够的冗余数据或噪声这是因为隐写术的嵌入处理过程实际上是使用秘密消息替换这些冗余信息隐写术的框架如图2 2所示 2 1 1纯隐写术密钥隐写术和公钥隐写术图2 2隐写术框架数学上发送方嵌入的过程和接收方提取的过程都可以通过映射描述前者为后者为而且其中 E为嵌入过程 D为提取过程 C为载体 M为秘密信息下面分别介绍纯隐写密钥隐写和公钥隐写术纯隐写的文字定义为 asteganographicsystemthatdoesnotrequiretheexchangeofaciphersuchasastego key 也就是说一个不需要交换隐写密钥的隐写系统这种类型的隐写安全性最低因为在这种隐写中通信双方只能假定没有任何第三方能察觉发送的秘密消息但是使用开放的环境如在互联网上这种情况绝对不会发生网络上的任何通信都可能被第三方截获如果使用纯隐写秘密消息被隐写分析出来的可能性最高因为只要第三方知道嵌入算法就可以提取出相应的秘密信息纯隐写系统的数学定义如下定义1 纯隐写系统对一个四元组 C是所有随机选择的载体的集合 M是所有可能嵌入的秘密信息的集合且满足是嵌入函数是提取函数对和恒有D E cm m则称该四元组为纯隐写系统纯隐写系统的原理图如图2 3所示图2 3纯隐写系统原理图密钥隐写系统文字定义为 asteganographicsystemthatrequirestheexchangeofasecretkey stego key priortocommunication 也就是说在双方进行秘密通信前需要双方隐写系统交换密钥密钥隐写使用密钥将秘密消息嵌入到载体信息中只有知道密钥的人才能执行相反的过程在载体中提取秘密消息与纯隐写不同纯隐写通信中就像存在一条无法感知的通信信道而密钥隐写需要交换密钥这就可能引起第三方的截获或怀疑而密钥隐写的优势在于即使隐写消息被截获只有知道密钥的用户才能提取秘密信息密钥隐写系统的数学定义是一个五元组定义密钥隐写系统对一个五元组 C是所有随机选择的载体的集合 M是所有可能嵌入的秘密信息的集合 K是所有可选择的密钥的集合且满足是嵌入函数是提取函数对和恒有D E cm m则称该五元组为密钥隐写系统因为密钥的算法和生成有经典的密码学作基础在此就不再多讨论这已经超出了本文的范围公钥隐写采用公钥加密公钥隐写定义为 asteganographicsystemthatusesapublickeyandaprivatekeytosecurethecommunicationbetweenthepartieswantingtocommunicatesecretly 也就是说隐写系统需要使用公钥和私钥来确保双方间通信的隐蔽性发送方在嵌入处理过程中将使用公钥进行而只有在拥有了私钥的接收方才能解密并提取秘密信息公钥和私钥是同时生成的在数学上有直接的联系公钥体系有广泛的使用基础也是一种很成熟的技术在目前都借助于国际认证的CA颁发的数字证书来验证公钥可以在网上公开发行私钥由申请证书的用户收藏用公钥加密的信息只有私钥能解开而用私钥加密的信息也只有公钥能解开在隐写术中使用公钥这项技术无疑推动了隐写术更加广泛的使用在公钥为基础的隐写术中能达到几层安全首先第三方必须怀疑已经使用了隐写术然后必须使用公钥体系来发现相对应的破解算法然后才能提取秘密消息这种处理方式的隐写在三种方式中是最为安全的因此隐写术并没有脱离加密技术它们可以说是孪生兄弟所以两种技术的结合可以使双方的优势互补不同之处在于密钥 Key 的不同密钥隐写和公钥隐写的原理图如图2 4所示图2 4密钥和公钥隐写原理图关于空间域和时间域的隐写我们将在第4章中详细介绍下面介绍另外一种根据载体不同而进行分类的隐写 2 1 2文本音频图像的隐写目前隐写术使用的载体分别为文本音频图像和视频以及相应的二进制多媒体下面分别介绍在各种载体中隐写术实现的基本原理首先介绍如何在文本中隐藏秘密信息给秘密信息编码并嵌入到文本文件中这是一项具有挑战性的工作因为文本文件中可供秘密信息替代的冗余数量有限另外一个显著的缺点就是在第三方改变文本或者将文本转换成其他格式如从 txt到 pdf 时基于文本的隐写就会被发现导致隐写失败但是还是有许多方法来完成文本中的隐写下面介绍比较流行的编码方式行移编码法 line shiftencoding 调整文本文件中的垂直行距来隐藏信息具体的是选择特定的段落将其行距作垂直的上或下调整根据人类视觉的特点行距值必须在3cm以下才能不被察觉字移编码法 word shiftencoding 它的使用方式与行距调整方式相同在此使用文件中的水平方向位置来嵌入秘密信息具体的是选择单个字进行左右调整然后嵌入秘密信息字距调整法的隐蔽性比行距调整法强但它需要文本的格式支持变化的字间距特征编码法 featurespecificencoding 它是通过改变特定文本的属性来嵌入秘密信息的编码如每个字符水平垂直的长度这是最难被第三方察觉的编码因为对每种类型格式的文件都有许多特征可以改变用于为秘密消息编码但使用时要注意字体等特性的修改文件内容是否改变等上述介绍的三种方法都需要源文件或者源文件的格式才能在接收方进行解码因为基于文本的隐写很容易被觉察所以文本中的隐藏目前使用受到限制下面介绍比较常见的图像为载体的隐写将秘密信息编码嵌入到数字图像中是目前使用最广泛的一种隐写因为它利用人类视觉 HumanVisualSystem HVS 有限性的特性就是说对数字图像的某些区域人类视觉不敏感并且图像中发生微小变化人眼看不到改变等绝大多数的文本图像或密文及其他任何形式的媒体都可以生成比特流嵌入到数字图像中随着数字图像广泛的使用载体为数字图像的隐写也在持续增长以图像为载体的隐写系统如图2 5所示图2 5图像为载体的隐写系统对于计算机图像就是用许多代表亮度的像素的阵列组成这些像素组成了图像的光栅数据当使用图像做为隐写术的载体时通常使用8位或者24位的图像每种载体都有其优势和劣势 8位图像因为其相对较小的尺寸正在广泛使用但是缺点是在编码中它可以使用的位数只有256位通常当处理8位图像如 gif 都使用灰度图像调色板因为这类图像颜色上的逐渐变化在源图像和嵌入秘密信息的伪装图像之间很难进行区分 24位图像更适合用于隐写它可用于编码的位数超过了1600万这个数字远远超出了人的视觉范围这就使人很难觉察到秘密消息的存在另外一个优势在于嵌入的秘密消息的容量可以增大也就是说可以比8位图像嵌入更多的秘密消息当然所有嵌入信息容量都要比载体小但8位通常嵌入的信息量使用的单位是KB 而24位图像使用的是MB 但是图像太大又不利于在Internet上传输所以在数字图像中广泛使用着两种压缩技术有损压缩和无损压缩有损压缩如JPEG 经常用于24位图像来减小它的大小但是对于伪装图像经过有损压缩之后嵌入的秘密信息也可能丢失因为秘密信息是替代图像的冗余部分所以可以去掉而无损压缩对源图像没有任何损失这也是隐写选择无损压缩的原因如对 bmp和 gif格式的图像但这种压缩并不能很好地减小图像的大小隐藏信息的大小必须比图像小而像素多少代表了文件大小通常图像都为640 480像素数据大小为307200比特通常高质量的24位的图像大小是1024 768 数据大小为2359296比特 24位的图像可以在每个像素中嵌入3位数据由于它使用像素中的每个像素的三位来表示颜色值 GIF文件通常使用8位调色板因此只能表示256种颜色 JPEG文件通常使用24位调色板而BMP图像可以使用8位也可能使用24位调色板 24位图像为隐藏信息提供了更大的可选空间图像一般都使用许多中间色或者许多过渡由于图像的这种特性许多信息都可以隐藏到图像中并且嵌入信息的图像变化人眼是不能觉察的在图像嵌入编码中经常使用最低有效位法和伪装与过滤技术 LSB使用图像中的每个像素来隐藏信息对于24位图像可以选择每个像素中的3位做为隐藏位对于8位图像每像素中使用1位来隐藏数据由此可见 24位图像可以隐藏更多的信息但是根据载体图像的彩色调色板如果每像素嵌入2位最低有效位人类视觉还不能分辨源图像和伪装图像的差异这种技术存在的问题是当图像或图像格式发生改变时隐藏失败对于伪装和过滤技术更多用于有损压缩技术这种技术实质是扩展了图像将秘密信息伪装成图像的数据使之成为源图像的扩展部分一些专家指出这是一种很好的信息隐藏技术但不属于技术隐写这种技术就是鲁棒性非常出色另外在隐写过程中还会使用许多复杂的算法图像传输技术和图像加密技术将在后面的章节中进行介绍 2 13音频中的隐写音频中的隐写是根据人类听觉系统 HumanAuditorySystem HAS 来进行的因为众所周知对相同频率的音频信号人与人之间的敏感度有很大差异所以在隐写术中对音频进行编码是具有挑战性的一项工作听觉系统中存在一个听觉阈值电平低于这个电平的声音信号就听不到听觉域值的大小随声音频率的改变而改变各个人的听觉域值也不同大多数人的听觉系统对2kHz 5kHz之间的声音最敏感一个人是否能听到声音取决于声音的频率以及声音的强度是否大于该频率对应的听觉阈值因为人类听觉系统是一个动态的范围 Boney等人根据人类听觉系统的这一特性将秘密信息隐藏到强度较弱的频率中也就是说某段声音频率的强度之上人能听到这一强度之下人就不能听到这段声音那么就可以将相应的时间轴上的信号转换到频率轴上计算出各频率的强度然后将秘密信息嵌入到比这些频率强度低的各频率中去根据听觉掩蔽特性也就是说声音的响度不仅取决于自身的强度和频率而且也与同时出现的其他声音有关各种声音可以互相掩蔽一种声音的出现可能使得另一种声音难于听清一种频率的声音阻碍听觉系统感受另一种频率的声音的现象称为掩蔽效应前者称为掩蔽声音 maskingtone 后者称为被掩蔽声音 maskedtone Flanagan等人则是根据人对音强敏感度不同将秘密信息加载在到较高强度的不同比特中频域掩蔽也就是说一个强纯音会掩蔽在其附近同时发声的弱纯音这种特性称为频域掩蔽例如同时有两种频率的纯音存在一种是1000Hz的声音 60dB 另一种是1100Hz的声音 42dB 在这种情况下 1100Hz的声音就听不到弱纯音离强纯音越近就越容易被掩蔽不同纯音的掩蔽效应曲线例如在250Hz 1kHz 4kHz和8kHz纯音附近对其他纯音的掩蔽效果最明显低频纯音可以有效地掩蔽高频纯音但高频纯音对低频纯音的掩蔽作用则不明显 Gruhl则根据这一特性利用不同长度的回音先计算声音的延迟然后生成回音然后对回音进行处理使其强度低于人能听到的范围然后将源音乐划分成数个时间区把回音加到各个区段中在使用的音频格式中有三种主要的数字格式取样量化 samplequantization 临时采样率 temporalsamplingrate 和知觉采样 perceptualsampling 像WAV和AIFF格式这样广泛使用的音频使用的就是16位线性采样结构的取样量化临时采样率通常用于可选的通常在KHz的频率段进行采样通常采样率越高可以使用的用于隐藏信息的空间越多知觉采样很大地改变了音频的格式它只对可听到的音频部分进行编码这种编码虽然音频还在但改变了信号这种格式在Internet上广泛使用如MPEG MP3 对于音频的传输介质 W Bender指出需要遵循以下四点从一端到另一端的传输过程中数字信号没有改变提高降低采样频率是可以的但必须保留所有数字信号当重采样时不同采样频率的信号也随之变化通过空气传输时应以无线电频率传送在音频的隐写中使用三种很流行的编码最低位编码 low bitencoding 相位编码 phase encoding 和扩频 spreadspectrum 最低位编码是将秘密消息嵌入到音频文件的最低有效位中信道容量是1KB每秒每KHz 也就是说 44KB s对应着44KHz的采样序列这种方法虽然很容易实现但是当信道噪声增加或重新采样时很容易造成数据损失相位编码用表示隐藏数据的相位来代替源音频文件的相位常用的有离散傅立叶变换 DiscreteFourierTransform DFT 扩频几乎对所有频谱都进行编码然后将音频通过不同的频率进行传输直接序列扩频 DirectSequenceSpreadSpectrum DSSS 是这样一种技术用高速伪随机码将传输信息所需带宽加以展宽的一种扩频技术若传送的信码速率为Rb 用速率为Rc MRb伪随机码与传送信码作模二加后再进行相移键控频带就展宽M倍将信号功率分散到很宽频带内类似于噪声不易被发现对其他通信系统的影响也小扩频用于音频中的隐写相对比较安全但它相对于原音频而言引进了噪声这样可能引起数据的丢失在Internet网上每个站点几乎都有音频媒介秘密信息可以嵌入这类媒体最流行使用的媒体的格式是 wav和 mp3 下面是将密钥嵌入到 wav和 mp3音频文件的示例分别如图2 6 a 和 b 所示图2 6 a wav文件嵌入密钥前后的文件图2 6 b mp3文件和嵌入密钥前后的文件 2 2信息隐藏的主要术语在本节中将根据信息隐藏的分类对信息隐藏的术语进行归纳和总结以期达到一致信息隐藏 informationhiding 作为信息安全的一个重要分支主要是将秘密信息嵌入到其他载体中不让未授权的第三方察觉的一门学科也就是说将秘密信息嵌入到多媒体数字信号本身所存在的冗余中而且不影响载体信号的感觉效果和使用价值它主要包括隐写术数字水印隐蔽通道匿名通信等分支一般而言信息隐藏技术的研究及应用主要是指隐写术和数字水印两个领域匿名通信 anonymouscommunications 匿名通信定义了一个经过多个中间结点转发数据的多级目标路径为隐蔽接收者发送者可选定N个连续目标其中之一为真正接收者窃听者在一段链路上获取真正接收者的概率为1 N 并且中间结点在传送消息时可采取重新排序延迟和填充手段使获取真正目标的概率更低从而加大攻击者进行流量分析的难度并且所选目标能可靠地完成上述工作且彼此间存在安全通道中间结点必须知道整个路径结构才能重新排序信息隐藏中的匿名技术就是设法隐藏消息的来源即隐藏消息的发送者和接收者例如收发信者通过利用一套邮件转发器或路由器就能够实现掩盖消息痕迹的目的只要这些中介环节相互不串谋因此剩下的是对这些手段基础的信赖需要注意的是不同的情况取决于谁要被匿名是发信者还是收信者或是两者皆要网上浏览等将问题集中于收信者的匿名而电子邮件用户关心的是发信者的匿名隐蔽信道 covertchannel 是指这些通道一般被运用于不可信程序当对别的程序执行操作时将有关信息泄露给不可信程序的拥有者而不是指这些信道平时是隐蔽的不可见的因此我们称之为隐蔽信道隐蔽信道一般存在于多级保密系统的背景之中在操作系统中隐蔽信道是指使两个共同执行的进程以违反系统安全策略的方式传输通信信道隐蔽信道分为隐蔽存储信道 covertstoragechannel 和隐蔽定时信道 coverttimingchannel 和阈下信道前两种是常指的隐蔽信道隐蔽存储信道是采用特殊的编译码方式使不合法的信息流逃避常规的安全控制机构的检测来实现如在操作系统中是指由一个进程直接或间接写一个存储地址而由另一个进程直接或间接读一个存储地址的隐蔽信道隐蔽定时信道是利用时间轴上的事件序列进行编码来实现在操作系统中一个进程通过调整自身对系统资源例如CPU时间的使用向另一进程发送信息阈下信道是指基于公钥体制的数字签名认证应用等输出密码数据建立起来的一种隐蔽信道除接收者之外其他第三方均不知道密码数据中是否有阈下消息的存在隐写术 steganograhpy 就是将秘密信息嵌入到载体中而使伪装载体在人类视觉以及计算机分析时秘密信息不被发现并且源载体与伪装载体之间差异很小一般感觉不到载体的变化一般把隐写术分为技术隐写语义隐写现在的隐写术主要利用高空间频率的图像数据隐藏信息采用最低有效位方法将信息隐藏到宿主信号中使用信号色度隐藏信息方法在数字图像的像素亮度的统计模型上隐藏信息的方法 patchwork方法等数字水印 digitalwatermarking 数字水印主要是向被保护的数字对象嵌入某些能证明版权归属或跟踪侵权行为的信息目前主要有两类数字水印一类是空间域数字水印另一类是频率数字水印空间数字水印的典型代表是最低有效位算法其原理通过修改表示数字图像的颜色或颜色分类的位平面调整数字图像中感知不重要的像素来表达水印的信息以达到嵌入水印的目的频率数字水印的典型代表是扩频算法其原理是通过时频分析根据扩展频谱特性在数字图像的频率域上选择那些对视觉最敏感部分使修改后的系统隐含数字水印信息秘密信息 embeddeddata 欲嵌入的信息秘密信息是指掩藏在公开信息中的保密信息也即发信者真正想要发送给收信者而又不想让未授权第三方知道的信息载体 cover 是指秘密信息嵌入的对象也就是用于容纳秘密信息的载体伪装载体 stego object 将秘密信息嵌入到载体之后形成的目标载体称为伪装载体也就是说此时秘密信息已经隐藏在载体之中伪装密钥 stego Key 无论使用私钥或者公钥体制都可以使用密钥对嵌入的秘密信息进行加密处理来多层保护欲隐藏的信息隐写分析者 steganalyst 隐写分析者就是检测分析隐蔽信息存在的真实性并通过各种隐写分析手段得出隐藏的秘密信息隐写分析者分为主动攻击者和被动攻击者主动攻击者不仅要检测嵌入秘密信息的存在并且要破坏秘密信息甚至在检测出的秘密信息中嵌入自己的信息而被动攻击者只是检测分析秘密信息是否存在被保护信息 coverdata 数字水印技术中的伪装载体虽然也作为掩护水印信息但它主要目标是保护水印信息水印密钥 watermarkingkey 控制水印嵌入隐藏过程的密钥水印密钥空间需足够大而且分布比较均匀即使第三方知道了水印嵌入算法的全部细节但不知道秘密密钥就不能将水印提出或破坏水印体制的商业应用其算法必须公开所以数字水印算法的安全性完全取决于密钥而不是以算法的保密来取得安全性为了给攻击者增加去除水印的难度目前大多数水印制作方案都在加入提取检测时采用了一个或多个密钥做到只有掌握密钥的人才能读出提取水印含水印信息 watermarkeddata 被水印标注了的数据攻击者 attacker 数字水印攻击者的目的是检测出数字水印的存在事实在不可感知水印中并破坏水印信息其侧重点是盗用破坏删除修改水印信息数字水印的攻击者一般为主动攻击者或恶意攻击者其主要攻击行为是检测数字水印的存在事实在不可感知水印中并盗用水印信息盗版破坏删除修改水印信息及加入自己的水印信息在上述的常见术语介绍完成之后还需要介绍信息隐藏的问题空间因为信息隐藏的问题空间最终可以归纳为容量和不可感知性之间的关系为了防止载体信号的质量下降信息隐藏算法不能嵌入大量的隐藏信息而大量信息的引入必然增加对原载体内容的更改必然造成不可感知性的下降而鲁棒性和不可感知性也存在着这样的矛盾性所以对嵌入率或者对格式的更改都有严格限制当容量增加不可感知性必然有不同程度的下降而不可感知性的增强必须造成容量的下降所以这几个方面都限制着信息隐藏的处理过程即要考虑隐藏数据的数量又要使嵌入的数据使载体图像不失真并且隐藏的数据必须达到不可感知性对第三方的剪切修改或删除等具有鲁棒性在分析这一问题之前先介绍一下相关的几个特性鲁棒性 robustness 是指数字水印中被保护的信息经过某种改动后比如传输过滤操作重新采样编码有损压缩等嵌入的信息应保持其完整性不能被轻易地去除并以一定的正确概率被检测到当有敌意的第三方试图通过某些处理去除或修改嵌入的信息时只会引起被保护信息的明显改变从而提醒合法的所有者或使用者达到对信息的保护作用不同的水印应用对鲁棒性要求不一样一般都应能抵抗正常的图像处理如滤波直方图均衡等用于版权保护的鲁棒水印需要最强的鲁棒性需要抵抗恶意攻击而易损水印注释水印不需抵抗恶意攻击不可感知性 imperceptibility 是指嵌入秘密信息后的伪装载体应不使源载体质量显著下降并且视觉效果也无明显变化从信号处理的角度看水印的鲁棒性和不可感知性是相互矛盾的但是这种技术是有可能的因为人类的感觉器官并不是十分精密的系统所谓的不可感知性不是绝对的而是相对的只是针对人的主观感觉而言不使人的视觉听觉等器官感受发生变化就是不可感知的 2 3数字水印系统构成与分类在知识产权保护中应用最广泛的就是数字水印系统它能提供所有者的身份能进行所有权验证并能对操作进行跟踪例如DiVX公司生产的DVD播放器的安全技术之一就是使用了操作跟踪的设计水印数字水印还能对内容进行认证和拷贝控制由于数字水印与隐写术一样均属于信息隐藏领域的分支有共享的技术但两者之间存在着差异在本节中主要针对数字水印这一分支的构成原理及特性进行分析和介绍数字水印 digitalwatermark 技术是指用信号处理的方法在数字化的多媒体数据中嵌入隐蔽的标记这种标记通常是不可见的只有通过专用的检测器或阅读器才能提取数字水印是信息隐藏技术的一个重要研究方向嵌入数字作品中的信息必须具有以下基本特性才能称为数字水印 1 隐蔽性在数字作品中嵌入数字水印不会引起明显的降质并且不易被察觉 2 隐藏位置的安全性水印信息隐藏于数据而非文件头中文件格式的变换不应导致水印数据的丢失 3 鲁棒性所谓鲁棒性是指在经历多种无意或有意的信号处理过程后数字水印仍能保持完整性或仍能被准确鉴别可能的信号处理过程包括信道噪声滤波数模与模数转换重采样剪切位移尺度变化以及有损压缩编码等在数字水印技术中水印的数据量和鲁棒性构成了一对基本矛盾从主观上讲理想的水印算法应该既能隐藏大量数据又可以对抗各种信道噪声和信号变形然而在实际中这两个指标往往不能同时实现不过这并不会影响数字水印技术的应用因为实际应用一般只偏重其中的一个方面如果是为了隐蔽通信数据量显然是最重要的由于通信方式极为隐蔽遭遇敌方篡改攻击的可能性很小因而对鲁棒性要求不高但对保证数据安全来说情况恰恰相反各种保密的数据随时面临着被盗取和篡改的危险所以鲁棒性是十分重要的此时隐藏数据量的要求居于次要地位图1 1原始图像图1 2嵌入密钥的图像 1 3数字水印概述水印可以追溯到德语词汇 wassermarke 纸水印在1282年出现在意大利这些最早的水印是通过纸模中加细线模板制造出来了在有细线的区域纸更透明更薄早期的功能是识别纸的制造商到18世纪欧洲和美国制造的产品中纸水印用于纸币和其他文件的防伪对于数字水印 DigitalWatermarking 不同的人有不同的理解但一般而言数字水印就是不可觉察地将秘密信息嵌入载体信号来传送秘密数据将信息嵌入到其他对象信号的过程称为嵌入水印数字水印经常用于版权保护和拷贝保护其主要应用于图像视频的版权保护其中拷贝保护是指限制或禁止未授权的保护拷贝保护的最好例子是加密的数字TV广播通过使用许可服务器和访问控制来保护软件的合法使用版权保护是将版权信息插入到数字对象而对数字对象的质量没有任何损害当产生数字对象的版权纠纷时可以从数字对象中提取嵌入信息来证明数字对象的所有者它可以广泛用于未授权复本的追踪关于水印最原始的论文是在13世纪由于许多摄影师并不十分信任非可见水印所以目前的可见水印都是将自己独特的标识直接嵌入到载体之上在17世纪法国ClaudeLorrain引入了水印方法来保护自己的版权在1710年英国引入了版权法我们可以通过一个例子来说明如何进行版权保护 Alice是版权的所有者它将自己的水印信息嵌入了载体对象锁定了原载体并开始销售带有水印的图像 Bob试图将自己的水印嵌入到Alice处理过的伪装载体然后锁定再次嵌入水印的图像并进行销售为了证明图像的所有者 Alice和Bob都能提取相应的水印来证明自己是拥有者从前面的叙述中可知 Alice的销售图像中只拥有自己的水印而Bob销售的图像中还包含Alice的水印这是否就可以表明 Bob不是销售图像的所有者但是情况并非如此简单在各种不同的水印方案中 Bob可以在Alice原销售图像中也加入自己的水印使问题混淆这种攻击称为倒置攻击 inversionattack 或死锁攻击 deadlockattack 版权保护是需要设计相应的安全协议来针对此类情况进行保护的但到目前为止还没有开发这样的安全协议来解决上述问题下面给出数字水印的例子第一个例子是可见水印如图1 3所示可见水印一般是强鲁棒性水印一般用于保护图像的所有者的版权 2 3 1数字水印系统数字水印技术是指将特定的信息像所有者商标数字签名嵌入到载体中来证明对载体的所有权等载体信息可以是任何多媒体数据数字水印系统包括水印的嵌入和检测提取过程数字水印系统的一般构成如图2 7所示图2 7 a 为水印嵌入功能是将水印嵌入到载体数据中图2 7 b 为水印检测功能是判断是否含有指定的水印并对水印可信度进行测量 a 嵌入水印 b 水印检测图2 7数字水印的一般系统在数字水印的一般系统中可以将数字水印统一表示为表示水印域典型水印模型可以用六元组表示表示载体即被保护多媒体的集合是水印的集合是水印密钥的集合表示用密钥与载体生成的水印的算法水印嵌入算法我们在第6章中将详细讲解表示将水印嵌入的算法一般还可以描述为也就是嵌入有加法规则和乘法规则为检测算法可以用二值判定来判断水印的有无 2 3 2数字水印隐写术与加密术的区别加密是保护消息的内容隐写术是隐藏信息的存在我们在1 2节中已经详细讨论了隐写术而水印非常强调针对各种攻击所具有的鲁棒性而且并不总是将版权水印进行隐藏有时一些数字水印系统使用的是可见数字水印但通常指的水印都是不可见水印不可见水印应用的范围非常广泛常见的可见水印一般都是视觉模式如公司标识或版权标记出现在数字图像之上来指明数字图像的所有者数字水印和隐写术作为信息隐藏的最重要的两类应用可以使用相同的技术但也存在着差异针对隐藏目的而言数字水印是为了证明载体的版权所有或验证其完整性隐写术则是为了将隐体信息通过公开的载体信道秘密传递给接收方针对载体和隐体而言数字水印的载体是特定的数字作品隐体是特定的版权标识或作品摘要二者对攻击者而言目标是确定的隐写术的载体是类似随机的越普通越具有隐匿性而且隐体的类型是不确定的针对保护对象而言数字水印中隐体的存在是为了保护载体隐写术中载体的存在是为了掩护隐体信息的传输针对隐藏方法而言鲁棒性数字水印要求隐体的嵌入是鲁棒和难以去除的信息隐匿则只要能保证其隐秘和安全不关心鲁棒性针对隐藏时效性而言数字水印要求隐体的存在是长效的而隐写术则只要求隐体在隐匿通信过程中存在即可基本是一次一隐针对隐藏容量而言数字水印只要能证明版权或验证完整性即可对容量要求不大而隐写术可能需要传输的是电子文档或军事情报容量要求较大针对提取要求而言数字水印允许一定的误差存在隐写术则因为隐体信息的重要性不允许有任何提取错误发生 2 3 3数字水印的分类针对于各种不同类型的水印技术数字水印的分类方式有许多种因为数字水印系统涉及不同的领域主要是信号处理和计算机安全和背景所以可以按照嵌入的载体嵌入的方法算法的鲁棒性嵌入水印是否可见嵌入水印个数的多少嵌入算法是否可逆或无损等不同指标进行分类数字水印依据所嵌入的载体进行分类主要分为图像水印音频水印视频水印和文本水印等按照水印嵌入域数字水印可分为空域水印变换域水印和压缩域水印按水印抗攻击能力分类图像数字水印可分为鲁棒性水印脆弱性数字水印半脆弱性水印按嵌入的方法可以分为全盲水印半盲水印和非盲水印按嵌入的水印是否可见可分为可见水印和不可见水印按水印是否可逆可分为可逆水印和不可逆水印按水印是单个还是多个可分为多重水印和单水印按照所选水印的意义可分为无含义水印和有含义水印另外还有公开水印私密水印和对称水印这种分类方式是根据在嵌入阶段生成随机序列时所采用的Key类型不同而划分的如是公钥则称为公开水印如是私钥则称为私密水印如果采用的是对称密钥则称为对称水印因为使用不同的技术和算法所以水印的分类大致如上所述下面介绍数字水印的特性 2 3 4数字水印的特性与术语数字水印系统一般要具有一定的特性才能保证数字产品版权保护和完整性鉴定数字水印系统一般的特性如下所述 1 不可觉察性 imperceptibility 在数字水印中很注重高保真度也就是说嵌入水印的载体与原始载体必须非常接近水印的嵌入不能引起宿主媒介质量的很大变化 2 鲁棒性 robustness 并不是所有的数字水印系统都要求这个特性只有鲁棒性水印系统要求将对宿主进行空间滤波有损压缩打印扫描以及旋转平移等各种操作时水印不会去除 3 安全性 security 数字水印系统应该对非法提取具有很强的免疫力对抗未授权的删除嵌入和检测从而保护数字产品一般都使用密码术的经典算法来保证密钥的安全 4 密钥的唯一性不同的密钥应产生不同的水印 5 嵌入的有效性嵌入的水印能提取出来的概率 6 虚警率实际不含水印的产品检测出有水印的概率数字水印系统中常用的术语如下所述 1 宿主信号 cover signal 也就是想嵌入秘密信息的载体信号一般指音频图像视频等可视信号 2 水印 watermark mark 加入到宿主信号中的秘密信息 3 有效载荷 payload 指在单位时间内水印编码的比特数 4 水印访问单元 watermark access unit 宿主信号中的最小部分在这个单元可以可靠地检测并提取有效载荷 5 容量 capacity 水印访问单元能负载的有效载荷的比特数量 6 水印方案 watermarking scheme 嵌入和提取所需要的算法集合 7 嵌入密钥 embedding key 嵌入标识所使用的密钥 8 提取密钥 extraction key 用于检测或提取水印的密钥对称水印算法在嵌入和提取时需要相同的密钥不对称水印算法使用私钥嵌入水印信息使用公钥提取水印同时通过公钥不能计算出私钥 9 非盲方案 non blindscheme 是指在从测试宿主信号中提取水印时需要提取密钥和原不含水印宿主信号的方案 10 半盲方案 semi blind scheme 是指在从测试宿主信号中提取水印时需要提取密钥但不需要原不含水印宿主信号的方案 11 盲方案 blindscheme 是指在从测试宿主信号中提取水印时既不需要提取密钥也不需要原不含水印宿主信号的方案 12 I类方案 type I scheme 这种方案是指检测器提取器的输出是有效载荷或在被检测宿主信号中有意义的标识 13 II类方案 type II scheme 这类方案需要在检测信号时被嵌入水印的知识这种方案只给出是否存在水印的结论 2 4本章小结 1 给出了信息隐藏的基本原理并尽量将基本术语统一化 2 详细给出了隐写术的三个基本协议 3 根据不同的分类依据介绍了各种载体的隐写过程 4 介绍了数字水印系统区分了数字水印与隐写术之间的差异 5 给出了水印系统的特性可以根据这些特性来判定相应的系统是否适用于具体的应用 2 5复习题 2 1隐写术的基本原理是什么 2 2信息隐藏的分支都包括什么 2 3你使用过信息隐藏吗你想象的信息隐藏应具有哪些特性 2 4请描述一下数字水印系统在现实生活中你知道具体实用的数字水印系统吗 2 5数字水印与隐写术间存在哪些相似之处又有什么不同 2 6数字水印都有哪些特性与隐写术要求相同吗 2 7通过因特网可以搜索到数字水印和隐写术的内容有时间自学一下

展开阅读全文

信息隐藏基本原理.ppt

最新文档