资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,Linux操作系统内核原理,Linux操作系统内核原理,Linux系统结构,计算机硬件,体系结构相关代码,进程管理,内存管理,文件系统,模块,模块,接口,设备,驱动,驱动,接口,系统调用,应用程序,标准函数库,kernel,Linux系统结构计算机硬件体系结构相关代码进程管理内存管理,Linux系统执行框架,地址空间,内核功能函数,内核线程1,内核线程2,内核线程3,内核线程4,内核线程5,内核线程n,进程1,进程2,进程3,进程n,用户态,内核态,Linux系统执行框架地址空间内核功能函数内核线程1内核线程,进程和线程的区别,线程是系统最小的执行流单位,一个线程就是一个,执行过程,,是任务调度的基本单位。,进程是线程和资源的,容器,,一个以上的线程组成一个进程,在同一个进程中的线程共享进程资源。,资源,线程1,线程2,线程n,进程和线程的区别线程是系统最小的执行流单位,一个线程就是一个,Linux内核进程和线程表示,Linux现行内核淡化了进程和线程的关系,原则上不区分进程和线程。,在Linux内核中使用(struct task_struct)表示一个任务(Linux中称为进程,也可以称为线程),多个 task_struct 共享资源和进程空间,实际就构成了一个进程(线程组),这些task_struct实际就是这个进程的线程,通常在Linux书上将task_struct直接就称为一个进程。,Linux内核进程和线程表示Linux现行内核淡化了进程和线,Linux内核进程和线程表示,tasks,tasks,tasks,tasks,tasks,进程1,进程2,进程3,创建进程有几个函数fork exec clone,struct list_head*group_leader,struct list_head thread_group,Linux内核进程和线程表示taskstaskstaskst,Linux进程组织关系,init,子进程1,子进程2,子进程3,子进程4,子进程5,子进程6,父进程,children,子进程,slibing,子进程,slibing,子进程,slibing,通过pstree命令可以显示出进程树,Linux进程组织关系init子进程1子进程2子进程3子进程,比较Windows进程线程管理,Windows进程使用KPROCESS表示进程对象,能够通过句柄单独操作进程对象,线程是通过ETHREAD线程块来表示,多个线程块链接到KPROCESS的执行体线程块链表头上。(结构如下图),KPROCESS,ETHREAD,ETHREAD,ETHREAD,比较Windows进程线程管理Windows进程使用KPRO,任务调度,在多任务系统中,任务调度很重要,调度策略决定了系统最终性能和功能。,任务调度有多种策略,,比如基于优先级的调度,ucOS-II上就是这种,谁的优先级高就谁占有CPU,还有基于时间片的,一个任务执行时间结束的就执行下一个,任务调度在多任务系统中,任务调度很重要,调度策略决定了系统最,调度过程,中断或异常,进入关中断执行区,保存中断前所有的寄存器的内容到SP,原则上是保存程序使用的所有寄存器,a0-a4,v0-v1,EPC,将当前的SP保存到任务结构体上,任务状态段TSS,任务上下文,通过调度器策略算法求得下一个要执行的任务,从任务结构体上取下SP指针,从SP上恢复所有的寄存器的内容,打开中断并返回恢复的位置执行,调度过程中断或异常进入关中断执行区保存中断前所有的寄存器的内,进程切换,对于多进程系统,任务调度的过程中伴随进程切换,从真实的一个进程切换到另外一个不共享资源的进程,虚拟内存地址映射表(PGD)必须进行切换,还有其它资源数据也需要跟着切换。,进程切换通常比较耗时,效率很低,需要执行切换TLB,回写Cache等低效率操作。,进程切换对于多进程系统,任务调度的过程中伴随进程切换,从真实,Linux多线程机制,原子操作,自旋锁,信号量,读写锁,互斥量,线程A,线程B,a=i,i=0,a=i,i=1,临界区,Linux多线程机制原子操作线程A线程Ba=ii=0,死锁,所谓死锁:是指两个或两个以上的进程在执行过程中,因争夺资源而造成的一种互相等待的现象;表现为程序假死,不再被调度。,避免死锁有 银行家算法,获取B资源,获取A资源,获取A资源,获取B资源,任务A,任务B,死锁所谓死锁:是指两个或两个以上的进程在执行过程中,因争夺,优先级反转,高优先级任务需要等待低优先级任务释放资源,而低优先级任务又正在等待中等优先级任务的现象叫做优先级反转。此时高优先级任务和中等优先级任务之间没有任何共享资源但执行顺序却发生了倒置,这种情况称为优先级反转,而高优先级任务因为等待低优先级任务释放资源而阻塞的情况则不称为优先级反转,优先级反转高优先级任务需要等待低优先级任务释放资源,而低优先,优先级反转,任务1,任务2,任务3,获取资源,释放资源,获取资源,后果,任务1将一直等待任务2运行完才能运行,实时性差,优先级反转任务1任务2任务3获取资源释放资源获取资源后果,任,消除优先级反转,优先级继承策略:继承现有被阻塞任务的最高优先级作为其优先级,任务退出临界区,恢复初始优先级;Linux内核的实时互斥量就是使用这个策略。,优先级天花板策略(封顶策略):指将申请(占有)某资源的任务的优先级提升到可能访问该资源的所有任务中最高优先级任务的优先级;ucOS的互斥量就是使用这个策略。,消除优先级反转优先级继承策略:继承现有被阻塞任务的最高优先级,Linux内存管理,Linux进程空间使用虚拟存储空间方式管理的(通过MMU部件将离散的物理地址拼接成连续的虚拟地址空间)(ucLinux除外),Linux内核使用伙伴管理页式内存,并在伙伴的基础上发展了slab/slob/slub算法,用于内核小内存的分配,以弥补页式分配浪费内存的不足,Linux内存管理Linux进程空间使用虚拟存储空间方式管理,Linux进程虚存空间划分,操作系统内核,环境变量,参数,堆栈,数据(BSS),数据,代码,4G,3G,0,0 xC0000000,0 x00000000,_end,_edata,_etext,内核区,用户区,Linux进程虚存空间划分操作系统内核环境变量参数堆栈数据(,Linux内存空间数据结构表示,mm,count,mmap,pgd,页目录表,mm_struct,vm_start,vm_end,vm_ops,vm_next,vm_start,vm_end,vm_ops,vm_next,vm_area_struct,vm_area_struct,task_struct,vm_start,vm_end,vm_ops,vm_next,vm_area_struct,open,close,nopage,swapin,swaout,vm_operatio,ns_struct,open,close,nopage,swapin,swaout,vm_operatio,ns_struct,虚存区,虚存区,进程虚存空间,Linux内存空间数据结构表示mmcountmmappgd页,分页式内存管理,Linux系统中使用了同时用于64位和32位系统的通用分页模型。,模型中使用四级页表,32位系统只使用PGD和PTE两项,页全局目录PGD,页上级目录PUD,页中级目录PMD,页表PTE,页内偏移,线性地址 64位,cr3,页框,分页式内存管理Linux系统中使用了同时用于64位和32位系,Linux物理内存管理,Linux内核为了适应不同的硬件架构,对不同性能的内存分成不同的节点(Node),内存模型如下图:,pg_data_t,内存节点,node_zones,ZONE_NORMAL,ZONE_DMA,ZONE_HIGHMEM,zone,zone_mem_map,zone_mem_map,page,page,page,page,page,page,zone_mem_map,ZONE_DMA,ZONE_NORMAL,ZONE_HIGHMEM,16M,896M,PC i386,Linux物理内存管理Linux内核为了适应不同的硬件架构,,物理页面管理,物理页面使用伙伴(Buddy)算法进行管理,算法核心是将页面按 1,2,4,8,16,2,i,个连续页进行分割,放在11个链表上,i也就是通常所说的order;,order6,order5,order4,order3,order2,order1,order0,free_area,page,page,page,page,page,page,例如分配一个页面,直接到order0上找,,如果order0上没有空闲页面了,那么就到,order1上找,(1)如果order1上有空闲块,,那么就将这个双页分成两个单页,一个,分配出去,一个挂到order0的链表上。,(2)如果order1没有空闲块,就到order2上找,,如果找到空闲块,那么就将这块分割为,2:1:1的页面 2的页面挂回order1,1的挂,一个回order0,另外一个来分配,物理页面管理物理页面使用伙伴(Buddy)算法进行管理ord,order2,要申请一个order0的页面,order1,order1,order0,order1,order0,order0,order1,order2要申请一个order0的页面order1orde,slab分配器,因为基于Buddy算法的内存管理,只能精确到页面大小,对于内核中需要大量申请的小内存块,为了满足这个需求,在Buddy的基础上增加了slab分配器,cache_chain,kmem_cache,kmem_cache,kmem_cache,slabs_full,slabs_partial,slabs_empty,head,tail,slab,slab,slab,slab,slab,page,page,page,page,page,object,object,object,slab分配器因为基于Buddy算法的内存管理,只能精确到页,Linux文件系统核心VFS,VFS(虚拟文件系统)为具体文件系统提供抽象出一组通用的接口来表示具体的文件系统。,万物皆文件,硬件设备也是文件,VFS包含下面几种数据类型,file_system_type 文件系统类型,vfsmount 挂在点对象,也就是文件系统类型实例,super_block 超级块,描述文件系统的控制信息、参数等,inode 索引节点,保存文件的相关信息,是文件的元数据,dentry 目录项,就是文件夹,file 文件对象,file_struct 打开的文件对象,Linux文件系统核心VFSVFS(虚拟文件系统)为具体文件,VFS各数据对象之间的关系,s_files,super_block,f_op,f_dentry,f_op,f_dentry,f_op,f_dentry,超级块上各打开文件的file实例,d_inode,d_sb,dentry_operations,d_ops,NAME,i_op,i_dentry,i_fop,i_sb,inode,inode_operations,file_operations,task_struct,files,files_struct,VFS各数据对象之间的关系s_filessuper_bloc,The End,The End,此课件下载可自行编辑修改,仅供参考!感谢您的支持,我们努力做得更好!谢谢,此课件下载可自行编辑修改,仅供参考!感谢您的支持,我们努力,
展开阅读全文