资源描述
文件系统 实验报告一、 实验目的了解操作系统中文件系统的原理以及实现方法。二、 实验方法通过FAT12文件系统的解读,了解文件系统的原理和实现。三、 实验任务通过对FAT12文件系统的了解,编写程序,读取并列出一个虚拟软盘中文件信息(文件名、属性、修改时间等),以及读取其中的文件内容四、 实验要点FAT12文件系统的了解,Linux系统下文件读写相关系统调用。五、 实验过程1. FAT12 文件系统分析簇是操作系统分配文件空间的基本单位,簇由若干个扇区组成。在FAT12文件系统中,簇号的有效位是12位,所以这种文件系统就被称为FAT12。FAT12文件系统中大致可以分成五个区,这五个区为:起始扇区占用扇区起始地址结束地址分区010x000000000x000001FF引导区190x000002000x000013FFFAT区1090x000014000x000025FFFAT备份区19120x000026000x00003DFF根目录区31-0x00003E00-文件数据区其中,引导区中储存着一些基本的信息。例如,0x0000000B和0x0000000C两个字节保存着每个扇区的大小,0x0000000D保存着每个簇占用多少个扇区。FAT区中储存着簇号。在0x00000200开始的三个字节,分别储存设备类型标记(0xF0为软盘);第二个第三个字节均为0xFF,是FAT标识符。在FAT12文件系统中,每个簇占用12位,即1.5个字节。簇号与地址的对应关系如下表:地址偏移000001002003004005簇序号000001002003一个簇号跨越两个字节,每次读取簇号时读取两个字节,然后对读出的两个字节进行位运算处理,得到下一簇的簇序号。注意,这里同样需要对高低位进行处理,即使用位计算的方式提取相应的簇号信息。根据上述的原理,可以得出一个函数,以一个簇号为参数,返回值为文件下一个簇号。代码如下:int getNextClutserId(FILE *fp, short clusterId)unsigned short tmp, low = 0, high = 0;int address = (clusterId * 3 / 2) + 0x0000200;fseek(fp, address, SEEK_SET);fread(void *)(&tmp), 1, sizeof(unsigned short), fp);low = (tmp & 0xFFF0) 4);high = tmp & 0x0FFF;return (clusterId % 2 = 0 ? high : low);其中,fp 是用于读取文件系统的文件流,clusterID是当前簇号,返回值是下一个簇号。函数体的第二句代码,计算出当前簇号对应的地址,用于文件指针的定位。第三句代码是根据第二句计算得到的地址对文件指针进行定位,定位到当前簇号所对应的信息处。第四句代码是从文件指针的位置为起始位置读入两个字节的内容(fread会自动对高低字节位进行处理)。并把这两个字节的信息储存到tmp变量之中。例如,读取002簇号的下一个簇号,根据公式,计算得到的address是0x00000203,读取到0x00000203和0x00000204两个字节的内容。我们需要的是0x00000203整个字节的内容和0x00000204的高四位,所以需要跟0xFFF0进行位与运算,并向右移四位,得到下一个簇号。同样地,读取003簇号的下一个簇号,根据公式,计算得到的address是0x00000204,读取到0x00000204和0x00000205两个字节的内容,我们需要的是0x00000205整个字节的内容和0x00000204第四位的内容,所以需要跟0x0FFF进行位与运算,得到下一个簇号。所以代码中需要对簇号的奇偶性进行判断,跟根据奇偶性的不同返回不同的值。在根目录中,保存着根目录下面的文件或文件夹的信息。每个文件或者文件夹的信息使用32个字节保存。这些内容的含义如下表:地址0123456789ABCDEF内容文件名扩展名属性保留位地址0123456789ABCDEF内容保留位时间日期首簇号文件大小这里可以看出点问题,FAT中采用4个字节保存文件的大小,也就是说,文件的大小不能超过232字节,也就是4G;文件名和扩展名采用了固定长度,分别为8和3,太长的文件名在FAT中是不允许的。其中,文件名的第一个字节还有其他的意义,例如,当文件名的第一个字节为0x00时,表示这一项没有文件;为0xE5时,则表示这个文件已经被删除,在编码时应该忽略这个文件。文件的属性采用一个字节,也就是8个位来表示文件的6种属性,最高两位是保留位,没有实际意义。这个字节的定义为:位76543210属性保留保留归档目录卷标系统隐藏只读在列出文件列表时,对各个位进行位与运算以后,对结果进行判断,从而得出相应的属性值,根据上表,可以得出一个函数,参数是表示文件属性的那个字节,返回值是一个以字符方式显示文件属性的一个字符串char *formatAttribute(char attribute)char *result = (char *)malloc(sizeof(char)* 7);result0 = (attribute & 0x01) = 0x01) ? r : -;result1 = (attribute & 0x02) = 0x02) ? h : -;result2 = (attribute & 0x04) = 0x04) ? s : -;result3 = (attribute & 0x08) = 0x08) ? l : -;result4 = (attribute & 0x10) = 0x10) ? d : -;result5 = (attribute & 0x20) = 0x20) ? f : -;result6 = 0;return result;因为文件属性有6种,需要6个字符分别存放六种属性,第7位则用于储存字符串的结束标记0,确保输出的时候不会产生乱码。这个函数代码是通过位与运算对文件的各个属性进行判断,并在相应的字符位用字符或者-填充,最后把字符串返回。时间和日期都采用的是压缩储存,储存时间两个字节的各位含义如下:位1514131211109876543210时(0-23)分(0-59)两秒(0-29)储存日期两个字节的各位含义如下:位1514131211109876543210距离1980年的年数(0-119)月(1-12)日(1-31)注:日期和时间都需要对高低字节进行交换然后再读取。实验中使用fread方法会自动进行交换。根据上面的原理,可以得出这样的一个函数,这个函数以表示日期和时间的两个原始值作为参数输入,返回的是一个格式形如”xxxx-xx-xx xx:xx:xx”的字符串,这个函数的代码如下:char *formatDatetime(short date, short time)int year, month, day, hour, minute, second;char *result = (char *)malloc(sizeof(char)* 20);year = 1980 + (date & 0xE000) 9);month = (date & 0x01E0) 5);day = (date & 0x001F);hour = (time & 0xF800) 11);minute = (time & 0x07E0) 5);second = (time & 0x001F) size是file_content中表示文件大小的一个整型变量,用于计算文件夹中最大文件数量,newInfo是一个file_info结构体的指针,用于储存读取到的文件信息原始值。先把一个文件信息的原始信息从文件内容中提取出来,为此,可以实现内存复制的函数,代码如下:int copyTo(void *desc, void *src, int size)int counter = 0, i;for (i = 0; i filename0 != (char)0xE5 & newInfo-filename0 != (char)0x00) file_list_new_info(newInfo, &newId, &newInfoNode);if (newInfo-attributes & 0x10) = 0x10)if (newInfo-filename0 = .) continue;char *buffer = (char *)malloc(sizeof(char)* 9);int j;for (j = 0; j filenamej != (char)0x20; j+)bufferj = newInfo-filenamej;bufferj = 0;queue_new_task(buffer, 0, 0, newInfo-pos);这是放在一个for循环中的代码,先通过文件名判断这个文件是否存在,如果存在,则把文件信息添加到程序的文件信息链表之中。再则判断是否是目录,如果是目录,则把这个目录添加到队列之中。2. 文件储存方式FAT文件系统对空间的分配和管理是以簇为基本单位的。所以,一个逻辑上连续的文件可能会被分散地储存在磁盘的各个位置。操作系统输出文件时,遵循下面的步骤:1. 会先通过文件夹信息找到文件首簇号。2. 根据文件的首簇号,定位到FAT区相应位置;读出下一个簇的簇号。3. 如果下一个簇的簇号不是结束标记(0xFFF),则会根据读出的下一个簇号定位,读出簇里面的内容。如果读出的是结束标记,则表示文件已经读取完成。假如一个文件被分散储存在0x012,0x022,0x302三个簇里。从目录的信息中读出首簇号0x012,读出0x012簇里的内容;然后再通过0x012这个簇号在FAT区中找到下一个簇号0x022,读出0x022的内容;再通过0x022这个簇号找到下一个簇号0x302,读出0x302中的内容;再通过0x302读出下一个簇号的内容,此时,读出的簇号为0xFFF,即表示这个文件已经结束。本实验中,读取文件的具体实现方法如下:1. 通过一个链表,将这个文件的所有簇号储存起来。2. 遍历储存簇号的链表,逐个逐个簇读取出来并储存到内存之中,返回之。下面是读取文件的实现所需要的一些数据结构:struct int_linked_list int data;struct int_linked_list *next;struct file_content struct int_linked_list *curList;void *content;int size;char *filename;其中,int_linked_list是一个储存整型的链表,file_content是一个用于保存读出文件内容和文件信息的结构体。遍历链表的过程中,通过一个while循环实现,把读取到簇号添加到链表之中。具体实现代码如下,tail为保存簇号链表的末尾结点指针,fp是用于读取文件的文件指针,curConnt是一个用于统计文件簇数的变量,便于后续步骤分配内存空间使用,下文同:while (clusterId = getNextClutserId(fp, clusterId) != 0x00000FFF)curCount+;tail-next = (struct int_linked_list *)malloc(sizeof(struct int_linked_list);tail-next-data = clusterId;tail-next-next = NULL;tail = tail-next;把簇号读取完毕以后,开始对文件内容进行读取,下面是文件内容读取的具体实现代码,下面代码中的content是一个指向用于存放文件内容的内存空间的指针变量:content-size = curCount * 512;content-content = malloc(content-size);struct int_linked_list *ptr = head;int i = 0, address = 0xFFFFFFF;for (ptr = head; ptr != NULL; ptr = ptr-next, i+)address = 0x00003E00 + (512 * ptr-data);fseek(fp, address, SEEK_SET);fread(void *)(char *)(content-content) + (512 * i), 512, 1, fp);在for循环的第一句代码之中,通过簇号对簇所在的地址进行计算,把地址值储存到address变量之中;第二句代码则是通过上一步计算得到的address变量对文件指针进行定位,第三句是通过fread方法把文件内容读入到内存之中。六、 实验结论1. FAT12文件系统中,把磁盘划分成引导区、FAT区、FAT备份区、根目录区和文件数据区。2. 除了根目录以外,文件系统把每个文件夹都当成是一个特殊的文件进行处理。3. FAT12文件系统通过簇进行空间的管理和分配。七、 完整实验代码/* 操作系统课程 实验* FAT12 文件系统 实验代码* 虽然这个程序在 Windows 和 Linux 环境下都能运行。* 不过,在 Windows 环境下运行的话,显示文件内容的时候,内容的末尾会有几个奇怪的字符。* Linux 环境下完全没问题* 暂时推测是 Windows 控制台的原因,Windows 控制台会把一些非字符的 ASCII 显示为奇怪的字符,* 例如,0x0A 会显示成一个笑脸,Linux 的控制台下不会对这些非字符的 ASCII 进行处理* 我是今天早上才发现这个问题的阿 ()* 注意:编译前,需要把 IMAGE_FILE 那个宏定义改成公邮上面的那个 IMG 文件;* Linux 下打开这个源码文件注释会变成乱码*/ 这个定义只是为了程序能在 VS2013 下面正常编译而已#ifdef _WIN32#define _CRT_SECURE_NO_WARNINGS#endif#include #include #include #ifdef _WIN32#include #endif#define OK 0x00000000#define MESSAGE_FILE_NOT_FOUND 0xE0000404#define ERROR_MALLOC_FAILED 0xF0000001#define ERROR_IO_ERROR 0xF0000002/ 这里改路径 #define IMAGE_FILE /home/user/DOS622.IMG/ 这里改路径 /* 这里是结构体的定义 */ 这里是文件信息struct file_info char filename8;char extname3;char attributes;char reserved10;short time;short date;short pos;int size;struct file_info_node int id;struct file_info *info;struct file_info_node *next;/ 这里是储存文件夹信息struct folder_info char *filename;int fileBeginIndex, fileEndIndex;struct file_info_node *beginFile, *endFile;struct folder_info *next;/ 这里是一个队列,用于迭代方式遍历文件系统的一个中间变量struct queue_info char *filename;int offset, size, cluster;struct queue_info *next;/ 一个整数链表结构struct int_linked_list int data;struct int_linked_list *next;/ 这里是一个文件结构,表示内容,可以读取文件的其中一段,也可以通过簇的方式完整读入整个文件struct file_content struct int_linked_list *curList;void *content;int size;char *filename;/* 这里是全局变量的定义 */struct file_info_node *file_list_head, *file_list_tail;struct folder_info *folder_info_head, *folder_info_tail;struct queue_info *queue_head, *queue_tail;char decToHex16 = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F ;/* 这里是函数的定义 */int file_list_init();int file_list_new_info(struct file_info *info, int *id, struct file_info_node *newInfoNode);int folder_info_init();int folder_info_new_info(struct folder_info *info);int queue_init();int queue_new_task(char *filename, int offset, int size, int cluster);struct queue_info *queue_get_task();int process_task(struct queue_info* info);struct file_content* readContentFromFixedSection(FILE *fp, int offset, int size);struct file_content* readContentFromCluster(FILE *fp, short clusterId, int isFolder, int *size);struct file_content* find_file_by_id(FILE *fp, int id, int *errCode);int process_file_content(struct file_content* content, struct queue_info *info);int getNextClutserId(FILE *fp, short clusterId);int copyTo(void *desc, void *src, int size);void print_all_list();void print_file_content(struct file_content *content);char *formatIndex(int i);char *formatClustNo(int i);char *formatFileName(char *filename, char *ext);char *formatAttribute(char attribute);char *formatDatetime(short date, short time);char *formatSize(int size, int rightAlign);/* 主函数 */int main(int argc, char *args)struct queue_info *task = NULL;int choose, status;FILE *fp = fopen(IMAGE_FILE, r);struct file_content *content;char tmp;if (fp = NULL)return 1;getNextClutserId(fopen(IMAGE_FILE, r), 2);queue_init();queue_new_task(Root, 0x00002600, 6144, 0);while (task = queue_get_task() != NULL)process_task(task);print_all_list();fflush(stdin);printf(nThe Number of File you want to view (enter -1 to exit): );scanf(%d, &choose);content = find_file_by_id(fp, choose, &status);if (status = MESSAGE_FILE_NOT_FOUND)printf(Invaild Number, please input again!n);return 0;elseif (content != NULL)print_file_content(content);return 0;int process_task(struct queue_info* info)FILE *fp;struct file_content* content = NULL;int size = 0;fp = fopen(IMAGE_FILE, r);if (fp = NULL)return ERROR_IO_ERROR;/ 判断是否对根目录进行读取if (info-offset = 0x00002600)content = readContentFromFixedSection(fp, info-offset, info-size);elsecontent = readContentFromCluster(fp, info-cluster, 1, &size);info-size = size;process_file_content(content, info);fclose(fp);return OK;int process_file_content(struct file_content* content, struct queue_info *info)struct folder_info *node = (struct folder_info *)malloc(sizeof(struct folder_info);struct file_info *newInfo = NULL;struct file_info_node *newInfoNode = NULL;char *content_char = (char *)content-content;int newId = -1, fileCount = 0;if (node = NULL)return ERROR_MALLOC_FAILED;node-filename = info-filename;/ 根据大小计算目录中的文件数量int maxFile = content-size / 32, i;for (i = 0; i filename0 != (char)0xE5 & newInfo-filename0 != (char)0x00) file_list_new_info(newInfo, &newId, &newInfoNode);if (newInfo-attributes & 0x10) = 0x10)if (newInfo-filename0 = .)continue;char *buffer = (char *)malloc(sizeof(char)* 9);int j;for (j = 0; j filenamej != (char)0x20; j+)bufferj = newInfo-filenamej;bufferj = 0;queue_new_task(buffer, 0, 0, newInfo-pos);if (0 = fileCount)node-fileBeginIndex = newId;node-beginFile = newInfoNode;fileCount+;node-fileEndIndex = file_list_tail-id;node-endFile = file_list_tail;folder_info_new_info(node);return OK;int copyTo(void *desc, void *src, int size)int counter = 0, i;for (i = 0; i info = info;newNode-next = NULL;if (file_list_head = NULL)newNode-id = 1;file_list_head = newNode;file_list_tail = newNode;elsenewNode-id = file_list_tail-id + 1;file_list_tail-next = newNode;file_list_tail = newNode;*newInfoNode = newNode;*id = newNode-id;return OK;int folder_info_init()folder_info_head = folder_info_tail = NULL;return OK;int folder_info_new_info(struct folder_info *info)if (info = NULL)return OK;if (folder_info_head = NULL)info-next = NULL;folder_info_head = info;folder_info_tail = info;elseinfo-next = NULL;folder_info_tail-next = info;folder_info_tail = info;return OK;int queue_init()queue_head = queue_tail = NULL;return OK;int queue_new_task(char *filename, int offset, int size, int cluster)struct queue_info *newNode = (struct queue_info *)malloc(sizeof(struct queue_info);if (newNode = NULL)return ERROR_MALLOC_FAILED;newNode-filename = filename;newNode-offset = offset;newNode-size = size;newNode-cluster = cluster;newNode-next = NULL;if (queue_head = NULL)queue_head = queue_tail = newNode;elsequeue_tail-next = newNode;queue_tail = newNode;return OK;struct queue_info *queue_get_task()struct queue_info *retValue = queue_head;if (queue_head = NULL)return NULL;if (queue_head = queue_tail)queue_tail = NULL;queue_head = queue_head-next;retValue-next = NULL;return retValue;struct file_content* readContentFromFixedSection(FILE *fp, int offset, int size)if (fp = NULL)return NULL;struct file_content *retValue = (struct file_content *)malloc(sizeof(struct file_content);if (retValue = NULL)return NULL;retValue-curList = NULL;retValue-size = size;retValue-content = malloc(size);if (retValue-content = NULL)free(retValue);return NULL;fseek(fp, offset, SEEK_SET);fread(retValue-content, size, 1, fp);return retValue;struct file_content* readContentFromCluster(FILE *fp, short clusterId, int isFolder, int *size)int curCount = 1;struct file_content *content = (struct file_content *)malloc(sizeof(struct file_content);if (content = NULL)return NULL;/ 第一步:迭代寻找所有簇号content-curList = (struct int_linked_list *)malloc(sizeof(struct int_linked_list);if (content-curList = NULL)return NULL;struct int_linked_list *head = content-curList, *tail = head;head-data = clusterId;head-next = NULL;while (clusterId = getNextClutserId(fp, clusterId) != 0x00000FFF)curCount+;tail-next = (struct int_linked_list *)malloc(sizeof(struct int_linked_list);tail-next-data = clusterId;tail-next-next = NULL;tail = tail-next;/ 第二步:开始根据簇号读取content-size = curCount * 512;content-content = malloc(content-size);struct int_linked_list *ptr = head;int i = 0, address = 0xFFFFFFF;for (ptr = head; ptr != NULL; ptr = ptr-next, i+)address = 0x00003E00 + (512 * ptr-data);fseek(fp, address, SEEK_SET);fread(void *)(char *)(content-content) + (512 * i), 512, 1, fp);if (size != NULL)*size = content-size;return content;struct file_content* find_file_by_id(FILE *fp, int id, int *errCode)if (id fileBeginIndex = id & id fileEndIndex)for (tmp = ptr-beginFile; tmp-id != id & id fileEndIndex; tmp = tmp-next);if (tmp-id = id)node = tmp;break;elseptr = ptr-next;*errCode = (node = NULL ? MESSAGE_FILE_NOT_FOUND : OK);if (node != NULL)content = readContentFromCluster(fp, node-info-pos, 0, NULL);content-size = node-info-size;content-filename = formatFileName(node-info-filename, node-info-extname);return (node = NULL ? NULL : content);int getNextClutserId(FILE *fp, short clusterId)if (clusterId = 0x000000A0)printf();unsigned short tmp;int address = (clusterId * 3 / 2) + 0x0000200;unsigned short low = 0, high = 0;fseek(fp, address, SEEK_SET);fread(void *)(&tmp), 1, sizeof(unsigned short), fp);low = (tmp & 0xFFF0) 4);high = tmp & 0x0FFF;return (clusterId % 2 = 0 ? high : low);void print_all_list() struct folder_info *ptr = folder_info_head;struct file_info_node *node;int index;#ifdef _WIN32system(cls);#elseprintf(0332J);#endiffor (; ptr != NULL; ptr = ptr-next)int count = 0, totalSize = 0;printf(-n);printf( Folder : %sn, ptr-filename);printf(-n);printf( Num | File Name | Type | CLUSTNO | File Change Time | Size n);printf(-n);index = ptr-fileBeginIndex;node = ptr-beginFile;while (node != NULL & node-id fileEndIndex)/ 只是实现不同平台下的变色操作#ifdef _WIN32HANDLE
展开阅读全文