二进制文件的读写对于普通文本要稍微麻烦一些,对二进制文件的读写同样需要打开文件和关闭文件,打开和关闭方式与文本文件相同,只不过需要在打开方式上加上ios::binary以指明以二进制方式进行读写。
C++二进制文件读写对比文本文件的好处:
使用文本方式储存信息比较我浪费空间,也不便于检索,如:一个学籍管理程序需要记录所有学生的学号、姓名、年龄信息,并且能够按照姓名查找学生的信息。程序中可以用一个类来表示学生:
- class CStudent
- {
- char szName[20]; //假设学生姓名不超过19个字符,以 '\0' 结尾
- char szId[l0]; //假设学号为9位,以 '\0' 结尾
- int age; //年龄
- };
Micheal Jackson 110923412 17
Tom Hanks 110923413 18
这种存储方式不但浪费空间,而且查找效率低下。因为每个学生的信息所占用的字节数不同,所以即使文件中的学生信息是按姓名排好序的,要用程序根据名字进行查找仍然没有什么好办法,只能在文件中从头到尾搜索。
如果把全部的学生信息都读入内存并排序后再查找,当然速度会很快,但如果学生数巨大,则把所有学生信息都读人内存可能是不现实的。
可以用二进制的方式来存储学生信息,即把 CStudent 对象直接写入文件。在该文件中,每个学生的信息都占用 sizeof(CStudent) 个字节。对象写入文件后一般称作“记录”。本例中,每个学生都对应于一条记录。该学生记录文件可以按姓名排序,则使用折半查找的效率会很高。
读写二进制文件不能使用前面提到的类似于 cin、cout 从流中读写数据的方法。这时可以调用 ifstream 类和 fstream 类的 read 成员函数从文件中读取数据,调用 ofstream 和 fstream 的 write 成员函数向文件中写入数据。
用 ostream::write 成员函数写文件
ofstream 和 fstream 的 write 成员函数实际上继承自 ostream 类,原型如下:
ostream & write(char* buffer, int count);
该成员函数将内存中 buffer 所指向的 count 个字节的内容写入文件,返回值是对函数所作用的对象的引用,如 obj.write(...) 的返回值就是对 obj 的引用。write 成员函数向文件中写入若干字节,可是调用 write 函数时并没有指定这若干字节要写入文件中的什么位置。那么,write 函数在执行过程中到底把这若干字节写到哪里呢?答案是从文件写指针指向的位置开始写入。
文件写指针是 ofstream 或 fstream 对象内部维护的一个变量。文件刚打开时,文件写指针指向文件的开头(如果以 ios::app 方式打开,则指向文件末尾),用 write 函数写入 n 个字节,写指针指向的位置就向后移动 n 个字节。
下面的程序从键盘输入几名学生的姓名和年龄(输入时,在单独的一行中按 Ctrl+Z 键再按回车键以结束输入。假设学生姓名中都没有空格),并以二进制文件形式存储,成为一个学生记录文件 students.dat。
例子,用二进制文件保存学生记录:
- #include <iostream>
- #include <fstream>
- using namespace std;
- class CStudent
- {
- public:
- char szName[20];
- int age;
- };
- int main()
- {
- CStudent s;
- ofstream outFile("students.dat", ios::out | ios::binary);
- while (cin >> s.szName >> s.age)
- outFile.write((char*)&s, sizeof(s));
- outFile.close();
- return 0;
- }
Tom 60↙
Jack 80↙
Jane 40↙
^Z↙
则形成的 students.dat 为 72 字节,用“记事本”程序打开呈现乱码:
Tom烫烫烫烫烫烫烫烫 Jack烫烫烫烫烫烫烫? Jane烫烫烫烫烫烫烫?
第 13 行指定文件的打开模式是 ios::out|ios::binary,即以二进制写模式打开。在 Windows平台中,用二进制模式打开是必要的,否则可能出错。
第 15 行将 s 对象写入文件。s 的地址就是要写入文件的内存缓冲区的地址。但是 &s 不是 char * 类型,因此要进行强制类型转换。
第 16 行,文件使用完毕一定要关闭,否则程序结束后文件的内容可能不完整。
用 istream::read 成员函数读文件
ifstream 和 fstream 的 read 成员函数实际上继承自 istream 类,原型如下:
istream & read(char* buffer, int count);
该成员函数从文件中读取 count 个字节的内容,存放到 buffer 所指向的内存缓冲区中,返回值是对函数所作用的对象的引用。如果想知道一共成功读取了多少个字节(读到文件尾时,未必能读取 count 个字节),可以在 read 函数执行后立即调用文件流对象的 gcount 成员函数,其返回值就是最近一次 read 函数执行时成功读取的字节数。gcount 是 istream 类的成员函数,原型如下:
int gcount();
read 成员函数从文件读指针指向的位置开始读取若干字节。文件读指针是 ifstream 或 fstream 对象内部维护的一个变量。文件刚打开时,文件读指针指向文件的开头(如果以ios::app 方式打开,则指向文件末尾),用 read 函数读取 n 个字节,读指针指向的位置就向后移动 n 个字节。因此,打开一个文件后连续调用 read 函数,就能将整个文件的内容读取出来。下面的程序将前面创建的学生记录文件 students.dat 的内容读出并显示。
- #include <iostream>
- #include <fstream>
- using namespace std;
- class CStudent
- {
- public:
- char szName[20];
- int age;
- };
- int main()
- {
- CStudent s;
- ifstream inFile("students.dat",ios::in|ios::binary); //二进制读方式打开
- if(!inFile) {
- cout << "error" <<endl;
- return 0;
- }
- while(inFile.read((char *)&s, sizeof(s))) { //一直读到文件结束
- int readedBytes = inFile.gcount(); //看刚才读了多少字节
- cout << s.szName << " " << s.age << endl;
- }
- inFile.close();
- return 0;
- }
Tom 60
Jack 80
Jane 40
第 18 行,判断文件是否已经读完的方法和 while(cin>>n) 类似,归根到底都是因为 istream 类重载了 bool 强制类型转换运算符。
第 19 行只是演示 gcount 函数的用法,删除该行对程序运行结果没有影响。
思考题:关于 students.dat 的两个程序中,如果 CStudent 类的 szName 的定义不是“char szName[20] ”而是“string szName”,是否可以?为什么?
用文件流类的 put 和 get 成员函数读写文件
可以用 ifstream 和 fstream 类的 get 成员函数(继承自 istream 类)从文件中一次读取一个字节,也可以用 ofstream 和 fstream 类的 put 成员函数(继承自 ostream 类) 向文件中一次写入一个字节。
例题:编写一个 mycopy 程序,实现文件复制的功能。用法是在“命令提示符”窗口输入:
mycopy 源文件名 目标文件名
就能将源文件复制到目标文件。例如:mycopy src.dat dest.dat
即将 src.dat 复制到 dest.dat。如果 dest.dat 原本就存在,则原来的文件会被覆盖。解题的基本思路是每次从源文件读取一个字节,然后写入目标文件。程序如下:
- #include <iostream>
- #include <fstream>
- using namespace std;
- int main(int argc, char* argv[])
- {
- if (argc != 3) {
- cout << "File name missing!" << endl;
- return 0;
- }
- ifstream inFile(argv[l], ios::binary | ios::in); //以二进制读模式打开文件
- if (!inFile) {
- cout << "Source file open error." << endl;
- return 0;
- }
- ofstream outFile(argv[2], ios::binary | ios::out); //以二进制写模式打开文件
- if (!outFile) {
- cout << "New file open error." << endl;
- inFile.close(); //打开的文件一定要关闭
- return 0;
- }
- char c;
- while (inFile.get(c)) //每次读取一个字符
- outFile.put(c); //每次写入一个字符
- outFile.close();
- inFile.close();
- return 0;
- }
操作系统在接收到写文件的请求时,也是先把要写入的数据在一个内存缓冲区中保存起来,等缓冲区满后,再将缓冲区的内容全部写入磁盘。关闭文件的操作就能确保内存缓冲区中的数据被写入磁盘。
尽管如此,要连续读写文件时,像 mycopy 程序那样一个字节一个字节地读写,还是不如一次读写一片内存区域快。每次读写的字节数最好是 512 的整数倍。
1. 二进制文件写入示例:
//采用C模式写二进制文件 void DataWrite_CMode() { //准备数据 double pos[200]; for(int i = 0; i < 200; i ++ ) pos[i] = i ; //写出数据 FILE *fid; fid = fopen("binary.dat","wb"); if(fid == NULL) { printf("写出文件出错"); return; } int mode = 1; printf("mode为1,逐个写入;mode为2,逐行写入\n"); scanf("%d",&mode); if(1==mode) { for(int i = 0; i < 200; i++) fwrite(&pos[i],sizeof(double),1,fid); } else if(2 == mode) { fwrite(pos, sizeof(double), 200, fid); } fclose(fid); } 2. 二进制文件读取示例:
//采用C模式读二进制文件 void DataRead_CMode() { FILE *fid; fid = fopen("binary.dat","rb"); if(fid == NULL) { printf("读取文件出错"); return; } int mode = 1; printf("mode为1,知道pos有多少个;mode为2,不知道pos有多少个\n"); scanf("%d",&mode); if(1 == mode) { double pos[200]; fread(pos,sizeof(double),200,fid); for(int i = 0; i < 200; i++) printf("%lf\n", pos[i]); free(pos); } else if(2 == mode) { //获取文件大小 fseek (fid , 0 , SEEK_END); long lSize = ftell (fid); rewind (fid); //开辟存储空间 int num = lSize/sizeof(double); double *pos = (double*) malloc (sizeof(double)*num); if (pos == NULL) { printf("开辟空间出错"); return; } fread(pos,sizeof(double),num,fid); for(int i = 0; i < num; i++) printf("%lf\n", pos[i]); free(pos); //释放内存 } fclose(fid); }