[转]visual c++对大型数据文件的读取

  笔者前不久曾遇到一个问题,解决之后的经验愿与大家分享。问题是这样的,有一批数据文件,数据格式如下:

日期,开盘,最高,最低,收盘,成交量,成交金额

1996年5月13日,636.96,636.96,636.96,636.96,0,0,

1996年5月14日,641.61,641.61,641.61,641.61,0,0,

1996年5月15日,637.83,637.83,637.83,637.83,0,0,

………….

要求将数据填写到四张表中,以便作相应的分析。笔者开始用CFile和CStdioFile类的方法读取件。Cfile类提供了基于二进制流的文件操 作,功能类似于C语言中的fread()和fwrite()函数。CStdioFile提供了基于字符串流的文件操作,功能类似于C语言中fgets() 和fputs()函数。但是笔者发现,使用这两个类进行文件操作时,对于一次文件读写的数据量的大小必须限制在65535字节以内。究其原因是在VC中访 问大于65535字节的缓冲区需要Huge型指针,而在CFile和CStdioFile类中,使用的是Far型的指针。由于Far型指针不具有跨段寻址 的能力,因此限制了一次文件读写的长度小于65535字节。如果传递给CFile和CStdioFile两个类的成员函数的数据缓冲区的大小大于 65535字节的时候,VC就会产生ASSERT错误。

针对文件格式特点,笔者改用CArchive类进行读取如下:

CFile SourceFile;//数据文件

CString SourceData;//定义一临时变量保存一条记录

SourceFile.Open(…….);

CArchive ar(&SourceFile,CArchive::load);

while(NULL!=ar.ReadString(SourceData))//循环读取文件,直到文件结束

{

if(SourceData=="日期,开盘,最高,最低,收盘,成交量,成交金额"||SourceData=="")

continue;//跳过文件头部的提示信息

//分析并填充//

}

在进行分析时,笔者采取了逐步分析并修改的办法,过程如下:

int nYear;

CString Year= SourceData.Left(SourceData.Find("年"));//截取年前面的字符串

nYear=atoi(Year);//类型转换

SourceData=SourceData.Righ(SourceData.GetLength()-SourceData.Find("年")-2);//将年以及前面的字符删除。

重复上面分析过程,直到记录末尾。

通过上述方法,笔者成功地将文件读取并分析填充。

Read: 652

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注