扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
Foxmail邮件夹组成分析
为了能编程实现对Foxmail邮件夹的处理,首先要对Foxmail的邮件夹和内部邮件的组成方式及其采取的存放格式有一个清楚的认识。进入到Foxmail的安装目录,然后发一封邮件给自己,把信接收后,查看安装目录下各个文件的时间属性,发现只有fmnmtk.dat文件是最新的,但该文件大小远远小于所发邮件,因此应当排除。mail文件夹中的子目录对应Foxmail账号。进入某个帐号所对应的文件夹,文件夹中的in、out、send和trash等文件分别对应收件夹、发件夹、已发送文件夹和废件箱。
在明确了邮件夹所对应的存储文件后,可以通过二进制查看软件来进一步分析邮件夹的内部结构组成。根据目前的情况可以断定某个邮件夹内的邮件均存放在同一个文件中,因此本文对邮件夹内邮件的批量导出问题可以转化为从邮件夹文件中分离出各个邮件并将其输出到外部文件的问题。这样,在对邮件夹文件内部结构组成的分析时,只需关心两封邮件的边界即可。打开某个邮件夹文件,可以看到开始一段16进制内容为:
10 10 10 10 | 10 10 10 11 | 11 11 11 11 | 11 53 0D 0A |
52 65 74 75 | 72 6E 2D 50 | 61 74 68 3A | 20 3C 7A 68 |
这里,开始一段代码非常规整,因此可以猜测为文件的格式头或是各个邮件的格式头,在文件内对前7个10和6个11共13个字符进行搜寻,可以发现存在有许多相同字符,而且搜寻到的字符邻近几个字符"53"、"0D"和"0A"也同时出现,其后的字符则不固定,因此可以进一步假定这16个字符为邮件的格式头而非文件的格式头(文件格式头通常只在文件开始处出现一次),再在邮件夹文件中对这16个字符进行搜寻并记录搜寻到的次数,可以发现正好同邮件夹中的邮件数目相吻合,而且在删除或增添邮件后,该数目也会相应变化。根据以上情况可以断定"10 10 10 10 10 10 10 11 11 11 11 11 11 53 0D 0A"是邮件的格式头,根据此头可以分离出邮件。
程序的设计实现
在弄清楚Foxmail邮件夹文件的组成结构后,对内部邮件的提取、导出就不是什么难事了,编程的中心思想是对邮件格式头的判别,并对位于其后邮件内容数据的文件导出。为此,可以对全部邮件夹文件内容搜寻ASCII码10(16进制),一旦发现该字符说明其后15个字节有可能是邮件格式头,然后继续判断其后15个字节是否满足邮件格式头,一旦某个字节不符合则表明其并非邮件格式头而不予处理,否则开始将邮件数据写入导出文件,同时关闭上一封打开过的导出文件:
//从邮件夹文件读取字符 c = fgetc(fp1); while (!feof(fp1)) { //发现有分隔特征串的开头字符, 则进入check()函数进行分析 if (c == 0x10) check(); //生成输出文件名 j++; filename.Format("%d",j); //确定待导出文件的存放路径 char exeFullPath[MAX_PATH]; CString strPath; GetModuleFileName(NULL, exeFullPath, MAX_PATH); strPath = CString(exeFullPath); strPath = strPath.Left(strPath.ReverseFind('\\')); strPath = strPath + "\\mail\\" + CString(filename) + ".eml"; strcpy(fullname, strPath); //以写方式打开导出文件,如果文件不存在则创建之 fp2 = fopen(fullname, "w"); //没有到输入文件的结尾, 又不是分隔特征串的开头字符, 则将字符写入输出文件 while (!feof(fp1) && (c = fgetc(fp1)) != 0x10) fputc(c, fp2); } |
其中,对于邮件格式头的判断是在check()函数中完成的,依次对0x10之后的15个字节进行判断,一旦发现不是邮件格式头字符,立即返回,并将其当作邮件内容数据进行处理只有在断定为邮件格式头后才将上一封导出文件关闭:
for (int i = 0; i < 6; i++) { c = fgetc(fp1); //不符合分隔特征串,则返回 if(c != 0x10) return; } for (i = 0; i < 6; i++) { c = fgetc(fp1); //不符合分隔特征串,则返回 由此可以断定邮件夹的内容 if (c != 0x11) return; } if ((c = fgetc(fp1)) == 0x53) if ((c = fgetc(fp1)) == 0x0D) if ((c = fgetc(fp1)) == 0x0A) { c = fgetc(fp1); //完全符合特征串,则当前邮件输出完毕, 关闭输出文件 fclose(fp2); } |
由于本程序的设计目的在于自动批量导出邮件,因此处理数据量一般是比较大的,为避免程序阻塞,可以将此处理过程放置于线程之中进行。经实验,由上述程序导出的eml文件可以为OutLook文件识别并打开,达到了预期目的。
小结
本文通过对Foxmail邮件夹的组成结构进行分析而最终实现了对其邮件的批量导出,极大方便了对Foxmail邮件的备份、管理等工作,而且对不同版本的Foxmail均有很好的支持(当前最新版本为4.2,本文方法适用),因此不失为一款实用的邮件辅助管理工具。本文所述代码在Windows 2000 Professional下由Microsoft Visual C++ 6.0编译通过。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者