
大多数网站托管(Web hosting)公司都支持客户对Web站点统计数据的访问,但是你往往会觉得服务器所产生的状态信息不够全面。例如,配置不正确的Web服务器不能识别某些文件类型,这些类型的文件就不会出现在状态信息之中。幸好,你可以用PHP来定制状态信息收集程序,这样你就可以获取你所需要的信息了。
公共日志文件格式(Common Logfile Format,CLF)的结构
CLF最初是NCSA为HTTPd(全球网服务器软件)而设计的。CERN HTTPd是一个由万维网联盟(World
Wide Web Consortium,W3C)维护的公共域Web服务器。W3C网站列出了该日志文件规范。基于微软和UNIX的Web服务器都可以生成CLF格式的日志文件。CLF格式如下:
Host IdentAuthuserTime_Stamp "request" Status_codeFile_size
例如:
21.53.48.83 - - [22/Apr/2002:22:19:12 -0500] "GET
/cnet.gif HTTP/1.0" 200 8237
下面是日志条目的细目分类:
- Host是网站访问者的IP地址或者DNS名;在上面的例子中,它是21.53.48.83。
- Ident是该访客的远端身份(RFC 931)。破折号表明“未指定”。
- Authuser是用户ID(如果Web服务器已经验证了验证网站访问者的身份的话)。
- Time_Stam是服务器以“日/月/年”这种格式返回的时间。
- Request是网站访问者的HTTP请求,例如GET或者POST。
- Status_Code是服务器所返回的状态代码,例如:200代表“正确——浏览器请求成功”。
- File_Size是用户所请求文件的大小。在本例中,它为 8237字节。