记录实用有价值的内容

Apache 日志

要了解一个web服务器的运行状态,就得从日志文件入手,Apache提供了很好的日志控制机制给开发人员和运维人员使用。Apache中的日志分为两种:一种是记录apache运行错误的错误日志,还有一种是运行过程中的访问日志。


错误日志

错误日志是由apache核心模块mod_core提供的,用来记录apache服务器产生的错误信息,比如:模块装载错误,CGI脚本错误等,通常这种日志默认是打开的,你不必专门去维护错误日志,因为这种日志一般很小。

ErrorLog

可以通过ErrorLog指令来指定错误日志的存放位置,其格式如下:

ErrorLog file-path|syslog[:facility]


当file-path不是以“/”开头时,指的是相对于ServerRoot目录(conf和logs所在目录)的文件名;如果是以"/"开头,指的是存放错误文件的绝对路径。

当file-path是以"|"开头时,表示错误日志需要通过管道先由一个程序来处理。

如果系统支持,你还可以用syslog替代文件名,采用系统日志机制来记录错误日志。


LogLevel

还可以用LogLevel指令来指定错误级别,其格式如下:


LogLevel level


Apache中提供了8种level,分别是:

emerg:紧急(系统无法使用)

alert:必须立即采取措施

crit:致命情况

error:错误情况

warn:警告情况

notice:一般重要情况

info:普通信息

debug:调试信息


默认是warn,这时debug、info级别的日志是不会记录在日志文件中的,如果是初期调试,可以设置为debug便于排错,线上环境还是用warn比较合理。


访问日志

访问日志是由apache的mod_log_config模块来实现的,该模块提供了三个指令:TransferLog指令用来指定日志文件,LogFormat指令用来定义日志格式,CustomLog指令可以同时完成指定日志文件和定义日志格式。TransferLog和CustomLog指令在每个服务器上都可以被多次使用,以便将同一个请求记录到多个文件中。


LogFormat

其格式如下:


LogFormat format|nickname [nickname]


有两种形式:


1、带一个参数,供后面的TransferLog使用,如

LogFormat "%h %l %u %t \"%r\" %>s %b"

Transferlog logs/acccess_log


2、另一种是带两个参数,为日志格式起一个别名,供后面的CustomLog指令直接使用,如

LogFormat "%h %l %u %t \"%r\" %>s %b" common

CustomLog logs/acccess_log common


Logformat 指令参数请参考(http://www.phpchina.com/resource/manual/apache/mod/mod_log_config.html#formats)


CustomLog

其格式如下:

CustomLog file|pipe format|nickname [env=[!]environment-variable]

第一部分是一个文件名,也可以是一个管道(类似ErrorLog),第二部分是日志格式,如果未指定则采用默认的日志格式,第三部分是记录日志的条件,比如

SetEnvIf Request_URI \.gif$ gif-image

CustomLog gif-requests.log common env=gif-image

CustomLog nongif-requests.log common env=!gif-image

如果请求的是一个gif文件,则记录到gif-requests.log文件中,否则记录到nongif-requests.log文件中


TransferLog

其格式如下:

TransferLog file|pipe

与CustomLog类似,可以指定文件也可以指定管道,不同的是不能指定日志格式,采用最近的LogFormat指令指定的日志格式,如果没有,则使用通用日志格式。


实例分析

httpd.conf中的有以下日志文件配置

ErrorLog "|/opt/xxx/install/cronolog/sbin/cronolog /home/admin/yyy/logs/cronolog/%Y/%m/%Y-%m-%d-error_log"

LogLevel warn

LogFormat "%h %D %{X_READTIME}i %t \"%m http://%V%U%q\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\"" combined

SetEnvIf Remote_Addr "127\.0\.0\.1" dontlog

SetEnvIf Request_URI "^/robots\.txt$" dontlog

SetEnvIf Request_URI "\.swf$" dontlog

SetEnvIf Request_URI "\.gif$" dontlog

SetEnvIf Request_URI "\.jpg$" dontlog

SetEnvIf Request_URI "\.ico$" dontlog

SetEnvIf Request_URI "\.jpeg$" dontlog

SetEnvIf Request_URI "\.bmp$" dontlog

SetEnvIf Request_URI "\.png$" dontlog

SetEnvIf Request_URI "\.js$" dontlog

SetEnvIf Request_URI "\.css$" dontlog

SetEnvIf Request_URI "\.wav$" dontlog

SetEnvIf Request_URI "\.swf$" dontlog

SetEnvIf Request_URI "home/css" dontlog

SetEnvIf Request_URI "/auction/auto/*" dontlog

SetEnvIf Request_URI "/auction/associate_categories.htm*" dontlog

SetEnvIf Request_URI "/auction/latest_visit.htm*" dontlog

CustomLog "|/opt/xxx/install/cronolog/sbin/cronolog /home/admin/cai/logs/cronolog/%Y/%m/%Y-%m-%d-xxx-access_log" combined env=!dontlog

可以得知:


1、错误日志首先被管道程序cronolog处理,cronolog是一个开源工具,可以按照用户自己的要求来随意分割日志文件(参考其官网:http://cronolog.org/),这里是将错误文件按天分割,按年月来分目录存储。

2、日志级别为warn

3、定义了一个组合日志格式,其别名叫combined

%h 远端主机 

%D 服务器处理本请求所用时间,以微秒为单位

%{X_READTIME}i  访问的时间点,格式为04/Mar/2013:23:59:59

%t 时间,用普通日志时间格式(标准英语格式)

%m 请求的方法   比如get/post

%V 根据UseCanonicalName指令设定的服务器名称。 

%U 请求的URL路径,不包含查询字符串。

%q 查询字符串(若存在则由一个”?“引导,否则返回空串)

%>s 状态码

%b 以CLF格式显示的除HTTP头以外传送的字节数,也就是当没有字节传送时显示’-‘而不是0。 

%{Referer}i 访问来源

%{User-Agent}i 记录客户端信息,如操作系统、浏览器版本之类的


4、定义了一个变量dontlog,当请求地址中包含图片、js脚本等信息时,这个变量有值

5、同错误日志一样,访问日志也被cronolog处理,采用的是combined定义的日志格式且在dontlog不存在的时候才记录。


参考资料

1、http://httpd.apache.org/docs/trunk/logs.html

2、http://cronolog.org/

上一篇:Apache Module: CustomLog

下一篇:利用.htaccess绑定子域名到子目录