今天同事找我解决一个NGINX path_info的问题,URL http://lvs.xxx.com/tag/咳嗽%感冒 出现 400 的问题,我在网上找了好久都找不到问题,urldecode 后的地址是
http://lvs.xxx.com/tag/%E5%92%B3%E5%97%BD%%E6%84%9F%E5%86%92
明显没有对%做urldecode 所以报400的错。
我不用PATH_INFO 访问这个URL 是没有问题的
http://lvs.xxx.com/tag?kw=咳嗽%感冒没问题的
看http://www.laruence.com/2010/01/20/1247.html
最后找到这是Nginx PATH_INFO 的一个bug. 那就是PATH_INFO不会被urldecode.
对于Apache+PHP(php2handler)来说, PATH_INFO来自Apache, 不会有问题, 对于Apache fastcgi也应该没有问题, 因为PATH_INFO也是由Apache生成.
但是对于nginx+fastcgi, 因为对于cgi来说PATH_INFO来自于ENV(fastcgi_params), 而php-cgi中的import_environment_variables不会对ENV中的变量做urldecode.
这样, nginx看到的url是urlencode以后的, 从url中分离出来的PATH_INFO也是urlencode后的, forward给php proxy以后, PHP看到的PATH_INFO也是urlencode的了.
所以, 如果在PATH_INFO中包含一些宽字符, 或者是”+”, 那就要注意了, 需要我们主动的urldecode一下再使用.