encodeURIComponent() - JavaScript 全局函数
encodeURIComponent()
encodeURIComponent()
是对统一资源标识符(URI)的组成部分进行编码的方法。它使用一到四个转义序列来表示字符串中的每个字符的UTF-8编码(只有由两个Unicode代理区字符组成的字符才用四个转义字符编码)。
语法
encodeURIComponent(str);
参数
str
String. URI 的组成部分。描述
encodeURIComponent
转义除了字母、数字、(
、)
、.
、!
、~
、*
、'
、-
和_
之外的所有字符。
注意,如果试图编码一个非高-低位完整的代理字符,将会抛出一个URIError
错误,例如:
// 高低位完整 alert(encodeURIComponent('\uD800\uDFFF')); // 只有高位,将抛出"URIError: malformed URI sequence" alert(encodeURIComponent('\uD800')); // 只有低位,将抛出"URIError: malformed URI sequence" alert(encodeURIComponent('\uDFFF'));
为了避免服务器收到不可预知的请求,对任何用户输入的作为URI部分的内容你都需要用encodeURIComponent进行转义。比如,一个用户可能会输入"Thyme &time=again
"作为comment
变量的一部分。如果不使用encodeURIComponent对此内容进行转义,服务器得到的将是comment=Thyme%20&time=again
。请注意,"&"符号和"="符号产生了一个新的键值对,所以服务器得到两个键值对(一个键值对是comment=Thyme
,另一个则是time=again
),而不是一个键值对。
对于application/x-www-form-urlencoded
(POST)这种数据方式,空格需要被替换成'+',所以通常使用encodeURIComponent
的时候还会把"%20"替换为"+"。
为了更严格的遵循 RFC 3986(它保留!,',(,),和*),即使这些字符并没有正式划定 URI 的用途,下面这种方式是比较安全的:
function fixedEncodeURIComponent (str) { return encodeURIComponent(str).replace(/[!'()*]/g, function(c) { return '%' + c.charCodeAt(0).toString(16); }); }
示例
下面这个例子提供了 UTF-8 下Content-Disposition
和Link
的服务器响应头信息的参数(例如 UTF-8 文件名):
var fileName = 'my file(2).txt'; var header = "Content-Disposition: attachment; filename*=UTF-8''" + encodeRFC5987ValueChars(fileName); console.log(header); // 输出 "Content-Disposition: attachment; filename*=UTF-8''my%20file%282%29.txt" function encodeRFC5987ValueChars (str) { return encodeURIComponent(str). // 注意,仅管 RFC3986 保留 "!",但 RFC5987 并没有 // 所以我们并不需要过滤它 replace(/['()]/g, escape). // i.e., %27 %28 %29 replace(/\*/g, '%2A'). // 下面的并不是 RFC5987 中 URI 编码必须的 // 所以对于 |`^ 这3个字符我们可以稍稍提高一点可读性 replace(/%(?:7C|60|5E)/g, unescape); }
鹏仔微信 15129739599 鹏仔QQ344225443 鹏仔前端 pjxi.com 共享博客 sharedbk.com
图片声明:本站部分配图来自网络。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!