1.URL编码(也称为百分比编码):是将特殊字符转换为 % 开头的格式,以确保这些字符在 URL 中合法。常见的编码规则如下:
(1)空格编码为 %20 或 +
(2)特殊字符(如 :、/、?、& 等)编码为其 ASCII 十六进制表示形式(如 / -> %2F)
URL 编码并不是等同于 Unicode 编码,但它可以包含 Unicode 编码的字符
2. Unicode 是一种字符集标准,定义了全世界几乎所有文字和符号的唯一代码点(Code Point),例如: U+0041 表示字母 A U+4E2D 表示中文字符 中
UTF-8:可变长度编码,常用在网络和文件传输中。一个字符可以占用 1 到 4 个字节。
UTF-16:定长或变长编码,字符通常占 2 或 4 个字节。
UTF-32:固定长度编码,每个字符占 4 个字节。
3. 国标Unicode编码(&#x开头):Unicode HTML每个字符的 Unicode 码点用 &#x 开头,后跟字符的 16 进制值,最后以 ; 结尾
4. escape 编码是 JavaScript 中早期用于编码字符串的方法,它将字符串中的非 ASCII 字符(值大于 0x7F)和某些特殊字符(如空格)转为 %xx 或 %uxxxx 格式的表示形式,其中 %xx 表示 ASCII 码,%uxxxx 表示 Unicode 码点。
(1)escape 已被弃用,不建议在现代代码中使用,推荐使用 encodeURIComponent 替代。
(2)浏览器仍支持 escape 和 unescape,但应避免在新项目中使用。
5.HTML ASCII 编码 是指在 HTML 中使用 ASCII 值的字符编码来表示字符的一种方式。ASCII 是一种基于数字(十进制或十六进制)定义的编码标准,HTML 使用这些值作为实体编码的一部分,用来表示特殊字符或不可见字符。