Get to know MDN better
此页面由社区从英文翻译而来。了解更多并加入 MDN Web Docs 社区。
String 的 charCodeAt() 方法返回一个整数,表示给定索引处的 UTF-16 码元,其值介于 0 和 65535 之间。
charCodeAt() 方法总是将字符串当作 UTF-16 码元序列进行索引,因此它可能返回单独代理项(lone surrogate)。如果要获取给定索引处的完整 Unicode 码位,请使用 String.prototype.codePointAt() 方法。
要返回的字符的索引,从零开始。将被转换为整数——undefined 被转换为 0。
一个整数,介于 0 和 65535 之间,表示指定 index 处字符的 UTF-16 码元值。如果 index 超出了 0 到 str.length - 1 的范围,则 charCodeAt() 返回 NaN。
字符串中的字符从左到右进行索引。第一个字符的索引为 0,而在名为 str 的字符串中,最后一个字符的索引为 str.length - 1。
Unicode 码位的范围是 0 到 1114111(0x10FFFF)。charCodeAt() 方法始终返回一个小于 65536 的值,因为更高的码位由一对 16 位代理伪字符(surrogate pseudo-character)来表示。因此,为了获取值大于 65535 的完整字符,不仅需要检索 charCodeAt(i),而且还要使用 charCodeAt(i + 1)(就像操作具有两个字符的字符串一样),或者使用 codePointAt(i) 方法。有关 Unicode 的信息,请参见 UTF-16 字符、Unicode 码位和字素簇。
以下示例返回 65,即 A 的 Unicode 值。
charCodeAt() 可能会返回单独代理项,它们不是有效的 Unicode 字符。
要获取给定索引处的完整 Unicode 码位,请使用 String.prototype.codePointAt() 方法。
备注:避免使用 charCodeAt() 来重新实现 codePointAt()。从 UTF-16 代理到 Unicode 码位的转换相当复杂,而且 codePointAt() 可能更加高效,因为它直接使用字符串的内部表示形式。如果需要,可以安装一个 codePointAt() 的 polyfill。
以下是将一对 UTF-16 码元转换为 Unicode 码位的可能算法,改编自 Unicode 常问问题:
| ECMAScript® 2027 Language Specification # sec-string.prototype.charcodeat |
启用 JavaScript 以查看此浏览器兼容性表。