0%

Javascript - String

发表于 2019-07-12 更新于 2020-05-03

Table of Contents

Table of Contents
Unicode
String.prototype.charAt()
String.prototype.charCodeAt()
String.fromCharCode()
String.prototype.codePointAt()
String.fromCodePoint()

Unicode

Unicode 编码单元（code points）的范围从 0 到 1,114,111（0x10FFFF）。开头的 128 个 Unicode 编码单元和 ASCII 字符编码一样

String.prototype.charAt()

从字符串中返回指定的字符

str.charAt(index)
index: 介于 0 和字符串长度减 1 之间的整数 (0 ~ length-1)
- 如果不是一个数值，则默认为 0
- 索引超出范围（小于 0 或不小于字符串的长度），则返回 ''

String.prototype.charCodeAt()

string 转 Unicode，返回 0 到 65535 之间的整数，表示给定索引处的 UTF-16 代码单元，不能被一个 UTF-16 编码单元单独表示的情况下，需使用 codePointAt()

str.charCodeAt(index)
index: 介于 0 和字符串长度减 1 之间的整数 (0 ~ length-1)
- 如果不是一个数值，则默认为 0
- 索引超出范围（小于 0 或不小于字符串的长度），则返回 NaN

String.fromCharCode()

String 的静态方法，返回由指定的 UTF-16 代码单元序列创建的字符串
由于高位编码（higher values）字符是用两个低位编码（lower value）表示形成的一个字符，需要使用 String.fromCodePoint()

String.fromCharCode(num1[, ...[, numN]])
num1, ..., numN
- 一系列 UTF-16 代码单元的数字。范围介于 0 到 65535（0xFFFF）之间。大于 0xFFFF 的数字将被截断。不进行有效性检查
返回一个长度为 N 的字符串，由 N 个指定的 UTF-16 代码单元组成

String.prototype.codePointAt()

string 转 Unicode

str.codePointAt(pos)
pos: 介于 0 和字符串长度减 1 之间的整数 (0 ~ length-1)
- 如果不是一个数值，则默认为 0
- 索引超出范围（小于 0 或不小于字符串的长度），则返回 undefined

String.fromCodePoint()

String 的静态方法

String.fromCodePoint(num1[, ...[, numN]])
num1, ..., numN
- 一串 Unicode 编码位置，即“代码点”
传入无效的 Unicode 编码，会抛出异常