分类

读懂 ECMAScript 规格

作者: 阮一峰

日期: 2015年11月12日

一、概述

规格文件(specification)是计算机语言的官方标准,详细描述语法规则和实现方法。

一般来说,没有必要阅读规格,除非你要写编译器。因为规格写得非常抽象和精炼,又缺乏实例,不容易理解,而且对于解决实际的应用问题,帮助不大。但是,如果你遇到疑难的语法问题,实在找不到答案,这时可以去查看规格文件,了解语言标准是怎么说的。规格是解决问题的"最后一招"。

这对JavaScript语言很有必要。因为它的使用场景复杂,语法规则不统一,例外很多,各种运行环境的行为不一致,导致奇怪的语法问题层出不穷,任何语法书都不可能囊括所有情况。查看规格,不失为一种解决语法问题的最可靠、最权威的终极方法。

本文介绍如何读懂ECMAScript 6的规格文件。

ECMAScript 6的规格,可以在ECMA国际标准组织的官方网站(www.ecma-international.org/ecma-262/6.0/)免费下载和在线阅读。

这个规格文件相当庞大,一共有26章,A4打印的话,足足有545页。它的特点就是规定得非常细致,每一个语法行为、每一个函数的实现都做了详尽的清晰的描述。基本上,编译器作者只要把每一步翻译成代码就可以了。这很大程度上,保证了所有ES6实现都有一致的行为。

ECMAScript 6规格的26章之中,第1章到第3章是对文件本身的介绍,与语言关系不大。第4章是对这门语言总体设计的描述,有兴趣的读者可以读一下。第5章到第8章是语言宏观层面的描述。第5章是规格的名词解释和写法的介绍,第6章介绍数据类型,第7章介绍语言内部用到的抽象操作,第8章介绍代码如何运行。第9章到第26章介绍具体的语法。

对于一般用户来说,除了第4章,其他章节都涉及某一方面的细节,不用通读,只要在用到的时候,查阅相关章节即可。下面通过一些例子,介绍如何使用这份规格。

二、相等运算符

先来看这个例子,请问下面表达式的值是多少。


0 == null

如果你不确定答案,或者想知道语言内部怎么处理,就可以去查看规格,7.2.12小节是对相等运算符(==)的描述。

规格对每一种语法行为的描述,都分成两部分:先是总体的行为描述,然后是实现的算法细节。相等运算符的总体描述,只有一句话。

"The comparison x == y, where x and y are values, produces true or false."

上面这句话的意思是,相等运算符用于比较两个值,返回truefalse

下面是算法细节。

  1. ReturnIfAbrupt(x).
  2. ReturnIfAbrupt(y).
  3. If Type(x) is the same as Type(y), then
    Return the result of performing Strict Equality Comparison x === y.
  4. If x is null and y is undefined, return true.
  5. If x is undefined and y is null, return true.
  6. If Type(x) is Number and Type(y) is String,
      return the result of the comparison x == ToNumber(y).
  7. If Type(x) is String and Type(y) is Number,
      return the result of the comparison ToNumber(x) == y.
  8. If Type(x) is Boolean, return the result of the comparison ToNumber(x) == y.
  9. If Type(y) is Boolean, return the result of the comparison x == ToNumber(y).
  10. If Type(x) is either String, Number, or Symbol and Type(y) is Object, then
      return the result of the comparison x == ToPrimitive(y).
  11. If Type(x) is Object and Type(y) is either String, Number, or Symbol, then
      return the result of the comparison ToPrimitive(x) == y.
  12. Return false.

上面这段算法,一共有12步,翻译如下。

  1. 如果x不是正常值(比如抛出一个错误),中断执行。
  2. 如果y不是正常值,中断执行。
  3. 如果Type(x)Type(y)相同,执行严格相等运算x === y
  4. 如果xnullyundefined,返回true
  5. 如果xundefinedynull,返回true
  6. 如果Type(x)是数值,Type(y)是字符串,返回x == ToNumber(y)的结果。
  7. 如果Type(x)是字符串,Type(y)是数值,返回ToNumber(x) == y的结果。
  8. 如果Type(x)是布尔值,返回ToNumber(x) == y的结果。
  9. 如果Type(y)是布尔值,返回x == ToNumber(y)的结果。
  10. 如果Type(x)是字符串或数值或Symbol值,Type(y)是对象,返回x == ToPrimitive(y)的结果。
  11. 如果Type(x)是对象,Type(y)是字符串或数值或Symbol值,返回ToPrimitive(x) == y的结果。
  12. 返回false

由于0的类型是数值,null的类型是Null(这是规格4.3.13小节的规定,是内部Type运算的结果,跟typeof运算符无关)。因此上面的前11步都得不到结果,要到第12步才能得到false


0 == null // false

三、数组的空位

下面再看另一个例子。


const a1 = [undefined, undefined, undefined];
const a2 = [, , ,];

a1.length // 3
a2.length // 3

a1[0] // undefined
a2[0] // undefined

a1[0] === a2[0] // true

上面代码中,数组a1的成员是三个undefined,数组a2的成员是三个空位。这两个数组很相似,长度都是3,每个位置的成员读取出来都是undefined

但是,它们实际上存在重大差异。


0 in a1 // true
0 in a2 // false

a1.hasOwnProperty(0) // true
a2.hasOwnProperty(0) // false

Object.keys(a1) // ["0", "1", "2"]
Object.keys(a2) // []

a1.map(n => 1) // [1, 1, 1]
a2.map(n => 1) // [, , ,]

上面代码一共列出了四种运算,数组a1a2的结果都不一样。前三种运算(in运算符、数组的hasOwnProperty方法、Object.keys方法)都说明,数组a2取不到属性名。最后一种运算(数组的map方法)说明,数组a2没有发生遍历。

为什么a1a2成员的行为不一致?数组的成员是undefined或空位,到底有什么不同?

规格的12.2.5小节《数组的初始化》给出了答案。

"Array elements may be elided at the beginning, middle or end of the element list. Whenever a comma in the element list is not preceded by an AssignmentExpression (i.e., a comma at the beginning or after another comma), the missing array element contributes to the length of the Array and increases the index of subsequent elements. Elided array elements are not defined. If an element is elided at the end of an array, that element does not contribute to the length of the Array."

翻译如下。

"数组成员可以省略。只要逗号前面没有任何表达式,数组的length属性就会加1,并且相应增加其后成员的位置索引。被省略的成员不会被定义。如果被省略的成员是数组最后一个成员,则不会导致数组length属性增加。"

上面的规格说得很清楚,数组的空位会反映在length属性,也就是说空位有自己的位置,但是这个位置的值是未定义,即这个值是不存在的。如果一定要读取,结果就是undefined(因为undefined在JavaScript语言中表示不存在)。

这就解释了为什么in运算符、数组的hasOwnProperty方法、Object.keys方法,都取不到空位的属性名。因为这个属性名根本就不存在,规格里面没说要为空位分配属性名(位置索引),只说要为下一个元素的位置索引加1。

至于为什么数组的map方法会跳过空位,请看下一节。

四、数组的map方法

规格的22.1.3.15小节定义了数组的map方法。该小节先是总体描述map方法的行为,里面没有提到数组空位。

后面的算法描述是这样的。

  1. Let O be ToObject(this value).
  2. ReturnIfAbrupt(O).
  3. Let len be ToLength(Get(O, "length")).
  4. ReturnIfAbrupt(len).
  5. If IsCallable(callbackfn) is false, throw a TypeError exception.
  6. If thisArg was supplied, let T be thisArg; else let T be undefined.
  7. Let A be ArraySpeciesCreate(O, len).
  8. ReturnIfAbrupt(A).
  9. Let k be 0.
  10. Repeat, while k < len
      a. Let Pk be ToString(k).
      b. Let kPresent be HasProperty(O, Pk).
      c. ReturnIfAbrupt(kPresent).
      d. If kPresent is true, then
        d-1. Let kValue be Get(O, Pk).
        d-2. ReturnIfAbrupt(kValue).
        d-3. Let mappedValue be Call(callbackfn, T, «kValue, k, O»).
        d-4. ReturnIfAbrupt(mappedValue).
        d-5. Let status be CreateDataPropertyOrThrow (A, Pk, mappedValue).
        d-6. ReturnIfAbrupt(status).
      e. Increase k by 1.
  11. Return A.

翻译如下。

  1. 得到当前数组的this对象
  2. 如果报错就返回
  3. 求出当前数组的length属性
  4. 如果报错就返回
  5. 如果map方法的参数callbackfn不可执行,就报错
  6. 如果map方法的参数之中,指定了this,就让T等于该参数,否则Tundefined
  7. 生成一个新的数组A,跟当前数组的length属性保持一致
  8. 如果报错就返回
  9. 设定k等于0
  10. 只要k小于当前数组的length属性,就重复下面步骤
      a. 设定Pk等于ToString(k),即将K转为字符串
      b. 设定kPresent等于HasProperty(O, Pk),即求当前数组有没有指定属性
      c. 如果报错就返回
      d. 如果kPresent等于true,则进行下面步骤
        d-1. 设定kValue等于Get(O, Pk),取出当前数组的指定属性
        d-2. 如果报错就返回
        d-3. 设定mappedValue等于Call(callbackfn, T, «kValue, k, O»),即执行回调函数
        d-4. 如果报错就返回
        d-5. 设定status等于CreateDataPropertyOrThrow (A, Pk, mappedValue),即将回调函数的值放入A数组的指定位置
        d-6. 如果报错就返回
      e. k增加1
  11. 返回A

仔细查看上面的算法,可以发现,当处理一个全是空位的数组时,前面步骤都没有问题。进入第10步的b时,kpresent会报错,因为空位对应的属性名,对于数组来说是不存在的,因此就会返回,不会进行后面的步骤。


const arr = [, , ,];
arr.map(n => {
  console.log(n);
  return 1;
}) // [, , ,]

上面代码中,arr是一个全是空位的数组,map方法遍历成员时,发现是空位,就直接跳过,不会进入回调函数。因此,回调函数里面的console.log语句根本不会执行,整个map方法返回一个全是空位的新数组。

V8引擎对map方法的实现如下,可以看到跟规格的算法描述完全一致。

[说明]:本文是我的新书《ECMAScript 6 入门》(第二版)的最后一章。

(完)

留言(17条)

以前觉的JS引擎不支持正则的否定逆向环视,就在Google Group给V8提意见,求改进。结果人家回,你应该去找规范的制定者,而不是V8.

好可怕的JavaScript。

随便看了一下发现一个错误,我觉得:
8.函数的扩展函数的length属性
指定了默认值以后,函数的length属性,将返回没有指定默认值的参数个数。也就是说,指定了默认值后,length属性将失真。

(function(a){}).length // 1
(function(a = 5){}).length // 0
(function(a, b, c = 5){}).length // 2
上面代码中,length属性的返回值,等于函数的参数个数减去指定了默认值的参数个数。

((x=0,y,z)=>x+y+z).length// 0
应该是:length属性的返回值,等于设置了任意一个默认值之前的参数个数。
还是应该自己多动手!

@Running_V:

谢谢发表意见,我修改了一下,表达更清楚了。

太棒了,感谢兔哥分享!

最近在狂补前端知识,正在看您的相关博客文章,感谢前辈的整理~

阮老师,我是北京嗨课网络的产品Jason,我们做了一款工程师交流的app,能不能跟您聊聊?

阮老师,在您百忙之中打扰了,对于您之前搭建gh-pages那篇文章最后的绑定自定义域名我至今仍没解决,我绑定了一个顶级域名后,我的博客的样式没有了,打开控制台发现我的css文件指向的是我新绑定的自定义域名下css文件夹中的css文件,请问这种情况应该怎么解决?谢谢了

您好,阮老师,很喜欢您的文章,讲解很透彻,我看了RSA算法的讲解觉得很是通透。 希望向您请教一些问题,望您不嫌不吝,帮助我这个困惑已久的年轻人。 作为一个在职的开发者, 一直对软件开发保有兴趣,但随着工作加深,却产生了一种不学无术的思想。 所谓“不学无术”,主要是指对行业的风气风格难以适应, 快节奏且多变,浮躁且趋利性强, 觉得圈子里人的思想有些无聊,自己也从以前的踏实低头的人变成一个闻风而动,追名逐利的人。以前大学老是曾说过,程序只是实现方法,重要的还是实现原理。 所以我想问问您, 精研编程技巧是否是一个长远的追求, 比之钻研理学数术如何。薪资已经足够用了,我不想为了几百万的房子和车而挥霍一生。前路漫漫,何以投奔,求老师解惑。

每次看完阮一峰的博客,都有一种静心的感觉。感觉技术本来就是这个样子,就值得不断的去深挖和研究。谢谢你的存在,向您学习,努力成为一个“自发光”的人。

coffeeScript 是根据那个标准来的

我想问一下,怎么学习 V8 的源码?我想知道let的实现原理,可是不知道从哪里入手

var a;
console.log(a);
function a() {alert();}

现在打印出的是:function a() {alert();}
我就是很迷惑为什么不是undefined,下面先说下我的理解:js静态解析完之后,var a 和function a 都是存在的,执行时候沿着作用域链向上找,为什么没有找到 var a ? 而是找到了function a , 难道函数在静态解析的时候做了什么特殊处理么?


然后我把 function a注销 结果打出了 undefined 也就是说 a是确实存在,但是沿着作用域链找的时候 为什么先找到了 function a,js解析的时候不是从上而下么? 应该先知道 var a 才对啊,

在群上问,他们说函数 解析的时候会前置,如果这个前置是指 把 function a推向作用域的前端 的话,那么:

var a;
function a() {alert();}
a = 111;
console.log(a);

这时候应该打印出 function a 才对啊, 但是却打印出了 var a;

希望阮大神能给解答,

我也姓阮,by the way

@Geek:

函数也有“变量提升”效应。

http://javascript.ruanyifeng.com/grammar/function.html#toc5

如果被省略的成员是数组最后一个成员,则不会导致数组length属性增加。"

請問這句話是什麼意思呢?

請問想向ecma提request,應該去哪裏?要寫spec嗎?有沒有鏈接呢,謝謝!

阮老师还是牛逼啊,这么晦涩的规范翻译了一本

我要发表看法

«-必填

«-必填,不公开

«-我信任你,不会填写广告链接