前言
理解javascript中的作用域和作用域链对我们理解js这们语言。这次想深入的聊下关于js执行的内部机制,
主要讨论下,作用域,作用域链,闭包的概念。为了更好的理解这些东西,我模拟了当一个函数执行时,js引擎做了哪些事情--那些我们看不见的动作。
关键词:
- 执行环境
- 作用域
- 作用域链
- 变量对象
- 活动对象
- 闭包
- 垃圾回收
执行环境与作用域链
我们都知道js的执行环境最外层是一个全局环境Global,在web浏览器的宿主环境下,window对象被认为是全局执行环境。在后台的nodejs环境global作为全局变量也是我们可以直接访问到的。
某个执行环境中所有代码执行完毕后,该环境被销毁,保存在其中的所有变量和函数定义也随之销毁(全局环境到应用退出--如关闭网页或浏览器)
每个函数也有自己的执行环境,当执行流进入函数时,函数的环境被推入一个环境栈中,函数执行完毕之后,栈将其环境弹出,把控制权返回给之前的执行环境。
当代码在一个环境中执行时,会创建创建变量对象的一个作用域链
。
如果环境是个函数,则将其活动对象作为变量对象。活动对象在最开始只包含一个变量,即arguments对象,作用域链的下一个变量对象来自下一个包含环境,一直延续到全局环境。
下面我们模拟下这个过程。
var name = "eric";
function say(){
var name = "xu";
console.log(name);
}
say();//xu
输出“xu”,而不是“eric”,这个我们也许都很好理解,因为函数内部定义了局部同名变量name,而不会使用全局的name。上面的环境中包含全局变量name
和say
函数;当say执行时,js引擎做了些什么。下面我们模拟下引擎“偷偷”为我们做的事。
作用域链的产生过程
首先say()执行时会创建一个执行环境,为了形象一些,我这里以三个大括号可视化表示一个执行环境。如:say(){{{...}}}
这个执行环境中会自动拥有一个特殊的内部属性[[Scope]]
(为了更好的理解,可以把它想象成如果是全局环境的window,全局环境定义的变量和函数附着在这个变量上自动成为window的属性和方法,这样的一个局部功能“局部内全局对象”。但其实局部的变量和函数会被附着在其活动对象上,活动对象又是作用域链第一个变量对象。)
函数调用时与执行环境同时创建的就是相应的作用域链
[[Scope Chain]],并赋值给特殊变量Scope;
//step 1:创建执行环境,为了形象一些,我这里以三个大括号可视化表示一个执行环境
{{{...}}}
//step 2:创建作用域链,并赋值给特殊变量Scope,我们用数组来模拟这个作用域链,随后我会解释为什么用数组模拟
var ScopeChain = [
FirstVariableObject,//函数内的变量对象
SecondVariableObject //包含这个函数的外面一层的变量对象,在上面的例子中已经是全局环境了。
]
Scope = ScopeChain;
在作用域链生成之前,其实还有步骤,那就是作用域链数组的两个变量对象的生成。那这两个变量对象是什么呢?
其实第一个变量对象就是函数的活动对象
【activation object】,这个活动对象可以理解成这样一个对象
ActivationObject = {
arguments: [] //活动对象最开始仅包含arguments(就是函数内隐藏的arguments)
}
然后内部this根据环境,加入活动对象
ActivationObject = {
arguments: [], //活动对象最开始仅包含arguments(就是函数内隐藏的arguments)
this: window //这里的this根据执行环境和调用对象的不同,会动态变化,上面的例子因为是全局环境执行的所以this指向window
}
然后开始寻找var的变量定义,或者函数声明(我们都知道的函数声明会被提升)。
此时的活动对象变成:
//活动对象,即函数内部所有变量的综合,会自动成为第一个变量对象
ActivationObject = {
arguments: [],
this: window,
name: undefined //注意引擎此时并不会初始化赋值,只有读到赋值那一行时才会赋值
}
这样我们就能很好的理解我们熟悉的经典例子,为什么下面的console.log不会报错,也不是输出'xu',而是undefined
<script>
console.log(name);//undefined
var name = 'xu';
</script>
因为我们的活动对象会自动变为第一个活动对象,所以第一个变量对象就等于活动对象
FirstVariableObject = ActivationObject;
同理作用域中的第二个变量对象SecondVariableObject,或者我们也可以命名为GlobalVariableObject,因为在上面的例子中已经是全局环境了
//作用域链的第二个,也是最后一个(全局变量对象)
SecondVariableObject = {
this: window,
say: function (){...},
name: "eric"
}
第二个变量对象不包含arguments,因为它是全局环境,而不是函数。say函数声明被提升作为window的全局方法,还有全局的name属性。都被挂在第二层的作用域链的变量对象上。
至此作用域链创建完毕。作用域链会成为这样的好理解的样子:
//形象的作用域链
Scope = ScopeChain = [
{
arguments: [],
this: window,
name: undefined
},
{
this: window,
say: function (){...},
name: "eric"
}
]
作用域链查找在js执行过程中的模拟
然后js开始一句一句解析say函数的代码,
第一句,var name = "xu"
此时,活动对象的name值才会将undefined变为'xu';
然后执行第二句console.log(name);
这句中有一个变量name
,这个时候作用域链就该出场了。
js引擎会开始执行查找,首先从ActivationObject活动对象中开始找,因为经过var name = "eric";
此时作用域链的第一个,即活动对象已经变成
{
arguments: [],
this: window,
name: 'xu'
}
所以输出‘xu’,而不是‘eric’
如果我们将say函数,做下改动如下:
var name = "eric";
function say(){
var age = 99;
console.log(name);
}
say();//eric
因为内部的没有定义name变量,这个结果不出意料的我们都知道,但这个过程我把它模拟成以下查找过程:
//从当前函数的活动对象开始,一层一层向上查找,直到顶层全局作用域
//break这句相当重要,当前这一层找到了,不再向上一层找了。即在这一层环境中找到了变量name
for (var i=0;i<Scope.length;i++){
if (name in Scope[i]){
console.log(Scope[i].name);
break;
}
}
我觉得这段代码,可以非常形象的表达了作用域链的查找过程
,
即首先查找第一个变量对象,其实就是函数内部的活动对象,如果找到则不进行下一个变量对象的查找,如果内部函数没有,才会沿着作用域链找下一个值,直到顶层的全局环境。
这就是为什么我用数组去模拟作用域链的原因,因为作用域链可以理解是个有序列表(其实作用域链的本质就是指向变量对象的指针列表)
,查找过程是按顺序查找的。
通过上面的形象化解释,是不是非常好理解作用域和作用域链了呢!!!
垃圾回收
我们都知道在函数执行完毕之后,内部的变量和内部定义的函数会随之销毁,也就是被垃圾回收机制所回收,如下:
function talk(){
var name = 'eric';
function say(){
console.log(name);
}
say();
}
talk();
当talk函数执行后,内部的变量name
和声明的函数say
会从内存中销毁,但闭包的情况就不会。如:
function createTalk(){
var name = 'eric';
var age = 99;
return function (){
var innerName = name;
console.log(innerName);
}
}
var talk = createTalk();
talk();
闭包中没有释放局部变量的原因
闭包的本质其实是有权访问另一个函数作用域中变量的函数
根据我们上面模拟的作用域链模型,上面的例子中当talk执行时,整个作用域链可以形象化为:
ScopeChain = [
{
arguments:[],
this: window,
innerName: undefined
},
{
arguments:[],
this: window,
name: eric,
age: 99
},
{
this: window,
createTalk: function (){...},
talk: function (){...} //内部return的匿名函数
},
]
这样当createTalk执行后,talk变量仍然保持了对函数内部变量和内部匿名函数的引用,因此即使createTalk执行完毕,虽然其执行环境被销毁,但返回的匿名函数的作用域链被初始化为createTalk()函数的活动对象和全局变量对象,内部变量仍然没有被垃圾回收机制所回收。虽然返回的匿名函数,仅使用了外一层的name变量,而没有使用age变量。但其内部保存的仍然是整个外层变量对象,即
{
arguments:[],
this: window,
name: eric,
age: 99
}
而不仅仅是外层的name变量一个值,因为查找过程中,使用的是整个的变量对象来查找的。因为是查找,所以存在遍历整个对象的过程,而不是简单的赋值
。
这就是为什么闭包会占用更多的内存的原因,因为其保存了整个变量对象。虽然我们的例子可能就几个,但在实际应用中可能存在非常多。
这也是我们要谨慎使用闭包的原因。
闭包的经典实例
接下来我们看一个经典的闭包示例。
var result = [];
for (var i=0;i<10;i++){
result[i] = function (){
return i;
}
}
结果或许大家都知道了,result数组的任何一个执行,都会返回10。下面我们用上面模拟的作用链,形象话的看下,
比如result[9]()函数执行的初始化作用域链如下:
ScopeChain = [
//第一层是内部匿名函数的变量对象
{
arguments:[],
this: window
},
//第二层是外部的,也就是全局变量对象
{
this: window,
result: [Array],
i: 10 //此时全局环境的i已经经过for循环变成了10
},
]
自然任何一个result的值调用函数,都会是返回10。
通过变形符合预期的闭包如下:
var result = [];
for (var i=0;i<10;i++){
result[i] = function (num){
return function (){
return num;
}
}(i);
}
上面这个经典的闭包返回的就是我们想要的各自的i,为了更好理解,我还是使用形象的作用域链。
当匿名函数执行时,看下它的初始作用域链:
ScopeChain = [
//第一层为传入参数i的自执行函数
{
arguments:[],
this: window,
},
{
arguments:[num],
num: 9,
this: window,
}
{
this: window,
result: [Array],
i: 10
}
]
我们可以理解为多了一层作用域链的变量对象,使其能保留对num副本的引用,而不是对i的引用。
好了,通过深入理解作用域链,我们能跟好的理解js的运行机制和闭包的原理。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。