Appearance
第09讲:为什么代码没有按照编写顺序执行?
前端工程师算是最幸运的软件工程师,因为从一开始就可以接触到"异步"这种高级特性,比如 DOM 事件、AJAX 请求及定时器;同时也是最不幸的软件工程师,因为入门 JavaScript 的时候就要习惯异步这种高难度的开发方式,比如上一课时提到的那道经典的笔试题,就是异步造成的输出结果与预期不一致。
这一课时我们就来深入讲解前端工程师熟悉但并不完全了解的 JavaScript 异步。
了解异步
异步和同步
相比异步 而言,大多数工程师可能更熟悉的是同步。
要比较同步和异步,可以将调用函数的过程分成两部分:执行操作和返回结果。
程序在同步调用函数的时候,会立即执行操作并等待得到返回结果后再继续运行 ,也就是说同步执行是阻塞的。
而异步会将操作和结果在时间上分隔开来,在当下执行操作,在未来某个时刻返回结果,在这个等待返回结果的过程中,程序将继续执行后面的代码。也就是说异步执行是非阻塞的。
再举个简单的例子来说明同步和异步。
下面的代码定义了同步函数 syncAdd 和异步函数 asyncAdd,调用 syncAdd(1,2) 函数时会等待得到结果之后再执行后面的代码。而调用 asyncAdd(1,2,console.log) 时则会在得到结果之前继续执行,直到 1 秒后得到结果并打印。
javascript
function syncAdd(a, b) {
return a + b;
}
syncAdd(1, 2) // 立即得到结果 3
function asyncAdd(a, b, cb) {
setTimeout(function() {
cb(a + b);
}, 1000)
}
asyncAdd(1, 2, console.log) // 1s后打印结果 3
异步与回调
如果你经常调用 JavaScript 的异步函数可能会形成一个结论:异步操作都采用回调函数的形式。
毕竟从浏览器端的 DOM 事件、AJAX 请求、定时器到 Node.js 端的文件读写、多进程,都是采用的回调形式。但事实真是如此吗?
下面是一段简单的代码,定义了一个 JSON 对象 a,然后把它打印到控制台,最后再将对象 a 的 couter.index 属性值自增 1。
javascript
var a = {
counter: {
index: 1
}
};
console.log( a ); // ?
a.counter.index++;
如果你把上面的代码复制粘贴到浏览器控制台中运行,应该可以看到控制台打印了一个可能和你预期不一致的 JSON 对象:{conter:{index: 2}}。
原因在于浏览器在运行代码的时候,把控制台打印这种涉及 I/O 的操作进行了延迟执行。可能你会猜想是不是控制台打印的只是将对象 a 进行了类似"浅拷贝"的操作,否定这种猜想很简单,此时再执行一次自增操作,就会发现被打印的对象值并没有发生变化。
既然并非所有异步都回调,那么反过来,是否所有回调函数都是异步执行的呢?答案也是否定的。
在上一课时中我们就提到过回调形式的同步函数,比如数组原型函数 forEach,又比如改变 this 指向的 call。
异步原理
回顾了异步的基础概念,下面就来深入讲解异步的原理。
事件循环
对于大多数语言而言,实现异步会通过启动额外的进程、线程或协程来实现,而我们在前面已经提到过,JavaScript 是单线程的。
为什么单线程还能实现异步呢?
其实也没有什么特殊的黑魔法,只是把一些操作交给了其他线程处理,然后采用了一种称之为"事件循环"(也称"事件轮询")的机制来处理返回结果。
下面用一段简化的代码,来帮助你快速地理解事件循环机制。
数组 eventLoop 表示事件队列(也有称作"任务队列"),用来存放需要执行的任务事件(可以理解为回调函数),对象 event 变量表示当前需要执行的任务事件。
用一个永不停止的 while 循环来表示事件循环,每一次循环称为一个 tick。
对每个 tick 而言,如果在队列中有等待事件,那么就会从队列中获取一个事件并执行,这些事件通常是回调函数的形式。
javascript
var eventLoop = []; // 事件队列,先进先出
var event; // 事件执行成功的回调回调函数
while (true) {
// 一次tick
if (eventLoop.length > 0) {
// 队列中取出回调函数
event = eventLoop.shift();
try {
event();
} catch (err) {
reportError(err);
}
}
}
那么这个事件队列里的事件是怎么来的呢?
以 AJAX 请求为例,当我们发出一个 AJAX 请求时,浏览器会将请求任务分派给网络线程来进行处理,当对应的网络线程拿到返回的数据之后,就会把回调函数插入到事件队列中。
setTimeout 和 setInterval 也是同样的道理,当我们执行 setTimeout 的时候并不是直接把回调函数放入事件队列中。它所做的是交给定时器线程来处理,当定时器到时后,再把回调函数放在事件队列中,这样,在未来的某轮 tick 中获取并执行这个回调函数。
这么做有一个隐性的问题,如果事件队列中已经有其他事件,那么这个回调就会排队等待。
所以说 setTimeout/setInterval 定时器的精度并不高。准确地说,它只能确保回调函数不会在指定的时间间隔之前运行,但可能会在那个时刻运行,也可能在那之后运行,这就要根据事件队列的状态而定。
事件队列
在讲述 setTimeout/setInterval 原理的时候也暴露了事件队列的一个缺陷:事件队列按照先进先出的顺序执行,那么如果队列较长时,排在后面的事件即使较为"紧急",也得需要等待前面的任务先执行完成。
JavaScript 解决这个问题的思路就是:设置多个队列,按照优先级来执行。
下面这段代码可以验证 JavaScript 内部拥有优先级不同的 2 个队列,在下图中分别用绿色和红色表示,其中红色队列优先级高于绿色队列。
这段代码定义了 4 个异步函数 f1、f2、f3、f4,其中:
函数 f1 通过定时器 setTimeout 向绿色队列中插入一个控制台打印任务,输出数字 1;
函数 f2 通过 Promise 向红色队列中插入一个控制台打印任务,输出数字 2;
函数 f3 通过定时器 setTimeout 向绿色队列中插入一个回调函数,该回调函数会调用控制台打印数字 3,并且调用函数 f2;
函数 f4 通过 Promise 向红色队列中插入一个回调函数,该回调函数会调用控制台打印数字 4,并且调用函数 f1。
javascript
function f1() {
setTimeout(console.log.bind(null,1), 0)
}
function f2() {
Promise.resolve().then(console.log.bind(null,2))
}
function f3() {
setTimeout(() => {
console.log(3)
f2()
}, 0)
}
function f4() {
Promise.resolve().then(() => {
console.log(4)
f1()
}
}
f3()
f4()
这段代码的执行过程和结果可以查看下图,当调用函数 f3 和函数 f4 之后,绿色队列和红色队列都会被插入一个匿名回调函数。
第 1 次 tick,由于红色队列优先级高,所以先执行红色匿名函数,控制台打印数字 4,然后调用函数 f1,向绿色队列中插入一个打印函数;
第 2 次 tick,按照先进先出原则,此时调用匿名函数打印数字 3,并调用函数 f2,向红色队列中插入一个打印函数;
第 3 次 tick,调用红色队列中的打印函数,控制台打印数字 2;
第 4 次 tick,调用绿色队列中的打印函数,控制台打印数字 1。
关于红色队列和绿色队列,一般称为"宏任务队列 (Macro Task Queue)"和"微任务队列 (Micro Task Queue)",也有的称为"Task Queue"和"Job Queue"。不管如何称呼,我们需要记住的是,不同队列优先级不同,每次事件循环时会从优先级高的队列中获取事件,只有当优先级高的队列为空时才会从优先级低的队列中获取事件,同级队列之间的事件不存在优先级,只遵循先进先出的原则。
常见的异步函数优先级如下,从上到下优先级逐层降低:
java
process.nextTick(Node.js) >
MutationObserver(浏览器)/promise.then(catch、finnally)>
setImmediate(IE) >
setTimeout/setIntervalrequestAnimationFrame >
其他 I/O 操作 / 浏览器 DOM 事件
处理异步
由于回调函数这种形式的代码可读性非常差,所以在编写代码的时候要尽量将回调形式转化成返回 Promise 对象的形式,一方面由于 ES6 标准下提供了原生 Promise 对象及方法,另一方面 Promise 的可操作性也更强,比如可以配合 async/await 关键字使用,也可以转换成 Observable 对象。所以越来越多的第三方库异步函数都开始返回 Promise 对象。
下面我们就以 Promise 形式的异步函数为例,讲解几个常见的异步场景。
异步串行
将异步转化为串行执行是非常常见的操作,先通过一个简单的例子来回顾基本实现方式。
考虑异步函数 asyncF1 和 asyncF2,且 asyncF2 依赖 asyncF1 的返回结果执行。使用 Promise 提供的 then 函数可以直接实现,伪代码如下:
javascript
asyncF1()
.then(data => asyncF2(data))
.then(() => {
...
})
.catch(e => console.error(e))
如果使用 async/await 可以摆脱链式调用,代码可读性更好:
javascript
(async function() {
try {
const data = await asyncFn1()
const result = await asyncFn2(data)
...
} catch(e) {
console.error(e)
}
})()
回顾完基础用法,来提升一下难度。假设现在要按照顺序执行调用 asyncF 函数 n 次,该怎么实现呢?
对于这种场景可以通过数组函数 reduce 来实现,而不是简单地使用 for 循环或数组的 forEach 函数,比如像下面这样:
javascript
[1...n].reduce(async (lastPromise, i) => {
try {
await lastPromise
console.log(await asyncF())
} catch(e) {
console.error(e)
}
}, Promise.resolve())
再升级一下难度,通过一道笔试题来加深理解。
现在需要延迟打印数组 [1,2,3,4,5],每一次打印的初始延迟为 1000ms,增长延迟为 500ms。打印结果如下所示:
javascript
0s: 1
1s: 2
2.5s: 3
4.5s: 4
7s: 5
这道题也是将多个异步函数改为串行执行的典型例子,所以也可以通过 reduce 函数来实现。由于引入了递增的延迟执行,所以都需要得到上一次执行的延迟时间。具体代码如下:
javascript
const arr = [1, 2, 3, 4, 5]
arr.reduce(async (prs, cur, index) => {
const t = await prs
const time = index === 0 ? 0 : 1000 + (index - 1) * 500
return new Promise((res) => {
setTimeout(() => {
console.log(cur);
res(time)
}, time)
})
}, Promise.resolve(0))
异步并行
并行也是异步常用的场景,重点掌握下面 3 个静态函数。
(1)Promise.all([promise1 ...... promiseN])
调用函数 Promise.all 会返回一个新的 Promise 实例,该实例在参数内所有的 promise 都完成 (resolved) 时回调完成 (resolve);如果参数中 promise 有一个失败(rejected),那么此实例返回第一个失败 promise 的结果。
当执行的异步函数具有强一致性时可以使用它,比如要更新一个较大的表单数据,会发送多个请求分别更新不同的数据,如果一个请求更新失败则放弃本次提交。
(2)Promise.allSettled([promise1......promiseN])
调用函数 Promise.allsellted 会返回一个新的 Promise 实例,该实例会在所有给定的 promise 已经执行完成时返回一个对象数组,每个对象表示对应的 promise 结果。
这个函数适用于需要并发执行多个异步函数,这些异步函数的执行结果相互独立。比如同时发送多个 AJAX 请求来分别更新多条数据。
(3)Promise.race([promise1......promiseN])
调用函数 Promise.race 会返回一个新的 promise 实例,一旦参数中的某个 promise 执行完成,新的 promise 实例就会返回对应 promise 的执行结果。
这个函数会让多个并发函数产生"竞争",从而挑选出最先执行完成的。比如尝试从多个网址加载图片资源。
异常处理
Promise 有一个隐藏的"坑",那就是内部的异常不能在外部通过 try/catch 所捕获,当内部发生异常时,会自动进入失败状态(rejected)。所以下面的代码是等价的:
javascript
new Promise((resolve, reject) => {
throw new Error(0) // 等价于 reject(new Error(0))
})
所以建议尽量使用 catch 子句而不是在 then 子句中捕获 Promise 异常,因为这样可以捕获 then 子句中的异常信息。
javascript
Promise.resolve(1)
.then(data => {
const arr = data.split('')
//...
}, error => { // 这里捕获不到
// ...
})
Promise.resolve(1)
.then(data => {
const arr = data.split('')
// ...
})
.catch(error => { // 这里可以捕获
// ...
})
补充:Promise 的局限性
虽然 Promise 相对于回调具有明显的优势,但其仍然有一些局限性,至少有下面 2 个方面的问题。
立即执行
当一个 Promise 实例被创建时,内部的代码就会立即被执行,而且无法从外部停止。比如无法取消超时或消耗性能的异步调用,容易导致资源的浪费。
单次执行
Promise 处理的问题都是"一次性"的,因为一个 Promise 实例只能 resolve 或 reject 一次,所以面对某些需要持续响应的场景时就会变得力不从心。比如上传文件获取进度时,默认采用的就是通过事件监听的方式来实现。
所以说 Promise 并不是万能的,全面了解其优缺点能帮助我们更好地使用 Promise。上述这些问题其实都有解决方案,比如使用 RxJS,期待你在工作中多思考、多积累,找到更多更好的解决方案。
总结
这一课时涉及了 JavaScript 的核心特性------异步,先从异步概念说起,然后深入异步原理讲述了事件循环和事件队列,最后列举了 3 个常见异步场景的处理方法。异步属于笔试题必考的考点,比如任务队列部分,将 setTimeout/Promise/nextTick 这些异步函数和对象进行任意组合即可出题,所以一定要理解原理。
最后布置一道思考题:尝试使用 RxJS 实现多个 Promise 的串行和并行,并说说它在处理异步方面的优缺点。