Skip to content

21如何利用JavaScript实现经典数据结构?

前面几讲我们从编程思维的角度分析了软件设计哲学。从这一讲开始,我们将深入数据结构这个话题。

数据结构是计算机中组织和存储数据的特定方式,它的目的是方便且高效地对数据进行访问和修改。数据结构体现了数据之间的关系,以及操作数据的一系列方法。数据又是程序的基本单元,因此无论哪种语言、哪种领域,都离不开数据结构;另一方面,数据结构是算法的基础,其本身也包含了算法的部分内容。也就是说,想要掌握算法,有一个坚固的数据结构基础是必要条件。

下面我们用 JavaScript 实现几个常见的数据结构。

数据结构介绍

我通常将数据结构分为八大类。

  • 数组:Array

  • 堆栈:Stack

  • 队列:Queue

  • 链表:Linked Lists

  • 树:Trees

  • 图:Graphs

  • 字典树:Trie

  • 散列表(哈希表):Hash Tables

我们可以先大体感知一下各种数据结构之间的关系:

  • 栈和队列是类似数组的结构,非常多的初级题目要求用数组实现栈和队列,它们在插入和删除的方式上和数组有所差异,但是实现还是非常简单的;

  • 链表、树和图这种数据结构的特点是,其节点需要引用其他节点,因此在增/删时,需要注意对相关前驱和后继节点的影响;

  • 可以从堆栈和队列出发,构建出链表;

  • 树和图最为复杂,但它们本质上扩展了链表的概念;

  • 散列表的关键是理解散列函数,明白依赖散列函数实现保存和定位数据的过程;

  • 直观上认为,链表适合记录和存储数据;哈希表和字典树在检索数据以及搜索方面有更大的应用场景。

以上这些"直观感性"的认知并不是"恒等式",我们将在下面的学习中去印证这些"认知",这两讲中,你将会看到熟悉的 React、Vue 框架的部分实现,将会看到典型的算法场景,也请你做好相关基础知识的储备。

堆栈和队列

栈和队列是一种操作受限的线性结构,它们非常简单,虽然 JavaScript 并没有原生内置这样的数据结构,但是我们可以轻松地模拟出来。

栈的实现,后进先出 LIFO(Last in、First out):

java
class Stack {
  constructor(...args) {
  	 // 使用数组进行模拟
    this.stack = [...args]
  }
  push(...items) {
  	 // 入栈
    return this.stack.push(... items)
  }
  pop() {
  	// 出栈,从数组尾部弹出一项
    return this.stack.pop()
  }
  peek() {
    return this.isEmpty() 
        ? undefined
        : this.stack[this.size() - 1]
  }
  isEmpty() {
    return this.size() == 0
  }
  size() {
    return this.stack.length
  }
}

队列的实现,先进先出 FIFO(First in、First out),"比葫芦画瓢"即可:

java
class Queue {
  constructor(...args) {
  	 // 使用数组进行模拟
    this.queue = [...args]
  }
  enqueue(...items) {
    // 入队
    return this.queue.push(... items)
  }
  dequeue() {
    // 出队
    return this.queue.shift()
  }
  front() { 
    return this.isEmpty()
        ? undefined
        : this.queue[0]
  }
  back() {
    return this.isEmpty()
        ? undefined
        : this.queue[this.size() - 1]
  }
  isEmpty() {
    return this.size() == 0
  }
  size() {
    return this.queue.length
  }
}

我们可以看到不管是栈还是队列,都是用数组进行模拟的。数组是最基本的数据结构,但是它的价值是惊人的。我们会在下一讲,进一步介绍栈和队列的应用场景。

链表(单向链表和双向链表)

堆栈和队列都可以利用数组实现,链表和数组一样,也实现了按照一定的顺序存储元素,不同的地方在于链表不能像数组一样通过下标访问,而是每一个元素都能够通过"指针"指向下一个元素 。我们可以直观地得出结论:链表不需要一段连续的存储空间,"指向下一个元素"的方式能够更大限度地利用内存。

根据上述内容,我们可以总结出链表的优点在于:

  • 链表的插入和删除操作的时间复杂度是常数级的,我们只需要改变相关节点的指针指向即可;

  • 链表可以像数组一样顺序访问,查找元素的时间复杂度是线性的。

要想实现链表,我们需要先对链表进行分类,常见的有单链表和双向链表

  • 单链表:单链表是维护一系列节点的数据结构,其特点是:每个节点包含了数据,同时包含指向链表中下一个节点的指针。

  • 双向链表:不同于单链表,双向链表特点:每个节点分支除了包含其数据以外,还包含了分别指向其前驱和后继节点的指针。

首先,根据双向链表的特点,我们实现一个节点构造函数(节点类),如下代码:

java
class Node {
    constructor(data) {
        // data 为当前节点储存的数据
        this.data = data
        // next 指向下一个节点
        this.next = null
        // prev 指向前一个节点
        this.prev = null
    }
}

有了节点类,我们来初步实现双向链表类,如下代码:

java
class DoublyLinkedList {
    constructor() {
        // 双向链表开头
        this.head = null
        // 双向链表结尾
      	 this.tail = null
    }
    // ...
}

接下来,需要实现双向链表原型上的一些方法,这些方法包括以下几种。

  • add:在链表尾部添加一个新的节点,实现如下代码:
java
add(item) {
  // 实例化一个节点
  let node = new Node(item)
  // 如果当前链表还没有头
  if(!this.head) {
    this.head = node
    this.tail = node
  }
  
  // 如果当前链表已经有了头,只需要在尾部加上该节点
  else {
    // 把当前的尾部作为新节点的 prev
    node.prev = this.tail
    // 把当前的尾部的 next 指向为新节点 node
    this.tail.next = node
    this.tail = node
  }
}
  • addAt:在链表指定位置添加一个新的节点,实现如下代码:
java
addAt(index, item) {
   let current = this.head
   
   // 维护查找时当前节点的索引
   let counter = 1
   let node = new Node(item)
   // 如果在头部插入
   if (index === 0) {
     this.head.prev = node
     node.next = this.head
     this.head = node
   } 
   
   // 非头部插入,需要从头开始,找寻插入位置
   else {
     while(current) {
      current = current.next
      if( counter === index) {
        node.prev = current.prev
        current.prev.next = node
        node.next = current
        current.prev = node
      }
      counter++
    }
  }
}
  • remove:删除链表指定数据项节点,实现如下代码:
java
remove(item) {
  let current = this.head
  while (current) {
       // 找到了目标节点
    if (current.data === item ) {
      // 目标链表只有当前目标项,即目标节点即是链表头又是链表尾
      if (current == this.head && current == this.tail) {
        this.head = null
        this.tail = null
      } 
      // 目标节点为链表头
      else if (current == this.head ) {
        this.head = this.head.next
        this.head.prev = null
      } 
      // 目标节点为链表尾部
      else if (current == this.tail ) {
        this.tail = this.tail.prev;
        this.tail.next = null;
      } 
      // 目标节点在链表首尾之间,中部
      else {
        current.prev.next = current.next;
        current.next.prev = current.prev;
      }
   }
   current = current.next
  }
}
  • removeAt:删除链表指定位置节点,实现如下代码:
java
removeAt(index) {
  // 都是从"头"开始遍历
  let current = this.head
  let counter = 1
  // 删除链表头部
  if (index === 0 ) {
   this.head = this.head.next
   this.head.prev = null
  } 
  else {
   while(current) {
    current = current.next
    // 如果目标节点在链表尾
    if (current == this.tail) {
     this.tail = this.tail.prev
     this.tail.next = null
    } 
    else if (counter === index) {
     current.prev.next = current.next
     current.next.prev = current.prev
     break
    }
    counter++
   }
  }
}
  • reverse:翻转链表,实现如下代码:
java
reverse() {
  let current = this.head
  let prev = null
  while (current) {
   let next = current.next
   // 前后倒置
   current.next = prev
   current.prev = next
   prev = current
   current = next
  }
  this.tail = this.head
  this.head = prev
}
  • swap:交换两个节点数据,实现如下代码:
java
swap(index1, index2) {
  // 使 index1 始终小于 index2,方便后面查找交换
  if (index1 > index2) {
    return this.swap(index2, index1)
  }
  let current = this.head
  let counter = 0
  let firstNode
  while(current !== null) {
    // 找到第一个节点,先存起来
    if (counter === index1 ){
        firstNode = current
    } 
    // 找到第二个节点,进行数据交换
    else if (counter === index2) {
      // ES 提供了更为简洁的交换数据的方式,这里我们用传统方式实现,更为直观
      let temp = current.data
      current.data = firstNode.data
      firstNode.data = temp
    }
    current = current.next
    counter++
  }
  return true
}
  • isEmpty:查询链表是否为空,实现如下代码:
java
isEmpty() {
  return this.length() < 1
}
  • length:查询链表长度,实现如下代码:
java
length() {
  let current = this.head
  let counter = 0
  // 完整遍历一遍链表
  while(current !== null) {
    counter++
    current = current.next
  }
  return counter
}
  • traverse:遍历链表,实现如下代码:
java
traverse(fn) {
  let current = this.head
  
  while(current !== null) {
    // 执行遍历时回调 
    fn(current)
    current = current.next
  }
  return true
}

如上代码,有了上面 length 方法的遍历实现,traverse 也就不难理解了,它接受一个遍历执行函数,在 while 循环中进行调用。

  • find:查找某个节点的索引,实现如下代码:
java
find(item) {
  let current = this.head
  let counter = 0
  while( current ) {
    if( current.data == item ) {
      return counter
    }
    current = current.next
    counter++
  }
  return false
}

至此,我们就实现了所有双向链表(DoublyLinkedList)的方法。仔细分析整个实现过程,你可以发现:双向链表的实现并不复杂,在手写过程中,需要开发者做到心中有"表",考虑到当前节点的 next 和 prev 取值,逻辑上还是很简单的。

前端开发者应该对树这个数据结构丝毫不陌生,不同于之前介绍的所有数据结构,树是非线性的。因为树决定了其存储的数据直接有明确的层级关系,因此对于维护具有层级特性的数据,树是一个天然良好的选择。

事实上,树有很多种分类,但是它们都具有以下特性:

  • 除了根节点以外,所有的节点都有一个父节点;

  • 每一个节点都可以有若干子节点,如果没有子节点,则称此节点为叶子节点;

  • 一个节点所拥有的叶子节点的个数,称之为该节点的度,因此叶子节点的度为 0;

  • 所有节点中,最大的度为整棵树的度;

  • 树的最大层次称为树的深度。

我们这里对二叉搜索树展开分析。二叉树算是最基本的树,因为它的结构最简单,每个节点至多包含两个子节点。二叉树又非常有用,因为根据二叉树,我们可以延伸出二叉搜索树(BST)、平衡二叉搜索树(AVL)、红黑树(R/B Tree)等。

二叉搜索树有以下特性:

  • 左子树上所有结点的值均小于或等于它的根结点的值;

  • 右子树上所有结点的值均大于或等于它的根结点的值;

  • 左、右子树也分别为二叉搜索树。

根据其特性,我们实现二叉搜索树还是应该先构造一个节点类,如下代码:

java
class Node { 
  constructor(data) { 
    this.left = null
    this.right = null
    this.value = data
  } 
}

然后我们实现二叉搜索树的以下方法。

  • insertNode:根据一个父节点,插入一个子节点,如下代码:
java
insertNode(root, newNode) {
  // 根据待插入节点的值的大小,递归调用 this.insertNode
  if (newNode.value < root.value) {
    (!root.left) ? root.left = newNode : this.insertNode(root.left, newNode)
  } else {
    (!root.right) ? root.right = newNode : this.insertNode(root.right, newNode)
  }
}
  • insert:插入一个新节点,如下代码:
java
insert(value) {
    let newNode = new Node(value)
    // 判读是否是根节点
    if (!this.root) {
      this.root = newNode
    } else {
    	// 不是根结点,则直接调用 this.insertNode 方法
      this.insertNode(this.root, newNode)
    }
}

理解这两个方法是理解二叉搜索树的关键,如果你理解了这两个方法,下面的其他方法也就"不在话下"。

我们可以看到,insertNode 方法先判断目标父节点和插入节点的值,如果插入节点的值更小,则考虑放到父节点的左边,接着递归调用 this.insertNode(root.left, newNode);如果插入节点的值更大,以此类推即可。insert 方法只是多了一步构造 Node 节点实例,接下来区分有无父节点的情况,调用 this.insertNode 方法即可。

  • removeNode:根据一个父节点,移除一个子节点,如下代码:
java
removeNode(root, value) {
    if (!root) {
      return null
    }
    if (value < root.value) {
      root.left = this.removeNode(root.left, value)
      return root
    } else if (value > root.value) {
      root.right = tis.removeNode(root.right, value)
      return root
    } else {
      // 找到了需要删除的节点 
      // 如果当前 root 节点无左右子节点
      if (!root.left && !root.right) {
        root = null
        return root
      }
      // 只有左节点
      if (root.left && !root.right) {
        root = root.left
        return root
      } 
      // 只有右节点
      else if (root.right) {
        root = root.right
        return root
      }
      // 有左右两个子节点
      let minRight = this.findMinNode(root.right)
      root.value = minRight.value
      root.right = this.removeNode(root.right, minRight.value)
      return root
    }
  }
  • remove:移除一个节点,如下代码:
java
remove(value) {
    if (this.root) {
      this.removeNode(this.root, value)
    }
}
// 找到最小的节点
// 该方法不断递归,直到找到最左叶子节点即可
findMinNode(root) {
    if (!root.left) {
      return root
    } else {
      return this.findMinNode(root.left)
    }
}

上述代码不难理解,唯一需要说明的是:当需要删除的节点含有左右两个子节点时,因为我们要把当前节点删除,就需要找到合适的"补位"节点,这个"补位"节点一定在该目标节点的右侧树当中,因为这样才能保证"补位"节点的值一定大于该目标节点的左侧树所有节点,而该目标节点的左侧树不需要调整;同时为了保证"补位"节点的值一定要小于该目标节点的右侧树值,因此要找的"补位"节点其实就是该目标节点的右侧树当中最小的那个节点。

  • searchNode:根据一个父节点,查找子节点,如下代码:
java
searchNode(root, value) {
    if (!root) {
      return null
    }
    if (value < root.value) {
      return this.searchNode(root.left, value)
    } else if (value > root.value) {
      return this.searchNode(root.right, value)
    }
    return root
}
  • search:查找节点,如下代码:
java
search(value) {
    if (!this.root) {
      return false
    }
    return Boolean(this.searchNode(this.root, value))
}
  • preOrder:前序遍历,如下代码:
java
preOrder(root) {
    if (root) {
      console.log(root.value)
      this.preOrder(root.left)
      this.preOrder(root.right)
    }
}
  • InOrder:中序遍历,如下代码:
java
inOrder(root) {
    if (root) {
      this.inOrder(root.left)
      console.log(root.value)
      this.inOrder(root.right)
    }
}
  • PostOrder:后续遍历,如下代码:
java
postOrder(root) {
    if (root) {
      this.postOrder(root.left)
      this.postOrder(root.right)
      console.log(root.value)
    }
}

上述前、中、后序遍历的区别其实就在于console.log(root.value) 方法执行的位置

图是由具有边的节点集合组成的数据结构,图可以是定向的或不定向的。图也是应用最广泛的数据结构之一,真实场景中处处有图。当然更多概念还是需要你先进行了解,尤其是图的几种基本元素。

  • 节点:Node

  • 边:Edge

  • |V|:图中顶点(节点)的总数

  • |E|:图中的连接总数(边)

这里我们主要实现一个有向图,Graph 类,如下代码:

java
class Graph {
  constructor() {
  	 // 使用 Map 数据结构表述图中顶点关系
    this.AdjList = new Map()
  }
}

我们先通过创建节点,来创建一个图,如下代码:

java
let graph = new Graph();
graph.addVertex('A')
graph.addVertex('B')
graph.addVertex('C')
graph.addVertex('D')
  • 添加顶点:addVertex,如下代码:
java
addVertex(vertex) {
  if (!this.AdjList.has(vertex)) {
    this.AdjList.set(vertex, [])
  } else {
    throw 'vertex already exist!'
  }
}

这时候,A、B、C、D 顶点都对应一个数组,如下代码所示:

java
  'A' => [],
  'B' => [],
  'C' => [],
  'D' => []

数组将用来存储边。我们设计图预计得到如下关系:

java
Map {
  'A' => ['B', 'C', 'D'],
  'B' => [],
  'C' => ['B'],
  'D' => ['C']
}

根据以上描述,其实已经可以把图画出来了。addEdge 需要两个参数:一个是顶点,一个是连接对象 Node。我们看看添加边是如何实现的。

  • 添加边:addEdge,如下代码:
java
 addEdge(vertex, node) {
    if (this.AdjList.has(vertex)) {
      if (this.AdjList.has(node)){
        let arr = this.AdjList.get(vertex)
        if (!arr.includes(node)){
          arr.push(node)
        }
      } else {
        throw `Can't add non-existing vertex ->'${node}'`
      }
    } else {
      throw `You should add '${vertex}' first`
    }
}

理清楚数据关系,我们就可以打印图了,其实就是一个很简单的 for...of 循环:

  • 打印图:print,如下代码:
java
print() {
  // 使用 for of 遍历并打印 this.AdjList
  for (let [key, value] of this.AdjList) {
    console.log(key, value)
  }
}

剩下的内容就是遍历图了。遍历分为广度优先算法(BFS)和深度优先搜索算法(DFS)。我们先来看下广度优先算法(BFS)。

广度优先算法遍历,如下代码:

java
createVisitedObject() {
  let map = {}
  for (let key of this.AdjList.keys()) {
    arr[key] = false
  }
  return map
}
bfs (initialNode) {
  // 创建一个已访问节点的 map
  let visited = this.createVisitedObject()
  // 模拟一个队列
  let queue = []
  // 第一个节点已访问
  visited[initialNode] = true
  // 第一个节点入队列
  queue.push(initialNode)
  while (queue.length) {
    let current = queue.shift()
    console.log(current)
     // 获得该节点的其他节点关系
    let arr = this.AdjList.get(current)
    for (let elem of arr) {
      // 如果当前节点没有访问过
      if (!visited[elem]) {
        visited[elem] = true
        queue.push(elem)
      }
    }
  }
}

如上代码所示,我们来进行简单总结。广度优先算法(BFS),是一种利用队列实现的搜索算法。对于图来说,就是从起点出发,对于每次出队列的点,都要遍历其四周的点。

因此 BFS 的实现步骤:

  • 起始节点作为起始,并初始化一个空对象------visited;

  • 初始化一个空数组,该数组将模拟一个队列;

  • 将起始节点标记为已访问;

  • 将起始节点放入队列中;

  • 循环直到队列为空。

深度优先算法,如下代码:

java
createVisitedObject() {
  let map = {}
  for (let key of this.AdjList.keys()) {
    arr[key] = false
  }
  return map
}
 // 深度优先算法
 dfs(initialNode) {
    let visited = this.createVisitedObject()
    this.dfsHelper(initialNode, visited)
  }
  dfsHelper(node, visited) {
    visited[node] = true
    console.log(node)
    let arr = this.AdjList.get(node)
    // 遍历节点调用 this.dfsHelper
    for (let elem of arr) {
      if (!visited[elem]) {
        this.dfsHelper(elem, visited)
      }
    }
  }
}

如上代码,对于深度优先搜索算法(DFS),我把它总结为:"不撞南墙不回头",从起点出发,先把一个方向的点都遍历完才会改变方向。换成程序语言就是:"DFS 是利用递归实现的搜索算法"。因此 DFS 的实现过程:

  • 起始节点作为起始,创建访问对象;

  • 调用辅助函数递归起始节点。

BFS 的实现重点在于队列,而 DFS 的重点在于递归,这是它们的本质区别。

总结

这一讲我们介绍了和前端最为贴合的几种数据结构,事实上数据结构更重要的是应用,我希望你能够做到:在需要的场景,能够想到最为适合的数据结构处理问题。请你务必掌握好这些内容,接下来的几讲都需要对数据结构有一个较为熟练的掌握和了解。我们马上进入数据结构的应用学习。

本讲内容总结如下:

随着需求的复杂度上升,前端工程师越来越离不开数据结构。是否能够掌握这个难点内容,将是进阶的重要考量。下一讲,我们将解析数据结构在前端中的具体应用场景,来帮助你加深理解,做到灵活应用。