Skip to content

24组合模式:如何用树形结构处理对象之间的复杂关系?

如果单纯从字面上来看,我们很容易将"组合模式"和"组合关系"搞混。组合模式最初只是用于解决树形结构的场景,更多的是处理对象组织结构之间的问题。而组合关系则是通过将不同对象封装起来完成一个统一功能。

虽然组合模式并不常用,但是学习它的原理能够帮助我们获得更多复杂结构上的思考。比如,MySQL 的索引设计中就是用了 B+ 树算法的组合模式设计,极大地提升了数据查询时的性能。组合模式的原理很容易理解,但是在代码实现上却是反直觉的,如果你一下子看不懂其原理,我建议你多看几遍,并结合例子来反复思考。

话不多说,让我们开始今天的学习吧。

模式原理分析

组合模式的定义是:将对象组合成树形结构以表示整个部分的层次结构。组合模式可以让用户统一对待单个对象和对象的组合。

这个定义中有两个关键点:一个是用树形结构来分层 ,另一个是通过统一对待来简化操作。之所以要使用树形结构,其实就是为了能够在某种层次上进行分类,并且能够通过统一的操作来对待复杂的结构。比如,我们常见的公司统计多个维度的人员的工资信息,如果一个一个统计单人的工资信息会比较费时费力,但如果我们将人员工资信息按照组织结构构建成一棵"树",那么按照一定的分类标示(比如,部门、岗位),就能快速找到相关人员的工资信息,而不是每次都要查找完所有人的数据后再做筛选。

下面我们就来看看组合模式的 UML 图:

从图中,我们可以看到组合模式中包含了三个关键角色。

  • 抽象组件:定义需要实现的统一操作。

  • 组合节点:代表一个可以包含多个节点的复合对象,意味着在它下面还可以有其他组合节点或叶子节点。

  • 叶子节点:代表一个原子对象,意味着在它下面不会有其他节点了。

组合模式最常见的结构就是树形结构,通过上面的三个角色就可以很方便地构建树形结构。我们可以结合现实中的例子来理解,比如,一个公司中有总经理,在总经理之下有经理、秘书、副经理等,而在经理之下则有组长、开发人员等,其结构图大致如下:

除了树形结构以外,组合模式中还有环形结构双向结构(如下图),其中,环形结构和数据结构中的单向链表很相似,而双向结构其实就是 Spring 中 Bean 常用的结构。

接下来我们再来看下组合模式对应 UML 的代码实现:

java
//抽象组件
public abstract class Component{
     public abstract void operation();
}
//叶子节点
public class Leaf extends Component{
    @Override
    public void operation() {
        //叶子节点的操作放这里
    }
}

//组合节点
public class Node extends Component {
    private List<Component> myChildren;  //存放子节点列表
    @Override
    public void operation() {
        for (Component component: myChildren) {
            component.operation();
        }
    }
}

这段代码的实现看上去特别简单,但是这里有一个经常容易被我们搞混淆的地方,那就是 Node 中 operation() 方法下的 for 循环。很多时候,我们以为这个 for 循环是一个固定实现的代码,但其实这个理解是错的。实际上,这里的 for 循环想要表达的意思是,遍历组合节点下的所有子节点时才需要用到循环,而不是这里只能用循环。

从上面的分析中,我们会发现组合模式封装了如下变化:

  • 叶子节点和组合节点之间的区别;

  • 真实的数据结构(树、环、网等);

  • 遍历真实结构的算法(比如,广度优先,还是深度优先等);

  • 结构所使用的策略(比如,用来汇总数据,还是寻找最佳/最坏的节点等)。

所以说,组合模式本质上封装了复杂结构的内在变化,让使用者通过一个统一的整体来使用对象之间的结构

使用场景分析

组合模式一般的使用场景有:

  • 处理一个树形结构,比如,公司人员组织架构、订单信息等;

  • 跨越多个层次结构聚合数据,比如,统计文件夹下文件总数;

  • 统一处理一个结构中的多个对象,比如,遍历文件夹下所有 XML 类型文件内容。

这里我们就拿其中的"订单信息"来举例。假设你正在开发一个新的商品订单系统(如下图),那你会如何计算每个订单的总费用呢?

从上面的简图可以看到,一个订单中可能通常会包含各类商品、发票等信息。在现实中,每个商品都会被放到一个快递盒中,然后小的盒子又可以被放入另一个更大的盒子中,以此类推,整个结构看上去像是一棵"倒过来的树"。

过去,我们在计算价格时的做法是:打开所有快递盒,找到每件商品,然后计算总价。但在程序中,你会发现这不是使用简单的 for 循环语句(一次打开盒子的动作)就能完成的,因为你还需要知道:对应的商品类别有哪些,这个订单使用了哪些商品,价格是多少,赠送的商品有哪些,要抵消多少价格......

而组合模式就是专门为需要反复计算或统计的场景而生的。接下来,我们还是通过一个简单的代码实例来帮助你快速理解与学习组合模式。

假设我们要创建一个可以生成树形对象的功能,那该怎么来具体实现呢?

首先,我们需要定义一个抽象组件 AbstractNode,其中定义节点可以做的操作有:判断是否为根节点、获取节点 id、获取节点关联父节点 id、设置 id、设置父 id、增加、删除节点和获取子节点。

java
public abstract class AbstractNode {
    public abstract boolean isRoot();
    public abstract int getId();
    public abstract int getParentId();
    public abstract void setId(int id);
    public abstract void setParentId(int parentId);
    public abstract void add(AbstractNode abstractNode);
    public abstract void remove(AbstractNode g);
    public abstract AbstractNode getChild(int i);
}

然后,创建组合节点 Node,继承自 AbstractNode 实现定义的 8 种接口方法,其中 List 对象 children 用于存放子节点列表。

java
public class Node extends AbstractNode {
    private List<AbstractNode> children;
    private int id;
    private int pid;
    public Node() {
        children = new ArrayList<AbstractNode>();
    }
    @Override
    public boolean isRoot() {
        return -1 == pid;
    }
    @Override
    public int getId() {
        return id;
    }
    @Override
    public int getParentId() {
        return pid;
    }
    @Override
    public void setId(int id) {
        this.id = id;
    }
    @Override
    public void setParentId(int parentId) {
        this.pid = parentId;
    }
    public void add(AbstractNode c) {
        c.setParentId(this.pid+children.size());
        c.setId(c.getParentId()+1);
        children.add(c);
    }
    public void remove(AbstractNode c) {
        children.remove(c);
    }
    public AbstractNode getChild(int i) {
        return children.get(i);
    }
}

接下来,再创建叶子节点 Leaf,同样继承自 AbstractNode,重写 8 种接口方法,不过,因为叶子节点不能新增和删除节点,所以添加和删除方法不支持,并且获取子节点方法也应该为空。

java
public class Leaf extends AbstractNode {
    private int id;
    private int pid;
    @Override
    public boolean isRoot() {
        return false;
    }
    @Override
    public int getId() {
        return this.id;
    }
    @Override
    public int getParentId() {
        return this.pid;
    }
    @Override
    public void setId(int id) {
        this.id = id;
    }
    @Override
    public void setParentId(int parentId) {
        this.pid  = parentId;
    }
    @Override
    public void add(AbstractNode abstractNode) {
        throw new UnsupportedOperationException("这个是叶子节点,无法增加");
    }
    @Override
    public void remove(AbstractNode g) {
        throw new UnsupportedOperationException("这个是叶子节点,无法删除");
    }
    @Override
    public AbstractNode getChild(int i) {
        return null;
    }
}

最后,我们运行一个单元测试。创建一个根节点,再将一个有两个叶子节点的组合节点添加到根节点上,并打印组合节点的 id 值。

java
    public static void main(String[] args) {
        AbstractNode rootNode = new Node();
        rootNode.setId(0);
        rootNode.setParentId(-1);
        AbstractNode node1 = new Node();
        node1.add(new Leaf());
        node1.add(new Leaf());
        rootNode.add(new Leaf());
        rootNode.add(new Leaf());
        rootNode.add(node1);

        System.out.println(node1.getId());
    }

通过单元测试代码的运行,我们就实现了建立一个简单的树形结构。从上面所有的代码实现中,你可能已经发现,定义根节点比较重要,通过根节点我们能够不断找到相关的节点,而且使用的操作都是相同的。

总结来说,在面向对象编程中,组合模式能够很好地适用于解决树形结构的应用场景。

为什么要使用组合模式?

通过上面的原理和使用场景分析,我们还可以总结出使用组合模式的三个主要原因。

第一,希望一组对象按照某种层级结构进行管理,比如,管理文件夹和文件,管理订单下的商品等。树形结构天然有一种层次的划分特性,能够让我们自然地理解多个对象间的结构。

第二,需要按照统一的行为来处理复杂结构中的对象,比如,创建文件,删除文件,移动文件等。在使用文件时,我们其实并不关心文件夹和文件是如何被组织和存储的,只要我们能够正确操作文件即可,这时组合模式就能够很好地帮助我们组织复杂的结构,同时按照定义的统一行为进行操作。

第三,能够快速扩展对象组合。 比如,订单下的手机商品节点可以自由挂接不同分类的手机(品牌类的,如华为、苹果),并且还可以按照商品的特性(如,价格、图片、商家、功能等)再自由地挂接新的节点组合,而查找时可以从手机开始查找,不断增加节点类型,直到找到合适的手机商品。

收益什么?损失什么?

使用组合模式主要有以下三大优点。

  • 清晰定义分层结构。组合模式在实现树形结构时,能够非常清楚地定义层次,并且能让使用者忽略层次的差异,以方便对整个层次结构进行控制。

  • 简化了使用者使用复杂结构数据的代码。由于组合模式中的对象只有组合节点和叶子节点两种类型,而节点的使用操作是一样的,比如,查找子节点,查找父节点等,那么对于使用者来说,就能使用一致的行为,而不用不关心当前处理的是单个对象还是整个结构,间接简化了使用者的代码。

  • 快速新增节点,提升组合灵活性。 在组合模式中,新增节点会很方便,而无须对现有代码进行任何修改,符合"开闭原则";同时还能够在局部节点上按照相关性再进行自由的组合,大大提升了对象结构的灵活性。

同样,组合模式也有一些缺点。

  • 难以限制节点类型。 比如,在上面的订单例子中,订单树中除了组合商品类的节点外,实际上只要不约束,就可以组合任意类型的节点,因为它们都来自同一个根节点,都属于节点类型,只不过节点里包含的信息各不相同罢了,所以,在使用组合模式时,通常需要在设计时从逻辑层面上进行一定的约束。

  • 需要增加很多运行时的检查,增加了代码复杂度。 一旦对象类型不能做限制后,就必须通过运行时来进行类型检查,而这个实现过程比较复杂,会增加很多额外的代码耦合性,同时还会增加代码的理解难度。

  • 错误的遍历算法可能会影响系统性能。 组合模式实现树形结构虽然好用,但是一旦使用了错误的遍历算法,就会在数据量剧增的情况下拖慢系统速度,比如,当使用简单多层 for 循环嵌套来查找全量的数据时,算法的时间复杂度可能是 m 次方 O(n^m),会造成外部服务阻塞等待,这样很可能会直接导致其他服务因为长时间等待而出现超时错误。因此,使用组合模式时一定要谨慎选择遍历算法。

总结

在我看来,组合模式虽然不太常用,但却是非常重要的模式之一,对于初学者来说,可能就需要花比一般模式稍微多一点的时间来理解才行。组合模式的原理很简单,可使用时也可能会因为遍历算法多种多样,反而没看上去那么用好,比如,二叉树、B+ 树等树形结构的遍历算法。

在学习组合模式的过程中,虽然在心理上会容易产生畏难的情绪,但我还是强烈建议你应该多花一些时间来学习它,这是因为当你阅读一些优秀组件或框架的源码时,会经常看到组合模式的身影,如果不能理解组合模式的本质,看懂源码也就无从谈起了。

不过,也不要过于担心,学好组合模式还是有一些技巧的。比如,你可以从一些简单的例子入手,感知组合模式在代码中呈现的形式,甚至可以在遍历每一个节点时都打印相关节点信息。另外,你还可以模仿一些组合模式的实现代码,然后再结合原理去分析对方的实现逻辑,这样也能快速掌握组合模式的要领。

课后思考

虽然组合模式有很多优点,但是你有想过在哪些场景下是完全不适合组合模式的吗?

欢迎留言分享,我会第一时间给你回复。

在下一讲,我会接着与你分享"装饰模式:如何在基础组件上扩展新功能?"这个话题,记得按时来听课!