有关封装和信息隐藏的误区

  上次介绍 Python 的面对对象特性,其中扯到了封装(Encapsulation)等概念。当时为了不跑题,没有深入聊这些概念。考虑到很多开发人员对这些概念,经常混淆不清。今天再专门来说一下。
  从字面意思来看,封装就是把一些【相关的】东西打包成一坨(看到“坨”这个量词,不要想歪了)。“封装”最广为人知的例子,就是在面向对象编程(以下简称 OOP)里面,把数据和针对该数据的操作,统一到一个 class 里。   那封装有啥好处捏?一个主要的好处,就是增加软件代码的内聚性。通过增加内聚性,进而提高可复用性和可维护性。   很多人把封装的概念局限于类,认为只有 OO 中的 class 才算是封装。这实际上是片面滴!在很多不使用”类”的场合,一样能采用封装的手法。   下面俺随手举几个和 OO 无关的例子:

  1. 通过文件

  比如 C 和 C++ 支持对头文件的包含(#include)。因此,可以把一些相关的常量定义、类型定义、函数声明,统统封装到某个头文件中。

  2. 通过 namespace / package / module

  C++ 的 namespace、Java 的 package、Python 的 module,想必各自的开发人员都很熟悉。这些语法虽然称呼各不相同,但具有相同的本质。因此,也可以利用这些语法,来进行封装。
  “信息隐藏”——顾名思义——就是把不该暴露的信息藏起来。说到信息隐藏,很多人自然而然地,就联想到某些 OO 语言(比如 C++、Java)提供的诸如”private、protected“之类的关键字。这些关键字可以通过访问控制,来达到信息隐藏的目的。   信息隐藏的好处,正好和“封装”的好处相呼应。封装是为了提高内聚性;而信息隐藏是为了降低耦合性。通过降低耦合,一样可以达到提高可复用性、可维护性这2个目的。   和封装类似,很多程序员也把信息隐藏的概念片面化——认为信息隐藏仅限于 private 和 protected 关键字。 所以,俺再随手举几个其它的信息隐藏手段。

  1. 通过接口类

  可以通过定义接口类(Java 中的 interface、C++ 中的纯虚类)来实现信息隐藏。具体实现如下:   定义一个接口类,仅包含一些公有的成员函数的【声明】(Java 的 abstract 函数,C++ 的纯虚函数),没有任何函数实现,也没有任何成员变量。然后把具体的实现代码放到该接口类的一个派生子类中。   由于调用者只看到接口类,看不到实现类。所以,同样可以达到信息隐藏。在某些情况下,使用这种手段达到的效果,会比基于访问控制(使用 private 关键字)的效果【更好】。   不过这种手段依赖于语言的支持。使用该手法的编程语言,至少要支持继承、虚函数等语法。

  2. 通过 pimpl 手法

  pimpl 手法也叫作“Opaque Pointer”手法。和接口类的手法不同,pimpl 手法不需要靠继承、虚函数等语法的支持,因此对诸如 C 语言来说,很有用。

  为了省事儿,俺就不具体解释该手法的实现细节。有兴趣的同学请看“这里”(连不同语言的样例代码都展示给你了,要是再看不懂就只有怪自己笨了)。

  介绍完一些基本概念,再来说一下,关于封装、信息隐藏的一些常见误区。   这是混淆最严重的一个误区——很多初学 OOP 的同学都把封装和信息隐藏混为一谈。希望经过俺前面的一番解释,有些人能搞明白其中的差异。

  顺便提一下,有个老外写了篇小有名气的文章——《Encapsulation is not information hiding》。洋文好的同学,可以去瞅一瞅。

  其实前面已经通过举例,驳斥了狭隘看待封装的误区。此处不再啰嗦。   前面已经通过举例,驳斥了狭隘看待信息隐藏的误区。此处不再啰嗦。   考虑到某些网友可能连这两者的区别都不太清楚,先简单解释一下。所谓可访问性,就是可以对某个东西进行读/写操作;所谓可见性,就是能够感觉到某个东西的存在。   前面谈到信息隐藏时,我们提及了通过访问控制的关键字(private、protected)来达到信息隐藏的目的。有很多同学认为这几个关键字不光禁止了可访问性(accessibility),还禁止了可见性(visibility)。   其实也不尽然。不同的编程语言,对这两者的处理是不同滴。比如在 C++ 语言中,类的私有成员虽然”不可访问“,但【依然可见】。此话怎讲捏?请看下面的例子:

int n \= 0; class Parent { public: Parent() { n \= 1; } private: int n; }; class Child : public Parent { public: Child() { } void Func() { ::printf(“%d”, n); } }; int main() { Child c; c.Func(); return 0; }

  现在俺问列位看官:程序执行后会打印出啥?相信一多半的同学会回答:“打印0”。   如果你也这么想,很遗憾,你答错了。   答错的同学,不要急着看答案。 建 议 你 再 思 考 一 柱 香 的 功 夫 。

  真相是:该程序根本在编译时就报错了

  问题在于,父类的私有成员变量 n 虽然对子类是无法访问的,但依然是可见的(可感知的)。所以,对于那个 printf 语句,编译器会认为是企图访问父类的私有成员,故而报错。   悄悄跟大伙儿说一下:这例子是俺从 C++ 它爹所写的《The Design and Evolution of C++》里面剽窃来滴 :)   今天的话题,基本上到此结束了。最后,俺想提醒列位看官注意一下:象封装和信息隐藏,都属于编程的基本功,为啥很多开发人员都没有想透彻捏?

俺博客上,和本文相关的帖子(需翻墙)

为什么俺推荐 Python(系列)