X Window 架构概述

原文：

X Window System Architecture Overview HOWTO

http://www.linuxdoc.org/HOWTO/XWindow-Overview-HOWTO/index.html

Daniel Manrique

roadmr@entropia.com.mx

Translated By Bob

Email：gexbob@gmail.com

Blog：http://shaocheng.li

修订历史

Revision 1.0.1 2001-05-22 Revised by: dm 一些语法修正，由Bill Staehle指出。

Revision 1.0 2001-05-20 Revised by: dm 初始发行。

本文档描述了X Window的架构，给出了对于X Window设计的更好理解, 包括X的组件，这些组件结合起来构成的可运行图形环境，这些组件作为窗口管理器该怎样选择，工具包和构件库，桌面环境。

1. 序言 #

这个文档的目的是提供一个 X-Window 系统架构的概述，希望人们更好的理解它为什么要这样设计，X 的组件是怎样组合起来形成一个可工作的图形环境，怎样选择这些组件。

我们探讨一些经常被提到的概念，如果没有相关的技术背景，这些概念可能被混淆，例如部件（widgets）和工具包（toolkits），窗口管理器（window managers）和桌面环境（desktop environments）。还提供了一些例子，展示了这些组件在日常使用的应用程序中如何相互作用。

这个文档故意写得不太偏重技术，它基于作者的经验知识，以非技术方式引入，它可以从各种意见中吸取营养，包括更深入的例子和解释，以及技术上的更正。作者欢迎所有关于这个文档的问题和意见，Email：roadmr@entropia.com.mx 。

2. 简介 #

回到UNIX还是新鲜事物的时代，大约是1970年，图形用户接口还是一个奇怪的东西，只被一个实验室（Xerox’s PARC）使用。可是今天，任何操作系统只要想拥有竞争力，就必须有一个GUI子系统。GUI界面提供了良好的易用性。这不是UNIX所关心的，UNIX 有它的传统，某种程度来讲，多功能比易用性更好。但是，有几个原因使得 UNIX 系统需要有一个GUI。例如，UNIX 的多任务特性，在给定的时间内要运行多个程序。GUI 提供了多种控制方式，可以在同一时间在屏幕上显示多个运行的程序。所以，某些类型的信息更适合在图形界面上显示（有些甚至只能在图形界面上显示，例如pr0n和其他图形数据）。

历史上，UNIX有很多学术上的改进。一个好的例子是，70年代末加入了 BSD 网络代码，这是加州大学伯克利分校的工作成果。事实证明，X Window 系统也是一个学术项目的结果，即 MIT 的雅典娜项目，它成为了现代 UNIX（类UNIX系统）中大部分GUI子系统的基础，包括 Linux 和 BSD。

从一开始，UNIX就是一个多用户、多任务的分时操作系统。随着网络技术的加入，它还允许用户远程连接和执行任务。以前，这是通过串行终端或网络连接（telnet）完成的。

当开发UNIX下的GUI系统的时候，这些概念都被加入到了设计中。事实上，X是一个相当复杂的设计，这是经常被提到的一个缺点。可是，正因如此，它才是一个真正多功能的系统，当我们解释GUI的各个部分在UNIX下是怎样结合的时候，这些都会变的很清晰。

介绍X的架构之前，简单介绍一下它的历史，还有它是如果进入Linux系统的。

X是由雅典娜项目开发，在1984年发行。1988年，一个叫做“X Consortium ”的实体接手X，之后开始处理它的开发和发布。X规范是自由提供的，这个聪明的举动使X得到了很大程度的普及。下面介绍XFree86是什么。XFree86是我们在Linux系统上使用的X实体，XFree86也可以工作在其他操作系统上，例如BSD系列、OS/2和其他。尽管它的名字中带有86，它依然支持其他CPU架构。

3. X Window系统架构：概览 #

X被设计为客户端—服务器的架构（client-server）。应用软件作为客户端，他们通过服务器进行沟通和发布请求，当然也可以从服务器接受信息。

X server维护一个独立的显示控制器和处理来自client的请求。从这一点上来看，使用这种模式的优点是显而易见的。应用程序（client）只需要知道怎样同server沟通，而不需要关注实际图像显示设备的细节。最基本的，client会告诉server一些这样的东西：“画一条从这里到那里的线”，或者“显示一个文本字符串，使用这个字体，在屏幕的这个位置”。

这与只用图形库写应用没什么不同。但是，X模式更进一步。它不限制client和server在同处一台电脑。使用这个协议可以让client和server通过网络进行沟通，事实上，“进程间通信机制提供了可靠的字节流”。当然，更好的方法是使用TCP/IP协议。可以看到，X的模式是很强大的。一个经典的例子是，在Cray计算机上运行一个处理器密集阵应用程序，在Solaris 服务器上运行一个数据库监视器，在小型BSD邮件服务器上运行一个E-mail应用，在SGI服务器上运行一个可视化应用，然后，将以上这些都显示在我的Linux平台的屏幕上。

目前为止，我们已经看到X server是一个处理实际图形显示的东西。由于X server是运行在用户使用的实际计算机上，它的职责是处理所有与用户的交互。这包括监听鼠标和键盘。所有这些信息都要传达给client，还有对它进行响应。

X提供了一个库，称作Xlib，负责处理所有低级的client-server通信任务。很显然，client调用Xlib中的函数进行工作。

这样看来，一切都工作的很好。我们有一个server负责虚拟输出和数据输入，客户端应用程序，两者之间可以通过一种方法互相通信。假设client和server之间有一个互动，client可以让server在屏幕上分配一指定的矩形区域。作为client，我并不关心我被现实在屏幕的哪个位置，我只是告诉server“给我一个X乘以Y像素大小的区域”，然后调用函数执行类似“画一条从这里到那里的线”，“用户是否在我的屏幕范围内移动鼠标”等等。

4. 窗口管理器 #

可是，我们没有提到X server怎样处理client在屏幕现实范围内的操作（调用窗口）。显然，对于任何使用GUI的用户，对需要对“client windows”进行控制。通常情况下，你可以对窗口进行移动和排列；改变大小；最大化或最小化。那么，X server是怎样处理这些任务呢？答案是：不能。

X的设计原则之一就是“只提供机制，不提供策略”。所以，X server提供了一个操作窗口的方法（机制），并没有说怎样表现这种机制（策略）。

这些机制和策略可以归结为：有一个程序的责任是管理屏幕空间。这个程序决定了窗口的位置，为用户提供了控制窗口外观、位置和大小的机制，通常还会提供一些“装饰”，例如标题、边框和按钮，这些是我们对窗口本身的控制。这个控制窗口的程序称作“窗口管理器”。

“窗口管理器只是X的一个客户端程序——它不是X window系统的一部分，尽管它享有一些特权——所以，窗口管理器不是唯一的，而是有很多，它们提供了不同的用户与窗口的交互方式和不同的窗口布局、修饰、键盘和色调的风格。”

X的架构提供了用于窗口管理器执行这些窗口操作的方法，但确实没有提供一个窗口管理器。

另外，由于窗口管理器是一个外部元件，可以很容易的根据你的参数设定窗口，例如，你希望它看起来是什么样子，你想要它怎样执行，你想要它出现在哪里，等等。有些窗口管理器比较简单和丑陋（例如twm）；还有一些是华而不实的；还有介于两者之间的；fvwm, amiwm, icewm, windowmaker, afterstep, sawfish, kwm, 还有数不清的其他窗口管理器。每一种口味都有对应的窗口管理器。

窗口管理器是一个“meta-client”，最基本的使命是管理其他客户端程序。大部分窗口管理器会提供一些额外的设施（有些会提供很多）。可是，有个功能是大部分窗口管理器都有的——启动应用程序的方法。有些窗口管理器会提供一个命令盒子，你可以在这里写标准命令（用于启动应用程序）。还有一些窗口管理器会提供某种类型的应用程序启动菜单。这些不是标准配置。由于X没有制度关于如何启动应用程序的策略，这项功能在客户端程序中实施。那么，通常情况下，窗口管理器所负责的这个功能（个体之间会由差异），它的唯一使命就是如果启动客户端应用程序，就像一个程序启动平台。当然，人们已经写了大量的“启动程序”的应用。

5. 客户端应用 #

下面让我们关注一些客户端程序。假设你想要从头开始写一个客户端程序，并且只用X提供的设施。你很快就会发现，Xlib是漂亮的斯巴达，想要在屏幕上放一个按钮、文本，或是为用户提供的漂亮空间（滚动条，单选框），这些事竟是令人恐怖的复杂。

幸运的是，有人为我们提供了一个库，可以解决这些控件的编程问题。这些控件通常称作“部件”（widget library ），所以，这个库称作“部件库”。我只需从库中调用一个带参数的函数就可以在屏幕上显示一个按钮。这些部件包括菜单、按钮、单选按钮、滚动条和画布。

“canvas”（画布）是一个有趣的部件，它是客户端上的一个子空间，我能在里面话一些东西。可以理解，我不能直接使用Xlib，那样会干扰部件库，这个库本身提供了在画布内画任意图像的方法。

由于部件库确实可以在屏幕上画各种元素，以及解释用户的输入动作，这个库要对每个客户端的外观和行为负责。从开发者的角度来看，部件库也有一些API（设置函数），定义了我想要用到的部件。

6. 部件库和工具包 #

原始的部件库是为雅典娜项目开发的，理所当然应该是雅典娜部件库，也被称作雅典娜部件。它非常基础，非常简陋，安装现在的标准来看，它的使用方便并不直观（例如，要移动一个滚动条或滑块，你不能拖动，你要点击右边的按钮让它向上滑，或者点击左边的按钮让它向下滑），正因如此，现在几乎没有被使用了。

像窗口管理器一样，考虑到不同的设计目的，工具包（toolkit）也有很多种。最早的工具包之一是著名的Motif，这是开发软件基金会（OSF）的Motif图像环境的一部分，由一个窗口管理器和一个匹配工具包组成。OSF的历史超出了本文档的讨论范围。Motif工具包优于雅典娜部件，在80年代和90年代初使用广泛。

这些年，Motif不是一个受欢迎的选择。它不是免费的，如果你想要一个开发许可证（即用它编译你自己的程序），你需要向OSF Motif缴费，尽管可以发布一个针对Motif的二进制连接。至少对于Linux用户来说，最知名的Motif应用可能就是Netscape Navigator/Communicator。

有一段时间，Motif是唯一正常可用的工具包。有很多软件围绕着Motif。于是人们开始开发替代品，产生了丰富的工具包，例如XForms, FLTK等等。

已经有些时间没有听到Motif了，特别是在自由软件世界。原因是：就许可、性能（Motif被普遍认为像一头猪）和功能而言已经有了更好的替代品。

有一个知名并广泛使用的工具包是Gtk，它是GIMP项目专门设计用来替代Motif的。Gtk现在非常流行，因为它相对较轻，功能丰富，可扩展，而且完全免费。GIMP的0.6发行版的更新日志里包含了“Bloatif has been zorched ”，这句话是给Motif的臃肿的遗嘱。

另一个目前很流行的工具包是Qt。直到KDE项目的出现，它才开始出名，KDE利用了Qt的所有GUI元素。当然，我们不会深入Qt的许可问题和KDE/GNOME的分离性。Gtk说来话长，因为它的历史伴随着Motif的替换而变的很有趣。Qt没什么可说的，因为它真的很流行。

最后，另一个值得一提的替代品是LessTif，这个名字是对于Motif的双关语，LessTif的目标是成为免费的，兼容Motif API的替代品。并不清楚LessTif的目标已经达到了怎样的程度，倒不如帮助那些使用Motif代码的应用，在它们想要移植到其他的工具包时，有个一个免费的替代品。

7. 目前为止我们所拥有的 #

现在，我们已经知道，X有一个client-server架构，我们的应用程序就是client。在这个client-server架构的图形系统下，有多种可选的窗口管理器，它管理着我们的屏幕空间。client是我们真正完成工作的地方，而且，可以使用不同的工具包进行客户端编程。

困境就从这里产生了。各种窗口管理器使用各自不同的方法管理客户端，它们的功能和外观各不相同。同样的，由于每个客户端使用不同的工具包，它们的外观和性能也会不同。由于没有人说作者必须用同一个工具包写应用程序，下面这种情况很可能在用户运行程序是出现，比方说，六个不同的应用，都使用不同的工具包，那么它们的外观和性能也不同。这是由于应用之间的功能不一致而造成的困境。如果你一直使用一个用雅典娜组件写的程序，你会注意到，它和用Gtk所写的程序不太一样。通过使用这些外观和体验差别很大的应用，会让你记住是一个困境。这基本上否定了一个GUI环境的优势。

从技术角度来看，使用多种不同的工具包会增加对资源的占用。现代操作系统都支持动态链接库。这意味着，如果我有两三个使用Gtk的应用程序，还有一个Gtk动态链接库，那么这几个应用程序将共享这个Gtk。这样就节省了资源。另一方面，如果我有一个Gtk应用，一个Qt应用，一些基于雅典娜的程序，一个基于Motif的程序（例如Netscape），一个使用FLTK的程序，还有其他一些使用XForms，那我就要在内存中加载六个不同的库，每个库还要有一个不同的工具包。请记住，这些工具包提供的功能基本相同。

还用另外一些问题。每一种窗口管理器的启动程序的方式是不同的。有些窗口管理器有漂亮的启动程序菜单；有些则没有，它们希望我们打开一个程序启动箱，或者使用一个组合键，要不就是打开一个xterm，然后调用命令启动你的程序。所有，困境就是因为没有一个标准。

最后，我们的计划没有覆盖到一些GUI环境的细节。例如有效的配置，或者“控制面板”；还有图形文件管理器。当然，这些可以写成客户端应用。在典型的自由软件时尚中，有数百种文件管理器，数百种系统配置程序，可以想象，处理这些不同的软件组件将是更大的困境。

8. 桌面环境的救赎 #

先说一下桌面环境的概念是怎么来的。一个桌面环境应该提供一套设施和指导，用于规范我们之前提到的所有东西，以便我们前面提到的问题最小化。

桌面环境的概念对于Linux来说是新的东西，但是这些东西在其他操作系统（例如Windows和Mac OS）中本来就存在。例如，MacOS，它是最早的图形用户接口之一，为整个计算机会话提供了一个非常一致的感观。再例如，操作系统提供了很多我们前面提到的细节：它提供了一个默认的文件管理器，一个全系统控制面板，还有一个所有应用都使用的独立工具包（所以它们看起来都差不多）。应用窗口由系统（严格的将是窗口管理器）负责管理。最后，还有一套指南告诉开发者应该怎么表现他们的应用，如何设计外观和布局，以及根据系统中的其他应用设计外观。所有这些都是为了保证应用程序的一致性和易用性。

这引出了一个问题，“为什么X的开发者没有将桌面环境的事情放在首位？”。这是有道理的；毕竟，这样就可以避免前面提到的所有问题。答案就是，在X的设计过程中，它的设计者选择将它设计得尽可能的灵活。比如说，MacOS提供了大多数机制/策略规范，但是他们不鼓励人们玩弄这些东西，结果就是失去了多功能性，如果我不喜欢MacOS管理窗口的方式，或者工具包没有提供我需要的功能，我只能怪自己倒霉。X下就不会发生这样的事，灵活的代价就是更大的复杂性。

在Linux/Unix和X下，一切都归结于统一和坚持。以KDE为例，KDE包含一个单一的窗口管理器（kwm），负责管理和控制窗口的行为。它用了一个特定的图形工具包（Qt），以至于KDE应用的控制和外观都差不多。KDE提供了一套桌面环境库，这是Qt的扩展，用来完成一些常见的编程工作，例如创建菜单、“关于”框，编写工具栏，程序间通信，打印，选择文件，等等。这使得程序员的工作更加简单，并且标准化。KDE还为程序员提供了一套设计和行为指南，如果每个人都按照指南来做，那么KDE程序的外观和操作就会很相似。最后，KDE还为桌面环境提供一些组件，一个启动器面板（kpanel），一个标准的文件管理器，还有一个配置程序（控制面板），通过它可以全方位的控制计算机环境，比如设置桌面背景和标题栏的颜色。

KDE面板相当于Windows操作系统的任务栏。在这上面可以启动应用程序，还可以在上面显示将小程序（applets）。它还提供了大多数用户都离不开的实时时钟。

9. 特定桌面环境 #

我们以KDE为例，但它不是Unix系统上最早的桌面环境。最早的可能是CDE（Common Desktop Environment），OSF的另一个兄弟。根据CDE FAQ：“Common Desktop Environment是Unix的标准桌面，为最终用户、系统管理员和应用开发者提供一贯的跨平台服务。”可是，CDE没有足够丰富的功能和易用性。除了Motif，CDE几乎在自由软件世界消失了，最终被更好的平台替代。

在Linux下，最流行的桌面环境是KDE和GNOME，但是不止这两个。在网上可以轻易的搜索到半打桌面环境：GNUStep、ROX、GTK+XFce、UDE。它们都提供前面提到的基础功能。GNOME和KDE拥有来自社区和业界的最广泛的支持，所以它们是最优秀的之一，为用户和应用程序提供大量的服务。

我们提过在KDE下有很多提供特定服务的组件。作为一个好的桌面环境，GNOME在这方面也一样。最明显的差别是GNOME并不要求使用特定的窗口管理器（这方面KDE有kwm）。GNOME一直试图做到与窗口管理器无关，但是要承认，大多数用户与他们的窗口管理器联系紧密，而强迫他们使用不同的窗口管理器会损害他们的观众。GNOME原本青睐Enlightenment窗口管理器，现在它们更喜欢用Sawfish，但是GNOME控制面板一直有一个窗口管理器选择框。

除此以外，GNOME使用Gtk工具包，并且通过gnome-lib提供了一套高级功能和工具。GNOME有它自己的一套编程方法，可以确保兼容的应用之间行为一致；它提供了一个面板，一个文件管理器（gmc）和一个控制面板（gnome控制中心）。

10. 怎样把它们组合到一起 #

每个用户都可以自由的选择感觉最好的桌面环境。最终的结果是，如果你使用纯kde或纯gnome系统，整个环境的感观就非常一致；并且应用程序之间的沟通会更好。我们不可能在一个应用程序中使用多种不同的工具包。现代Linux桌面环境提供的设备还使用了一些其他的小技术，例如组件架构（KDE有Kparts，GNOME用Bonobo），它允许你在文字处理文档中嵌入表格或图表；还有整体打印设备，就像是Windows中的印刷背景；还有脚本语言，可以让更多的高级用户编写程序将多个应用结合到一起，让它们用有趣的方式进行协作。

在Unix的桌面环境概念中，一个程序可以在多个环境中运行。我可以想象在GNOME中用Konqueror，在KDE中用Gnumeric。它们只是程序而已。当然，一个桌面环境的整体理念是一致的，所以，坚持使用那些你喜欢的环境中的应用是有道理的。但是，如果你想要处理掉一个不太合适的应用，并且不影响环境中的其他部分，你完全可以自由的去做。

11. X系统中的一天 #

下面是一个例子，在Linux系统的桌面环境中，一个典型的GNOME会话是怎样运行的。假设它们工作在X之上。

当Linux系统启动X时，X server启动并初始化图形设备，然后等待客户端的应答。首先启动gnome-sessiong，并且设置工作会话。一个会话包括我同意打开的应用，它们在屏幕上的位置，等等。然后启动面板。面板通常出现在屏幕的底部，有点像桌面环境的仪表盘。我们可以用它来启动程序，看到正在运行的程序，还可以控制工作环境。然后，窗口管理器会启动。因为我们正在使用GNOME，无法确定是哪种窗口管理器，这里假设是Sawfish。最后，文件管理器启动。文件管理器负责处理桌面图标。至此，我的GNOME环境就完全准备好了。

到目前为止，所有启动的程序都是客户端，都连接到了X server。现在我们看到的X server和client是在同一台计算机上，但是就像我们前面看到的，这不是必须的。

现在，我们可以打开一个xterm来执行一些命令。当我们点击xterm图标时，面板会启动xterm程序。它是一个X client应用，所以，当它启动时会连接X server并显示它的界面。当X server为xterm分配屏幕空间时，它会让窗口管理器（Sawfish）为窗口装饰一个漂亮的标题栏，并决定它显示的位置。

让我们用一下浏览器。点击面板上的Netscape图标，启动一个浏览器。这个浏览器可不是GNOME的设备，它用的是Gtk工具包。所以，它和桌面环境中的其它部分不是特别协调。

接着打开“File”菜单。Motif在屏幕上提供了一个控制器，所以，Motif库的工作就是适当的调用相关的Xlib，为显示菜单在屏幕上绘制必要的元素，并且让我选择“exit”选项来关闭应用。

现在我们打开一个Gnumeric电子表格。有些时候我需要用到xterm，所以我点击它。Sawfish检测到了我的动作，然后对现有的窗口做些改变，将xterm放在了最上层，并且将焦点移动到xterm上面，这样我就可以在它上面工作了。

之后，我回到电子表格，想要打印这个文档。Gnumeric是一个GNOME应用，所以它可以使用GNOME环境提供的设备。当我打印时，Gnumeric调用gnome-print库，连接打印机并且打印。

12. 版权和许可 #

在自由软件社区发行的GNU Free Documentation License，Version1.1或之后版本的条款下（不包含不变章节、封面文字和封底文字），授予复制、发布和修改该文档的权限。在这里可以找到许可协议的衣服拷贝。