第 1 章
Oracle 的体系结构
这一章的内容是比较枯燥的,但它是理解以后章节的基础。如果有读者在开始时有些
内容没有完全理解也不用太着急,可以继续学习后面的内容,等使用了一段时间 Oracle 系
统之后,一些概念就变得容易理解了。
Oracle 引入复杂的体系结构的原因
数据库管理系统引入非常复杂的内存和外存体系结构的主要原因是有效地管理稀有的
系统资源。资源不足不只是数据库管理系统所面对的。其实,在我们五千年的人类发展历
史中,我们的祖先们一直在同资源不足作斗争。历史上粮食和土地等一直都是稀有资源,
还记得我们的祖先们用什么方法来管理这些稀有资源的吗?用战争,我们的先民们为粮食
而战,为土地而战;我们当代人类为石油而战,为市场而战,为金钱而战。
那么在 Oracle 数据库中什么是稀有资源?它们又是如何来管理的呢?如果读者接触
过数据库或读过相关的书,应该还有印象,数据库的数据量和输入/输出量都是相当大的,
而这些数据一般都存在硬盘(外存)上,因此硬盘为数据库的一类资源。为了方便介绍,
图 1-1 给出了硬盘的内部结构示意图。
图 1-1
从图 1-1 可以看出,所有硬盘上数据的访问都是靠硬盘的旋转和磁头的移动来完成的,
旋转轴 磁头移动臂
硬盘面 磁头
这种旋转和移动是机械运动。因为在计算机中所有数据的修改操作必须在内存中进行,所以
内存也是数据库的一类资源。表 1-1 给出内存和外存的简单比较以帮助读者理解本书的内容。
表 1-1
内 存 外存(硬盘)
数据访问速度 很快 很慢
存储的数据 临时 永久
价钱 很贵 相当便宜
从表 1-1 的比较可知,内存的数据访问速度要比外存(硬盘)快得多。这是因为内存
的数据访问是电子速度,而硬盘的数据访问主要取决于机械速度。也就是说,如果一个数
据库管理系统能够使绝大多数(如 90%以上)数据操作在内存中完成,那么这一数据库管
理系统的效率将非常高。但是由于内存中的数据在断电或出现系统故障时会消失,所以数
据库管理系统还必须保证,所有的数据改动都必须及时写到硬盘上,以保障不会丢失数据;
即使数据库崩溃之后,所有提交过的数据都能得到完全恢复。尽管可以通过加大内存来提
高数据库管理系统的效率,但在大多数情况下信息系统的开发和维护经费都是有限的。
通过以上的讨论,读者应该意识到,在数据库管理系统中最宝贵的稀有资源是内存。
为了高效地使用内存这种稀有资源,同时保证不会丢失任何数据库中的数据,Oracle 数据
库管理系统引入了一个非常复杂的体系结构。
Oracle 数据库中常用的术语
为了讲解容易,在详细讨论 Oracle 体系结构之前,先介绍一下相关的名词和术语。在
这里只给出实用的解释,并不追求学术上的严谨。
进程(process):一段在内存中正在运行的程序。如果没有学过计算机操作系统
相关课程,可以把进程想象成能够自动完成某些特定任务的任何东西,如训练有
素的狗狗、跑龙套的等。
后台进程(background process):进程的一种,在内存中运行时,不占显示,而
且它的优先级比前台进程低。可以只有一个前台进程,但可以有多个后台进程。
缓冲区(buffer):一段用来临时存储数据的内存区。
主机(host):计算机系统的另一个称呼。
服务器(server):一台在网络中向其他计算机系统提供一项或多项服务的主机。
客户机(client):一台使用由服务器(server)提供服务的计算机系统。
Oracle 数据库管理系统的体系结构
为了能使 Oracle 数据库管理系统满足商业用户的要求,Oracle 引入了如图 1-2 所示的
Oracle DBA 基础培训教程
·12·
复杂的体系结构。
图 1-2
以上这个复杂的体系结构主要包括 Oracle 服务器(server)(而服务器又是由 Oracle
实例(instance)和 Oracle 数据库(database)组成),还包括一些其他的关键文件、用户
进程和服务器进程等。
Oracle 服务器(server)由 Oracle 实例(instance)和 Oracle 数据库(database)两大部
分组成。它是一个数据库管理系统,提供了一致、开放和多样的信息管理的方法和途径。
服务器中的一些结构并不在处理 SQL 语句时使用,它们是为了改进数据库系统的效率或数
据的恢复等而设计的。
Oracle 服务器(server)
Oracle 服务器(server)可以有以下 3 种安装方式。
(1)基于主机方式:在此种配置下,用户直接在安装了数据库的计算机上登录 Oracle
user process
sever process
instance
SGA
DB buffers
cache
redo log
buffers
shared pool
library cache
dictionary cache
SMON PMON CKPT DBWR LGWR ARC0
data base
二
进
制
文
件
二
进
制
二
进
制
二
进
制
二
进
制
二
进
制
二
进
制
二
进
制
二
进
制
二
进
制
二
进
制
二
进
制
二
进
制
parameter
password
正
文
文
件
二
进
制
文
件
control files redo log files
data files
archived log files
数据库。
(2)客户端-服务器(client-server)(两层模型)方式:数据库和客户终端分别安装
在不同的计算机上,用户通过网络从个人计算机(客户端)上访问数据库。
(3)客户端-应用服务器-服务器(client- application server-server)(三层模型):用
户首先从自己的个人计算机登录应用服务器,再通过应用服务器访问真正的数据库。
Oracle 实例(instance)
Oracle 实例(instance)是一种访问数据库的机制,它是由内存结构和一些后台进程组
成的。它的内存结构也称为系统全局区(system global area,SGA)。系统全局区是实例的
最基本的部件之一。实例的后台进程中有 5 个是必需的,即这 5 个后台进程中的任何一个
没有启动,实例将自动关闭。这 5 个后台进程分别是 SMON、PMON、DBWR、LGWR 和
CKPT。在 OCP 考题中有时可能会问哪些后台进程是可选的?除了这 5 个都是可选的。实
例一启动就分配系统全局区和启动所需的后台进程。这里应该指出的是,每个实例只能操
作一个数据库,而且它不可以操作其他的数据库。但是反过来是不成立的,因为一个数据
库可以同时被几个实例操作(在 Oracle 集群中)。
系统全局区(SGA)中包含了以下几个内存结构:共享池(shared pool)、数据库高速
缓冲区(database buffer cache)、重做日志缓冲区(redo log buffer)和其他的一些结构(如
锁和统计数据)等。
Oracle 数据库
Oracle 数据库是数据的一个集合,Oracle 把这些数据作为一个完整的单位来处理。
Oracle 数据库也叫做物理(外存)结构,它为数据库信息提供了真正的物理存储,它是由
以下 3 类操作系统文件组成的。
(1)控制文件(control files):包含了维护和校验数据库一致性所需的信息。
(2)重做日志文件(redo log files):包含了当系统崩溃后进行恢复所需记录的变化
信息。
(3)数据文件(data files):包含了数据库中真正的数据。
Oracle 其他的关键文件
除了以上 3 类数据库文件之外,Oracle 服务还需要其他的一些文件,这些文件不属于
数据库。其中包括:
初始化参数文件(parameter files):定义了实例的特性,如系统全局区中一些内
存结构的大小、DBWR 的个数。
Oracle DBA 基础培训教程
·14·
密码文件(password files):包含了数据库管理员或操作员用户在启动和关闭实
例时所需的密码。虽然 Oracle 数据库提供了相当完善的安全管理机制,但是在
Oracle 数据库没有开启时如何验证要启动数据库的人是真正的数据库管理员或操
作员呢?这就是 Oracle 引入密码文件的原因。
归档重做日志文件(archived redo log files):是重做日志文件的脱机备份。在系
统崩溃后进行恢复时可能需要这些文件。
建立与 Oracle 实例的连接
Oracle 实例(instance)是用 Oracle 的 STARTUP 命令启动的(该命令将在后面的章节
中详细介绍)。它的启动就意味着 SGA 的所有内存结构都已生成,所有必需的后台进程都
已在内存中运行。那么此时用户又是如何使用 Oracle 数据库呢?
用户在向 Oracle 数据库发出 SQL 命令之前必须与实例(instance)建立连接。用户启
动一个工具如 SQL*Plus,或运行一个利用 Oracle 工具开发的应用程序,如用 Oracle Forms
开发的应用程序时,这个工具或应用程序就被作为一个用户进程来执行。用户进程是不能
直接访问数据库的。
在专用连接的情况下(也是默认),当一个用户登录 Oracle 服务器时(如在 SQL*Plus
的提示下输入用户名和密码),如果登录成功(即用户名和密码都准确无误),Oracle 就
在服务器所运行的计算机上创建一个服务器进程。在这种连接下,该服务器进程只能为这
个用户进程提供服务。用户进程与服务器进程是一对一的关系。用户进程向服务器进程发
请求,服务器进程对数据库进行实际的操作并把所得的结果返回给用户进程。就好像一个
大富豪想炒股票,但又不懂股票市场的运作,于是他请了一位股票经纪人。这位富豪就相
当于用户进程,而股票经纪人就相当于服务器进程,股票市场就相当于 Oracle 数据库。
一个用户每次登录 Oracle 服务器,如果成功,该用户就与 Oracle 服务器建立了连接,
而这种连接又叫做会话。一个会话始于用户成功地登录 Oracle 服务器,终止于用户退出或
非正常终止连接。一个数据库用户可能同时有多个会话存在,即用相同的用户名和密码同
时登录多次。
各种不同的连接方式
连接是用户进程与 Oracle 服务器之间的通信路径。与 Oracle 服务器(server)的 3 种
安装方式相对应,一个数据库用户可能用以下 3 种方式之一与 Oracle 服务器连接。
(1)基于主机方式:此时的用户进程与服务器进程是在同一台计算机的相同的操作系
统上的,用户进程与 Oracle 服务器之间的通信路径是通过操作系统内部进程通信(inter
process communication,IPC)机制来建立的。
(2)客户端-服务器(client-server)(两层模型)方式:用户进程与 Oracle 服务器之
间的通信是通过网络协议(如 TCP/IP)来完成的。
(3)客户端-应用服务器-服务器(client- application server- server)(三层模型):用
户的个人计算机通过网络与应用服务器或网络服务器通信,而这个应用服务器或网络服务
器又是通过网络与运行数据库的计算机相连的。例如,用户使用浏览器通过网络运行 NT
服务器上的应用程序,而 NT 服务器又从运行在 UNIX 主机上的 Oracle 数据库中提取数据。
以上所介绍的连接是用户进程与服务器进程的一对一的连接,也称为专用服务器连接
(dedicated server connection)。除了这种连接外,在联机事务处理(online transaction
processing,OLTP)系统的配置时还有另外的一种连接,它在 Oracle 9i 之前的版本中称为
多线程(MTS)连接,在 Oracle 9i 或以后的版本中称为共享服务器(shared server)连接。
有关这种连接在 Oracle 的网络和调优的书籍中介绍。
服务器进程
当 Oracle 创建一个服务器进程的同时要为该服务器进程分配一个内存区,这个内存区
称为程序全局区(program global area,PGA)。与 SGA 不同,PGA 是一个私有的内存区,
是不能共享的,是只属于一个进程的。它随着进程的创建而被分配,随着进程的终止而被
回收。在专用服务器进程的配置情况下,程序全局区包括了以下结构:
(1)排序区(sort area):用于处理 SQL 语句所需的排序。
(2)游标状态区(cursor state):用于指示会话当前所使用的 SQL 语句的处理状态。
(3)会话信息区(session information):包括了会话的用户权限和优化统计信息。
(4)堆栈区(stack space):包括了其他的会话变量。
如果是共享服务器进程或多线程的配置,以上这些结构除了堆栈区外大部分将存在
SGA 中。如果有 large pool,它们就会被存在 large pool,否则它们就会被存在共享池中。
Oracle 执行 SQL 查询语句的步骤
如果用户在 SQL*Plus 下输入了如下的查询语句:SELECT * FROM dept;,那么 Oracle
又是如何来处理这个语句的呢?SQL 语句的执行主要由用户进程与服务器进程来完成,其他
的一些进程可能要辅助完成这一过程。查询语句与其他的 SQL 语句有所不同,如果一个查询
语句执行成功,它要返回查询的结果。而其他的 SQL 语句只是返回执行成功或失败的信息。
查询语句的处理主要包括以下 3 个阶段:编译(parse)、执行(execute)和提取数据
(fetch)。
编译(parse):在进行编译时,服务器进程会将 SQL 语句的正文放入共享池(shared
pool)的库高速缓存(library cache)中并将完成以下处理:
首先在共享池中搜索是否有相同的 SQL 语句(正文),如果没有就进行后续
的处理。
Oracle DBA 基础培训教程
·16·
检查该 SQL 语句的语法是否正确。
通过查看数据字典来检查表和列的定义。
对所操作的对象加编译锁(parse locks)以便在编译语句期间这些对象的定义
不能被改变。
检查所引用对象的用户权限。
生成执行该 SQL 语句所需的优化的执行计划(执行步骤)。
将 SQL 语句和执行计划装入共享的 SQL 区。
以上的每一步操作都是在处理正确时才进行后续的处理。如果不正确,就返回错误。
执行(execute):Oracle 服务器进程开始执行 SQL 语句是因为它已获得了执行
SQL 语句所需的全部资源和信息。
提取数据(fetch):Oracle 服务器进程选择所需的数据行,并在需要时将其排序,
最后将结果返回给用户(进程)。
共享池(shared pool)
SGA 中的共享池(shared pool)是由库高速缓存(library cache)和数据字典高速缓存
(data dictionary cache)两部分所组成。服务器进程将 SQL(也可能是 PL/SQL)语句的正
文和编译后的代码(parsed code)以及执行计划都放在共享池(shared pool)的库高速缓存
中。在进行编译时,服务器进程首先会在共享池中搜索是否有相同的 SQL 或 PL/SQL 语句
(正文),如果有就不进行任何后续的编译处理,而是直接使用已存在的编译后的代码和
执行计划。
提示:
库高速缓存包含了共享 SQL 区和共享 PL/SQL 区两部分,它们分别存放 SQL 和
PL/SQL 语句以及相关的信息。
要想共享 SQL 或 PL/SQL 语句,第一,库高速缓存(library cache)要足够大,因为只
有这样要共享的 SQL 或 PL/SQL 语句才不会很快地淘汰出内存。第二,SQL 或 PL/SQL 语
句要是能共享的通用代码(generic code),因为 Oracle 是通过比较 SQL 或 PL/SQL 语句的
正文来决定两个语句是否相同的,只有当两个语句的正文完全相同时 Oracle 才重用已存在
的编译后的代码和执行计划。这里通过以下的实例来进一步解释这一点。读者猜如下的两
个 SQL 语句是否相同?
select * from emp where sal >= 1500; 和 select * from emp where sal >= 1501;
答案是不相同的(在 Oracle 默认的配置下,Oracle 8i 和 Oracle 9i 以及更高的版本可以
通过重新设置 CURSOR_SHARING 参数来修改默认配置,有兴趣的读者可参阅 Oracle 调优
方面的书籍)。
可以通过使用绑定变量的方式来重写以上的 SQL 语句,如下:
select * from emp where sal >= &v_sal;
这个语句就是可以共享的通用代码,因为变量不是在编译阶段而是在运行阶段赋值的。
引入库高速缓存(library cache)的目的是共享 SQL 或 PL/SQL 代码。那么 Oracle 又是怎样
有效地管理库高速缓存(library cache)的呢?Oracle 是使用一个称为 LRU(least recently
used)的队列(list)或算法(algorithm)来实现对库高速缓存的管理的。LRU 队列的算法
大致如下:刚使用的内存块(的地址)放在 LRU 队列的头上(最前面),当一个服务器进
程需要库高速缓存的内存空间而又没有空闲的内存空间时,该进程就从 LRU 队列的尾部(最
后面)获得所需的内存块,这些内存块一旦被使用,它们(的地址)就立即放在 LRU 队列
的最前面。这样那些长时间没使用过的内存块将自然地移到 LRU 队列的尾部而被最先使用。
从以上的讨论可知,为了能够共享 SQL 或 PL/SQL 的代码,库高速缓存要足够大,因
为这样那些可以共享的 SQL 或 PL/SQL 代码才不会被很快地淘汰出内存。不过 Oracle 并没
有给出直接设置库高速缓存大小的方法,只能通过设置共享池的大小来间接地设置库高速
缓存的大小。
介绍完了库高速缓存,接下来将介绍数据字典高速缓存(data dictionary cache)。当
Oracle 在执行 SQL 语句时,服务器进程将把数据文件、表、索引、列、用户和其他的数据
对象的定义和权限的信息放入数据字典高速缓存。如果在这之后,有进程(用户)需要同
样的信息,如表和列的定义,那么所有的这些信息将从数据字典高速缓存中获得。因为以
上所说的这些信息都是存在 Oracle 数据库的数据字典中,这也可能就是该部分内存叫做数
据字典高速缓存的原因。
表和列的定义等重用的机会要比 SQL 语句大,因此为了能达到共享这些信息的目的,
数据字典高速缓存应该尽可能设置得大一些。不过与库高速缓存一样,Oracle 并没有给出
直接设置数据字典高速缓存大小的方法,只能通过设置共享池的大小来间接地设置数据字
典高速缓存的大小。在 Oracle 9i 之前的版本,可以通过修改参数文件中的 SHARED_POOL_
SIZE 的值来改变共享池的大小,但一定要重新启动 Oracle 数据库。在 Oracle 9i 或以后的
版本中,也可以使用类似于例 1-1 的命令来改变共享池的大小:
例 1-1
SQL> ALTER SYSTEM SET SHARED_POOL_SIZE = 32M;
系统已更改。
但是所改变共享池的大小受限于 SGA_MAX_SIZE 参数。这个参数将在以后的章节中
详细地介绍。
注意:
在本书中采用如下的约定:
SQL>为 SQL*Plus 的提示符。
没有阴影的内容为要输入的 SQL 语句或 SQL*Plus 命令等。如在例 1-1 中要输入
ALTER SYSTEM SET SHARED_POOL_SIZE = 32M;。
阴影中的内容为系统显示(输出)的结果。如在例 1-1 中的“系统已更改。”。
提示:
Oracle DBA 基础培训教程
·18·
即使把共享池设置得足够大并且所使用的 SQL 或 PL/SQL 语句也是能共享的代码,
Oracle 也并不能一定使用内存(共享池)中的代码。例如当有用户修改了某个对象的定义
之后,所有使用这个对象的内存(共享池)中的代码全部被 Oracle 设置为无效,因此在使
用时必须重新编译。
数据库高速缓冲区(database buffer cache)
如果用户发出了以下的 SQL 语句:SELECT * FROM emp,Oracle 又是怎样提取数据
库中的数据呢?服务器进程将首先在数据库高速缓冲区(database buffer cache)中搜寻所
需的数据,如果找到了就直接使用而不进行磁盘操作,如果没找到就将进行磁盘操作把数
据文件中的数据读入到数据库高速缓冲区中。
从以上的讨论可知,为了能够共享数据库中的数据,数据库高速缓冲区要足够的大,
因为这样那些可以共享的数据才不会被很快地淘汰出内存。Oracle 也是使用一个叫做 LRU
(least recently used)的队列(list)或算法(algorithm)来实现对数据库高速缓冲区的管理。
可以使用参数文件中的 DB_BLOCK_SIZE 和 DB_BLOCK_BUFFERS 两个参数来设置数据
库高速缓冲区的大小。其中 DB_BLOCK_SIZE 为 Oracle 数据块(内存缓冲区)的大小,
在 Oracle 数据库中内存和外存的数据块的大小是相同的。DB_BLOCK_BUFFERS 为内存缓
冲区的个数。数据库高速缓冲区大小为这两个参数的乘积。但是 DB_BLOCK_SIZE 的值是
在创建数据库时设定的,如果要改变该参数的值一般需要重建数据库。因此多数情况下只
能通过改变 DB_BLOCK_BUFFERS 的值来调整数据库高速缓冲区大小。但一定得重新启
动 Oracle 数 据 库 。 在 Oracle 9i 或 以 后 的 版 本 中 , Oracle 引 入 了 另 一 个 参 数
DB_CACHE_SIZE,这个参数是一个动态参数,即可以在数据库运行时动态地改变该参数。
可以使用类似于 例 1-2 的命令来改变数据库高速缓冲区的大小:
例 1-2
SQL> ALTER SYSTEM SET DB_CACHE_SIZE = 48M;
系统已更改。
内存缓冲区顾问(v$db_cache_advice)
Oracle 9i 或以后的版本还提供了一个称为内存缓冲区顾问(v$db_cache_advice)的工
具来帮助获得调整数据库高速缓冲区的统计信息。内存缓冲区顾问一共有 3 种状态:
(1)ON:该工具打开,为该工具分配内存并进行统计信息的收集。要有一定的内存
和 CPU 开销。
(2)READY:该工具关闭,为该工具分配内存但不进行统计信息的收集,因此没有
CPU 的开销。
(3)OFF:该工具关闭,不为该工具分配内存也不进行统计信息的收集,因此既没有
内存的开销也没有 CPU 开销。
可以通过修改初始化参数 DB_CACHE_ADVICE 的值来改变该工具的状态。这一参数
是一个动态参数,因此可以使用 ALTER SYSTEM 命令来修改。例如可以利用类似于例 1-3
的 SQL 语句来查看它的状态:
例 1-3
SQL> select id, name, block_size, advice_status
2 from v$db_cache_advice;
ID NAME BLOCK_SIZE ADV
---------- -------------------- ---------- ---
3 DEFAULT 4096 ON
3 DEFAULT 4096 ON
3 DEFAULT 4096 ON
3 DEFAULT 4096 ON
3 DEFAULT 4096 ON
…
已选择 20 行。
此时,例 1-3 的显示结果表明了内存缓冲区顾问是在开启状态。
提示:
显示结果中的…表示省略了一些行的显示。
之后可以使用类似于例 1-4 的命令将内存缓冲区顾问(v$db_cache_advice)工具关闭:
例 1-4
SQL> alter system set db_cache_advice = off;
系统已更改。
这时可以再使用类似于例 1-5 的 SQL 语句来查看它的状态:
例 1-5
SQL> select id, name, block_size, advice_status
2 from v$db_cache_advice;
ID NAME BLOCK_SIZE ADV
---------- -------------------- ---------- ---
3 DEFAULT 4096 OFF
3 DEFAULT 4096 OFF
3 DEFAULT 4096 OFF
3 DEFAULT 4096 OFF
3 DEFAULT 4096 OFF
…
已选择 20 行。
Oracle DBA 基础培训教程
·20·
此时,例 1-5 的显示结果表明已成功地关闭了内存缓冲区顾问(详细地介绍该工具的
使用已超出了本书的范围,有兴趣的读者可参阅 Oracle 9i/10g 调优方面的书籍)。
重做日志缓冲区(redo log buffer)
从理论上来讲,如果数据库不会崩溃,根本没有必要引入重做日志缓冲区(redo log
buffer)。引入重做日志缓冲区的主要目的(在 Oracle 8i 之前的版本中也是惟一的目的)就
是数据的恢复。Oracle 在使用任何 DML 或 DDL 操作改变数据之前都将恢复所需的信息,
即在写数据库高速缓冲区之前,先写入重做日志缓冲区。
与执行查询语句有所不同,Oracle 在执行 DML 语句时只有编译(parse)和执行(execute)
两个阶段。以下是 Oracle 执行 UPDATE 语句的步骤:
(1)如果数据和回滚数据不在数据库高速缓冲区中,Oracle 服务器进程将把它们从数
据文件中读到数据库高速缓冲区中。
(2)Oracle 服务器进程在要修改的数据行上加锁(行一级的锁)。
(3)Oracle 服务器进程将数据的变化信息和回滚所需的信息都记录在重做日志缓冲
区中。
(4)Oracle 服务器进程将回滚所需的原始值和对数据所做的修改都写入数据库高速
缓冲区(database buffer cache)。之后在数据库高速缓冲区中所有的这些数据块都将被标
为脏缓冲区,因为此时内外存的数据是不同的(不一致的)。
Oracle 处理 INSERT 或 DELETE 语句的步骤与处理 UPDATE 语句的步骤大体相同。
注意:
有关回滚数据在本书的后面章节中还要介绍,读者也可以参阅笔者的另一本书《从实
践中学习 Oracle/SQL》一书 节的 258~259 页。
大池(large pool)和 Java 池(Java pool)
除了以上所介绍的内存结构之外,SGA 中还有可能包含 large pool 和 Java pool 两个可
选的内存结构。
引入 large pool 的主要目的应该是提高效率。large pool 是一个相对比较简单的内存结
构,与 shared pool 不同的是它没有 LRU 队列。在多线程(MTS)或共享服务器(shared server)
连接时,Oracle 服务器进程的 PGA 的大部分区域(也叫 UGA)将放入 large pool(stack
space 除外)。另外在大规模 I/O 及备份和恢复操作时可能使用该区。可以通过设置参数
LARGE_POOL_SIZE 的值来配置 large pool 的大小。该参数也是一个动态参数。
引入 Java pool 的目的是能够编译 Java 语言的命令。如果要使用 Java 语言就必须设置
Java pool。Java 语言在 Oracle 数据库中的存储与 PL/SQL 语言几乎完全相同。可以通过设
置参数 JAVA_POOL_SIZE 的值来配置 Java pool 的大小。其数字的单位是字节(bytes)。
在 Oracle 9i 中 Java pool 的默认大小为 24MB。
Oracle DBA 基础培训教程
·22·
内存缓冲区大小的设定
在 Oracle 9i 之前的版本中,只能通过设置初始化参数文件中的一些参数来间接地设置
SGA 的大小,如 DB_BLOCK_BUFFERS、LOG_BUFFER、SHARED_POOL_SIZE 等。而
且所有的这些参数都是静态的,即当修改完初始化参数文件中这些参数的值之后必须重新
启动 Oracle 数据库。
在 Oracle 9i 以后的版本中,SGA 为动态的。SGA 中的内存缓冲区,如数据库高速缓
冲区(database buffer cache)和共享池(shared pool)等都可以动态地增加和减少。Oracle
是利用所谓的区组(granule)来管理 SGA 的内存的。区组(granule)就是一片连续的虚拟
内存区。区组是 Oracle 分配和回收内存区的基本单位。
区组的大小取决于所估计的 SGA 的大小。如果 SGA 的尺寸小于 128MB,区组的大小就
是 4MB。如果 SGA 的尺寸大于或等于 128MB,区组的大小就为 16MB。Oracle 数据库一旦
启动,SGA 中的每个内存缓冲区就会获得所需的区组。SGA 中至少包括 3 个区组:一个是
SGA 固定区(其中包含了重做日志缓冲区);一个是数据库高速缓冲区;一个是共享池。
Oracle 数据库管理员可通过 ALTER SYSTEM SET 命令来分配和回收区组。但总的内
存大小不能超过参数 SGA_MAX_SIZE 所设定的值。该参数的单位是字节。
动态分配和回收内存的最大好处是在调整内存缓冲区大小时不需要重新启动数据库。
这一点对那些 24 小时运营 7 天营业的商业数据库是至关重要的。
内存缓冲区信息的获取
可以使用例 1-6 的命令来获得参数 SGA_MAX_SIZE 的值:
例 1-6
SQL> show parameter
该命令将显示出参数文件中可以设置的全部参数。另外也可以使用例 1-7 的命令来获
得 SGA 的相关信息:
例 1-7
SQL> show sga
Total System Global Area 122755896 bytes
Fixed Size 453432 bytes
Variable Size 71303168 bytes
Database Buffers 50331648 bytes
Redo Buffers 667648 bytes
也可以先使用例 1-8 和例 1-9 的 SQL*Plus 命令来格式化显示输出:
例 1-8
SQL> col name for a20
例 1-9
SQL> col value for a25
之 后 , 利 用 数 据 字 典 v$parameter 使 用 例 1-10 的 SQL 查 询 语 句 来 获 得 参 数
SGA_MAX_SIZE 的值:
例 1-10
SQL> select name, type, value
2 from v$parameter
3 where name = 'sga_max_size';
NAME TYPE VALUE
-------------------- ---------- ----------
sga_max_size 6 122755896
介绍完了 SGA 的各个部分内存缓冲区之后,下面开始详细地讨论 Oracle 的主要后台
进程。
重做日志写进程(LGWR)及快速
提交(fast commit)
重做日志写进程(LOG writer,LGWR)负责将重做日志缓冲区的记录顺序地写到重做
日志文件中。为了更好地理解 LOG writer 的操作原理,在这里先介绍一下 Oracle 提交
(commit)语句是如何工作的。
Oracle 服务器是使用了一种称为快速提交(fast commit)的技术,该技术既能保证
Oracle 系统的效率又能保证在系统崩溃的情况下所有提交的数据可以得到恢复。为此
Oracle 系统引入了系统变化数(system change number,SCN)。无论任何时候只要某个事
务(transaction)被提交,Oracle 服务器都将产生一个 SCN(号码)并将其赋予该事务的所
有数据行。在同一个数据库中 SCN 是单调递增的并且是惟一的。为了避免在进行一致性检
验时操作系统时钟可能引发的问题,Oracle 服务器将 SCN 作为 Oracle 的内部时间戳来保证
数据文件中的数据的同步和数据的读一致性。
当在 SQL*Plus 中发了 commit 语句之后,Oracle 的内部操作步骤如下:
(1)服务器进程将把提交的记录连同所产生的 SCN(号码)一起写入重做日志缓冲
区中。
(2)重做日志写进程(LGWR)将把重做日志缓冲区中一直到所提交的记录(包括该
记录)的所有记录连续地写到重做日志文件中。在此之后,Oracle 服务器就可以保证即使
Oracle DBA 基础培训教程
·24·
在系统崩溃的情况下所有提交的数据也可以得到恢复。
(3)Oracle 通知用户(进程)提交已经完成。
(4)服务器进程将修改数据库高速缓冲区中的相关数据的状态并释放资源和打开
锁等。
此时可能这些数据并未被写到数据文件中,这时这些数据缓冲区被标为脏缓冲区,因
为相同的数据在内外存中为不同的版本。数据库高速缓冲区中的数据是由 DBWR 写到数据
文件中的。
曾有不少学生问过这样一个问题:“为什么不同时写两个数据文件呢?”Oracle 的这种
解决方案的最大好处是在保证不丢失数据的同时数据库的效率不会受到很大影响。因为重
做日志文件中的记录是以最紧凑的格式存放的,所以它的 I/O 量要比对数据文件的操作少
得多。另外 LGWR 是顺序地将重做日志缓冲区中的记录写到重做日志文件中的,这样其 I/O
速度要比将数据块写到数据文件中快得多。
重做日志写进程(LGWR)要在下列情况下将重做日志缓冲区的记录(内存)顺序地
写到重做日志文件(外存)中:
当某个事务被提交时。
当重做日志缓冲区中变化的记录超过一兆字节(1MB)时。
当重做日志缓冲区中所存的记录已超过缓冲区容量的 1/3。
在 DBWR 将数据库高速缓冲区中修改过的数据块写到数据文件之前。
每 3 秒钟。
因为在进行数据库恢复时需要重做日志数据,所以重做日志写进程(LGWR)只有在
重做日志数据写到重做日志文件(磁盘)上时才能确定提交已经完成。在 Oracle 8i 之前的
版本中,重做日志数据的惟一目的和用处就是数据库恢复。Oracle 在 Oracle 8i 的版本中引
入了一个叫做重做日志挖掘器(logminer)的工具。该工具可以将重做日志文件或归档重做
日志文件中的数据转换成用户能理解的正文信息。在 Oracle 8i 中,该工具只有命令行操作
方式。Oracle 9i 加强了此工具的功能并引入了一个称为日志挖掘浏览器(logminer viewer)
的图形界面。
数据库写进程(DBWR/DBWn)
在本章开始时曾介绍过数据库的典型操作就是大规模的输入/输出(I/O)。因此为了提
高 Oracle 系统的效率,一要减少 I/O 量,这可能是 Oracle 引入 LGWR 的原因之一;二要减
少 I/O 次数,这可能是 Oracle 引入数据库写进程(DBWR/DBWn)的主要原因。
提示:
在 Oracle 的英文书中有些将“数据库写进程”用 DBWR 表示,有些将它用 DBWn 表示。
这是因为在一个 Oracle 实例中可以启动多个数据库写进程,特别是在要进行大规模输入/输
出并且运行在多 CPU 计算机上的 Oracle 数据库系统。Oracle 允许在一个实例上最多启动
10 个数据库写进程,它们分别是 DBW0~DBW9。
数据库写进程负责将数据库高速缓冲区中的脏缓冲区中的数据写到数据文件上。为了
提高效率,数据库写进程并不是数据库高速缓冲区中的数据一有变化就写数据文件,而是
积累了足够多的数据一次写一大批内存数据块到数据文件上。
数据库写进程将在下列事件之一发生时把数据库高速缓冲区中的数据写到数据文 件
上:
当脏缓冲区的数量超过了所设定的限额。
当所设定的时间间隔已到。
当有进程需要数据库高速缓冲区而却找不到空闲的缓冲区时。
当校验点发生时。
当某个表被删除(drop)或被截断(truncate)时。
当某个表空间被设置为只读状态(read only)时。
当使用类似于 ALTER TABLESPACE users BEGIN BACKUP 的命令对某个表空
间进行联机备份时。
当某个临时表空间被设置为只脱机状态(offline)或正常状态(normal)时等。
系统监督进程(SMON)
从前面的论述中可以知道,由于某种原因 Oracle 系统崩溃了(如断电),SGA 中任何
没有来得及写到磁盘中的信息都将丢失,如有些已经提交的数据还没有真正地被写到数据
文件中时就会丢失。在这种情况下,当数据库重新开启时,系统监督进程(SMON)将自
动地执行 Oracle 实例的恢复工作。其步骤如下:
(1)执行前滚(roll forward),即将已经写到重做日志文件中但还没写到数据文件中
的提交数据写到数据文件中(Oracle 是用 SCN 号码来识别提交记录的)。
(2)在前滚完成后立即打开数据库,此时用户就可以登录并使用数据库了。这时在数
据文件中可能还有一些没有提交的数据。之所以这样安排主要是为了提高系统的效率。
(3)回滚没有提交的事务(数据)。除了 SMON 进程之外,服务器(server)进程也
可能进行回滚没有提交的事务,但该进程只回滚它所用到的加锁的数据行。
除此之外,SMON 进程还要执行如下的磁盘空间的维护工作:
回收或组合数据文件中相连的空闲区。
释放临时段(在执行 SQL 语句时用作排序的磁盘区),将它们还给数据文件以作
为空闲区使用。
进程监督进程(PMON)
当某个进程崩溃时(如在没有正常退出 Oracle 的情况下重新启动了所用的 PC),进程
Oracle DBA 基础培训教程
·26·
监督进程(PMON)将负责它的清理工作。PMON 进程将负责进行如下的清理工作:
回滚用户当前的事务。
释放用户所加的所有表一级和行一级的锁。
释放用户所有的其他资源等。
校验点(checkpoint)和校验点进程
Oracle 系统为了提高系统的效率和数据库的一致性,引入了一个称为校验点的事件。
该事件是在当 DBWR 进程把在 SGA 中所有已经改变了的数据库高速缓冲区中的数据(包
括提交的和没提交的数据)写到数据文件上时产生。从理论上讲校验点(checkpoint)和校
验点进程可以完全不需要,因为 Oracle 系统利用重做日志数据和 SCN 号是能够保证数据库
的完全恢复的。引入校验点可能是为了提高系统的效率。因为所有到校验点为止的变化了
的数据都已写到了数据文件中,在实例恢复时校验点之前的重做日志记录已经不再需要,
这样实例恢复速度就加快了。
在校验点事件发生时,Oracle 要将校验点号码(Oracle 系统自动产生的)写入所有相
关的数据文件的文件头中。还要将校验点号码、重做日志序列号、归档日志名字和 SCN 号
都写入控制文件中。
尽管经常产生校验点可以加快实例恢复的速度,但是由于在产生校验点时 Oracle 系统
要进行大量的 I/O 操作,所以过于频繁地产生校验点会使数据库正常的联机操作受到冲击。
最后数据库管理员要在实例恢复的速度和联机操作之间进行折衷。一般的生产或商业数据
库的校验点间隔是在半小时以上。
归档日志(ARCH/ARCn)进程
以上 5 个后台进程都是必需的,即它们中的任何一个停止后实例自动关闭。在可选后
台进程中,归档日志(ARCH/ARCn)进程可能是最重要的一个可选后台进程,因为如果
Oracle 数据库的数据文件丢失或损坏,一般数据库要进行完全恢复,Oracle 数据库应运行
在归档方式。
在 Oracle 数据库中,重做日志文件被划分为若干个组。当一组重做日志的文件被写满
后,Oracle 就开始写下一组重做日志,这被称为日志切换。切换是以循环的方式进行的,
即当最后一组写满后,又开始写第一组。因此如果只有重做日志文件,即 Oracle 数据库运
行在非归档方式下,当遇到数据文件丢失或损坏时,Oracle 系统很难保证完全恢复数据库
中的数据。因为此时所需的重做记录可能因重做日志循环使用而被覆盖掉了。
在归档方式下,ARCn 进程将把切换后的重做日志文件复制到归档日志文件。可以把
归档日志文件看成是重做日志文件的备份,但归档日志文件是脱机的,即除了在进行(复
制)时,Oracle 数据库在正常运行时是不会关注归档日志文件的。Oracle 系统确保在一组
重做日志的归档操作完成之前不会重新使用该组重做日志。在 Oracle 数据库中归档操作一
般是自动执行的。利用这些归档日志文件,Oracle 系统就能确保在遇到数据文件丢失或损
坏后可以完全恢复数据库中的数据。
小 结
在本章即将结束时请读者考虑一个问题。在数据库(数据文件)中所存的数据是一致
的还是不一致的?也可以说成是数据库(数据文件)中所存的数据是提交的还是没提交的?
要回答这个问题首先要知道数据库当前的状态。如果数据库是处在正常关闭状态,数
据库所存的数据当然是一致的。如果数据库是非正常关闭状态,数据库中应该有不一致的
数据。如果数据库是处在正常运行(开启)状态,数据库中可能既有一致的数据又有不一
致的数据。
数据库处在正常运行(开启)状态时数据库中所存的数据是一致的这一点很容易理解,
怎么可能有不一致的数据呢?设想一下有某个用户发了如下的 DML 语句:UPDATE emp
SET sal = sal * ;(您知道这个 DML 语句的商业含义吗?可能是公司长期亏损,为了避免
最终倒闭的厄运,公司要求全体员工“同舟共济”,集体减薪 10%),进一步假设 emp 表中
有几十万条记录。而且该用户还有个坏毛病,他每次发了 DML 语句后既不提交也不回滚。
可以想象经过一段时间在数据库高速缓冲区中的这些数据块就会自动地排到 LRU 队列的
尾部。如果此时有一个 SQL 语句需要从数据文件中读入大量的数据到内存,而此时数据库
高速缓冲区中已没有空闲的内存块(缓冲区)可用,因此 DBWR 进程要把在 LRU 队列尾
部的没有提交的数据写到数据文件上。
另一个类似的问题是:数据库写进程(DBWR/DBWn)是提交之前把在数据库高速缓
冲区中的数据写到数据文件上还是在提交之后写?答案是可能在之前也可能在之后写。读
者只要仔细回忆一下本章所介绍的有关内容就不难理解这一点了。
在 OCP 考试中有人统计过,与 SGA 和后台进程有关的问题大约占考试题的 20%以上。
虽然这些题变化多端,但是只要能真正地理解 SGA 和后台进程以及它们之间的关系是不难
回答的。
在本章中,主要是讲解与 Oracle 数据库管理系统相关的基本概念和原理。基本上没有
什么实际操作,可能有些读者读起来比较乏味。但本章中的许多内容对理解以后章节的内
容是至关重要的。希望读者耐下心来花些时间把本章的大多数内容基本上弄懂。
您应该掌握的内容
在学习第 2 章之前,请检查一下您是否已经掌握了以下的内容:
在数据库系统中什么是稀有资源。
Oracle 服务器(server)的组成。
Oracle DBA 基础培训教程
·28·
Oracle 服务器的 3 种安装方式。
Oracle 体系结构的轮廓。
Oracle 实例(instance)。
Oracle 引入实例的目的。
Oracle 数据库(database)。
Oracle 其他的几个关键文件。
怎样建立与实例(Instance)的连接。
服务器进程和程序全局区(program global area,PGA)。
Oracle 执行 SQL 查询语句的主要步骤。
Oracle 实例的系统全局区。
共享池(shared pool)的组成。
库高速缓存(library cache)的工作原理。
数据字典高速缓存(data dictionary cache)的工作原理。
怎样设置共享池。
数据库高速缓冲区(database buffer cache)的工作原理。
重做日志缓冲区(redo log buffer)的工作原理。
Oracle 执行 UPDATE 语句的步骤。
怎样设置内存缓冲区的大小。
怎样获取内存缓冲区信息。
重做日志写进程的工作原理。
快速提交(fast commit)技术。
数据库写进程(DBWR/DBWn)的工作原理。
系统监督进程(SMON)的工作原理。
进程监督进程(PMON)的工作原理。
引入校验点(checkpoint)事件和校验点进程的原因。
校验点进程的工作原理。
引入归档日志文件和归档日志(ARCH/ARCn)进程的原因。
归档日志(ARCH/ARCn)进程的工作原理。