第四讲 数据资源管理技术
教学计划
教学进度表
授课主题 学时 状态 备注
1:MIS的基本概念 (6)
2:MIS的技术基础 (4)
3:数据资源管理 (6)
4:MIS的应用 (6)
6:MIS的开发方法 (6)
7:MIS的分析与设计 (6)
8:MIS的实施 (4)
9:实验项目 (10)
10:课程评价 (2)
教学目标
理解并掌握
数据资源的管理观
数据资源的管理技术
教学内容
本讲共计4学时
第十章 4学时
第十章 数据资源管理技术
主要内容
文件组织
数据库技术
10. 引言
企业的重要资源
劳动力、原材料、资金、设备、信息
广义的数据资源管理包括:
文件组织
数据库
数据规划
数据管理
文件组织
数据组织的层次
人们需要用数据来进行决策和采取行动
如果这些数据能够在限定的时间内被检索处理,这些数据就产生了价值,成为信息。因此需要将数据有序的组织起来,才能对数据进行有效的处理。
数据的逻辑组织有四个基本的逻辑元素:
数据项
记录
文件
数据库
续
数据组织的层次
数据库
文件1
文件2
文件n
文件n-1
记录1
记录2
记录n-1
记录n
数据项1
数据项2
数据项n-1
数据项n
…...
…...
…...
姓名、性别等
若干学生
学生文件
学生数据库
续
数据组织的相关概念
数据项
是组成数据系统的有意义的最小基本单位。它的作用是描述一个数据处理对象的某些属性。
记录
与数据处理的某一对象有关的一切数据项构成了该对象的一条记录。标识记录的数据项称为关键项。
文件
相关(同类)记录的集合称为文件。
数据库
按一定方式组织起来的逻辑相关的文件集合形成数据库。
续
文件的管理观
大量的企业数据不可能存放在主存中
某一时刻,企业只使用其中的一部分数据
企业的数据一般以文件形式组织起来
分类
按存储介质
光盘文件
磁盘文件
打印文件
按文件在信息系统中所执行的功能
主文件
事务文件
报告文件
工作文件
程序文件
续
数据的物理储存与传送
自学问题
磁盘与磁带在数据存储方面各有什么特点?
什么是数据的逻辑组织?
什么是数据的物理组织?
如何实现逻辑组织与物理组织之间的数据传送?
续
文件组织形式
建立并确定数据记录的物理顺序和逻辑顺序之间的对立关系。
逻辑
数据记录
物理
存储方式
顺序文件
索引文件
链表文件
倒排文件
顺序映射关系
续
顺序文件
文件中数据记录的物理顺序与逻辑顺序一致,文件记录按关键字值的递增(或递减)次序排序,形成其逻辑顺序。
……
……
……
565
钱七
870005
676
孙六
870004
587
王五
870003
645
李四
870002
456
张三
870001
……
5
4
3
2
1
文件记录
物理设备
关键字值
相对磁道
续
索引文件
具有索引表的文件称为索引文件。
索引文件
主文件
索引表
数据记录区
索引区
记录原始信息
记录关键字+记录地址
组成
映射
加工
续
举例
成绩
姓名
学号
记录地址
E
D
C
B
A
565
钱七
870003
676
孙六
870004
587
王五
870001
645
李四
870002
456
张三
870005
记录地址
主关键字(学号)
870005
870004
870003
870002
870001
A
D
E
B
C
主文件
索引表
关键字学号与学生记录地址的对应表
续
链表文件
倒排文件
带有辅索引或倒排索引的文件称为倒排文件
记录
记录
记录
记录
^
入口
数据库技术
传统文件处理系统
存在问题
数据冗余与数据不一致性
数据结构的不一致,数据联系弱
缺少数据字典,缺少灵活性
应用程序1
数据文件1
应用程序2
应用程序3
数据文件2
数据文件3
用户
用户
用户
续
银行文件处理系统
客户财务
报表
分期贷
款程序
帐户核对
处理
存款处理
分期贷款
处理
贷款分析
报告
客户票据
存款文
件修改
文件修
改核对
帐户核
对程序
分期贷款
文件修改
存款
程序
客户交易
客户交易
续
数据库处理系统
优点
完善的数据字典和数据模型
数据独立性
方便的接口
完整的数据控制功能
提高了系统的灵活性
应用程序1
应用程序2
应用程序3
DBMS
数据库
中央
数据库
用户
用户
用户
续
银行数据库处理系统
客 户 交 易 处 理
数 据 库 管 理 系 统
核对帐
户程序
存款帐
目程序
分期贷
款程序
客户数据库
..
查询
续
数据库管理系统(DBMS)功能
DBMS是一组计算机程序,控制组织和用户的数据库的生成、维护和使用。具有以下功能:
数据库开发
数据库查询
数据库维护
应用与开发
..
操作系统
数据库
管理系统
应用程序
数据库
数据
字典
用户
续
数据库管理系统(DBMS)
数据库开发:
利用数据定义语言(DDL)开发与说明数据内容、相互关系及每个数据库的结构。并把这些信息存储在一个专用的数据定义和说明的数据库中,称为数据字典。数据字典由数据库管理员控制、管理和维护。
数据库查询:
用户使用DBMS的查询语言询问数据库中的数据。最常用的查询语言是结构化查询语言(SQL)。
数据库维护
应用开发
续
数据库有哪些类型?
企业数据库的种类
操作数据库
管理数据库
信息仓库
分布式数据库
外部数据库
文本数据库
多媒体数据库
续
数据库模型
模型功能
使数据以记录的形式组织在一起,综合反映各种业务信息,既综合又没有冗余。
模型能反映用户各业务信息所存在的内在联系,而且与DBMS数据模型一致。
模型的类型
网状型
层次型
关系型(目前最流行的是关系型数据库)
续
数据库系统的三级模式
模式
即逻辑模式。是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。
外模式
用户模式或者子模式。是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述。
内模式
物理模式或者存储模式。是数据物理结构和存储方式的描述,是数据在数据库内部的表示方法。
参见159页图
续
数据库系统的三级模式(图)
物理模型内模式
用户A
用户B
用户D
用户E
外模式1(子模式1)
外模式2(子模式2)
概念模型(模式)
DBMS
OS
子模式/概念模式
映射A
子模式/概念模式
映射B
模式/内模式映射
续
数据库的二级映射
外模式/模式映射:
当模式改变时,使外模式保持不变,从而应用程序不变,保证了数据与程序的逻辑独立性。
模式/内模式映射:
当数据库存储结构改变,使模式保持不变,从而应用程序不变,保证了数据与程序的物理独立性
续
数据库数据的存取过程
应用程序A
用户工作区
状态码
系统缓冲区
数据库
OS
DBMS
物理数据库描述
概念模式
应用程序A的子模式
续
信息的转换
客观 事物类:
事物 相关性质集合
人
实体 实体集合
及 实体
联系 相关属性集合
加工、转换
数 文件
据 记录
库 相关数据项集合
加工
转换
存储
二进制数据集合
结构
计算机世界
DBMS
数据世界
DBMS的数据模型
信息世界
认识选择描述
现实世界
E-R模型
续
三个不同世界术语
客观世界 信息世界 数据世界 组织(事物及其联系) 实体及其联系 数据库(概念模型) 事物类(总体) 实体集 文件 事物(对象、个体) 实体 记录 特征(性质) 属性 数据项
实体及其联系
概念模型
E—R图
E-R信息模型的设计与应用
E-R图描述现实世界的概念模型
实体:
属性:
联系:
一对一联系
一对多联系
多对多联系
实体集
属性
联系集
线段
续
E—R图设计原则
真实性原则
避免冗余原则
简单性原则
合适性原则(用实体或属性或联系集)
注意对客观对象的约束
映射约束、键码约束、参照完整性约束
续
实体(Entity):
是一个有着一系列显著的、易辨认的属性的对象。
实体可以是具体的(物体、人物等。)
实体也可以抽象的(事、概念、事物之间的联系)
确定实体的指导
找出问题中的大模块
问题陈述中的名词
续
属性(Attribute)
实体的特性,它描述了实体的一个部分。
一个实体可由若干个属性来刻画。
如学生(学号,姓名,性别,……)
码(Key):
唯一标识实体的属性集。
如:学号为学生的码。
确定属性的指导
可能将名词当作属性,但不应将其和实体混淆.
续
E—R图绘制
图书
作者
写作
出版社
类别
页数
ISBN
书名
姓名
出生地
身份证号
定稿时间
价格
包含实体集“图书”和“作者”的E—R图
续
E—R图向关系数据模型的转换
1、E—R图中每个实体,相应转换为一个关系,该关系包括对应实体的全部属性,并确定出该关系的关键字。
2、对于“联系集”,根据联系方式不同,采取不同手段以使被它联系的实体所对应的关系彼此实现某种联系。
续
E—R图向关系数据模型的转换转换过程示意图
E-R图
关系模型
DBMS
续
E—R图的转换
将E-R图转换成相应的表
表是行和列的集合,实体被表示成表的形式。
用列标题表示实体的属性
用行表示关于实体的实际数据
关于表和属性的命名规则
属性名和表名中不能包含空格
表名对实体的描述应该是有意义的。
如 student(cStuID,cStuName,nStuAge,……)
表名只能描述一个主题
续
转换举例一
厂长号
姓名
年龄
厂长
厂号
厂名
地点
工厂
管理
1
1
厂长(厂长号,厂号,姓名,年龄)
工厂(厂号,厂名,地点)
续
转换举例二
仓库号
地点
面积
仓库
货号
品名
价格
产品
存放
1
n
仓库(仓库号,地点,面积)
产品(货号,品名,价格,仓库号,数量)
数量
续
转换举例三
学号
姓名
年龄
学生
课程号
课程名
学时数
课程
学习
n
n
学生(学号,姓名,年龄)
课程(课程号,课程名,学时数)
成绩
学习(学号,课程号,成绩)
数据库设计规范化
数据库设计规范化——范式理论篇(P345)
必要性:解决在关系模式设计时,存在的数据存储异常现象:数据冗余、修改异常、插入异常、删除异常等。
大仲马
上海译文出版社
982
三个火枪手
7-5237-1224-9/
大仲马
止海译文出版社
1428
基督山伯爵
左明健
机械工业出版社
270
可靠性模型与应用
7-111-06887-4
蒋仁言
机械工业出版社
270
可靠性模型与应用
7-111-06887-4
谢式千
高教出版社
403
概率论
盛聚
高教出版社
403
概率论
作者
出版社
价格
页数
书名
ISBN
续
第一规范型:
如果一个关系模式中的属性都是单纯的(即不可再分为更小的属性),则称该 模式是属于第一规范型(First Normal Form , 即 1NF )。
210095
南京
卫岗
邮编
市
街道
江苏
甲
省
地址
姓名
续
第二规范型:
如果一个关系模式属于1NF,并且所有的非关键字都完全地依赖于关键字(即不存在部分依赖),则称该关系模式属于第二规范型 , 即 2NF 。
续
第三规范型:
如果一个关系模式属于2NF,并且不存在非关键字传递地依赖于关键字,则称该关系模式属于第三规范型(3NF)。
350
高工
王五
1005
120
技术员
李四
1002
张三
职工
200
工程师
1001
工资
职务
职工号
续
适当的规范化
规范化程度越高
数据冗余
更新异常
连接运算时间
查询时间
效率
自学任务
再见
Do you have made a progress today ?