第二篇 技术篇
概述
计算机系统
计算机网络
数据库与数据仓库
决策分析与支持、神经网络和遗
传算法
概述
信息技术是管理信息系统中的一种重要资源
信息技术是指各种以计算机为基础的工具,人们
用它来加工信息,并支持组织的信息需求和信息
处理任务
信息技术包括两种类型:硬件和软件
– 硬件是指组成计算机或计算机系统的物理设备
– 软件则是指计算机硬件执行的一系列指令,用来完成某个
特定的任务
硬件:输入、输出、存储、CPU和RAM、通信、
连接等设备
软件:应用软件和系统软件
计算机系统
计算机的分类
– PDA
– 笔记本电脑、台式计算机和平板电脑
– 小型机、大型机和巨型机
计算机硬件
– CPU、内存
– 其他设备
计算机软件
PDA
Notebook
Desktop
Tablet PC
Minicomputers
MainframeSupercomputer
Keyboard (input)
CDs (storage)
Video card (connecting)
CPU
Cable modem
(telecommunications)
Monitor (output)
计算机应用软件的体系结构形式
单机结构
C/S结构
B/S结构
三层/多层结构
用户操作界面
逻辑处理程序
接口程序(通信端口及数据库操作)
数据库管理系统(以桌面数据库为主)
其他…
单机结构的应用程序的组成
单机结构的应用程序:发油系统
C/S和B/S结构的应用程序
与单机应用程序的不同
– 数据库位于服务器端
– 客户端往往不只一个
– 需注意在单机方式下无需考虑的效率、负荷和同步等
问题
C/S与B/S的不同
– 系统性能方面
– 系统开发方面
– 系统升级维护方面
– 系统安全方面
多层结构的应用程序
多层结构的划分
– 数据层、业务层、表现层
– 胖客户端、瘦客户端及其他
逻辑位于何处?
– 逻辑的分类:数据逻辑、业务逻辑和表现逻
辑
多层结构的优点
更有效地利用了系统的资源,增强了系
统的总吞吐量和可缩放性
系统维护更加方便和容易
使得不同数据源系统的集成成为可能
允许跨地域和跨平台操作
在服务器暂时不可用时客户端的信息将
被保持,增强了系统的可用性
对客户端隐藏了业务逻辑细节
计算机网络
计算机网络的概念
计算机网络的功能
– 资源共享
– 数据传输
计算机网络的分类
– 按网络分布:局域网、广域网
– 按网络拓扑:树状、星形、总线、环状
– 按服务方式:主从网络、对等网络
计算机网络的体系结构
数据库与数据仓库
构建商务智能
数据库技术的发展过程
什么是数据库?
60年代
– 数据收集、数据库创建、信息管理系统( IMS )和网络数据库
管理系统(Network DBMS)
70年代
– 关系数据模型以及关系型DBMS
80年代至今
– 高级数据模型 (具有扩充关系的, 面向对象的, 演绎的等等) 和 面
向应用的 DBMS (空间的, 科学的, 工程的等等)
90年代至今
– 数据挖掘和数据仓库,多媒体数据库和Web数据库。
我们需要了解的数据库技术:
以混凝土公司销售数据为例
数据库中包含多张表:
– Order
– Customer
– Concrete Type
– Employee
– Truck
– ……
每张表中应包含什么信息?——信息的收集
创建逻辑结构
在数据库中,行号是无关紧要的
数据库中,每一列都有一个诸如 Order
Date 或 Customer Name之类的逻辑
名称
数据字典 – 描述了数据库中信息之间逻
辑关系——“关于数据的数据”
信息内部的逻辑联系
数据库的不同表之间往往存在着内在逻辑联
系
逻辑联系是由主键(primary key)和外键
(foreign key)实现的
Primary key – 能唯一确定记录的字段或字段
组
Foreign key – 存在于一个关系中的另一个关
系的主键
外键起到了建立表间联系的作用
在这里,文件=表=关系
文件内的完整性约束
完整性约束(Integrity constraint) – 确
保信息合理性的规则
Examples
– 在一个表中主键值必须是唯一的
– 外键不能为空
– Sales price 字段值必须为正
– Phone numbers 必须有区号
SQL:结构化查询语言
Structured query language (SQL) – 大多数数据库使
用的第4代查询语言
使用结构化的语句进行数据查询
更多地被IT技术人员使用在数据查询或程序设计中
SELECT
,
stName,
FROM Employee INNER JOIN Order ON
=
WHERE =4567;
练习
使用桌面数据库产品建立一个数据库,
使用到主键、外键和完整性约束。并进
行10行以上的数据输入和查询
数据仓库简述
OLTP与OLAP
– online transaction processing &
– online analytical processing
数据仓库(Data warehouses)支持OLAP
和决策
DW 不支持 OLTP
数据挖掘(Data-mining) 工具使用数据仓
库信息工作
– DBMS software = database
– Data-mining tools = data warehouse
什么是数据仓库?
信息的逻辑集合,这些信息来自于许多不同的业务
数据库,并用于创建商务智能,以支持企业的分析
活动和决策任务。
William H. Inmon:数据仓库是在企业管理和决策
中面向主题的、集成的、与时间相关的、不可修改
的数据集合。
– 面向主题而非面向应用
• 典型的主题领域:顾客、产品、财务
– 与时间相关
• 时间维是数据仓库中一个重要维度
• 操作型数据库的时间期限一般是60~90天,而数据仓库中数据的
时间期限通常是5~10年。
–不可修改:面向应用的事务数据库需要对数据进行频繁的插
入、更新操作,而对于数据仓库中数据的操作仅限于数据的
初始导入和记录查询。
多维度(关系数据是二维的)
行、列和层
常被称为超立体结构
hypercubes
右图的维度?
数据挖掘工具
对数据仓库中信息进行查询的软件工具,
包括:
– 查询与报表工具
– 智能代理
– 多维分析工具
– 统计工具
另一个常见的概念:数据集市
数据集市(Data Marts)是数据仓库的一
个子集,它仅聚集了数据仓库中的部分信
息
数据仓库常被视为涉及整个组织范围
数据仓库和数据挖掘带来职业机会
数据仓库和数据挖掘知识将给你带来很有潜
力的职业机会
无需成为IT专家,也能建立数据仓库
– 甚至Excel和Access中也有类似功能
下面是一些这方面软件的代表:
– SAS(最著名的统计与数据分析软件)
– Cognos(排在数据仓库与数据挖掘软件第1位)
– Informatica (排在数据仓库与数据挖掘软件第2位)
– 常用的数据库产品,SQL Server,Oracle等
在SQL Server中建立数据仓库
决策分析与支持、神经网络、
遗传算法和系统仿真
了解决策支持系统的组成
学习如何在Excel中进行系统建模和决
策分析
了解神经网络及其用途
了解遗传算法及其用途
一个系统仿真的演示
如何进行决策
情报分析阶段
– 发现问题所在
设计阶段
– 找出若干可行方案
选择阶段
– 选择最合适的解决方
案
实施阶段
– 方案实施
决策支持系统的组成
模型管理部件
数据管理部件
用户界面管理部件
使用Excel进行决策:
Motor Distribution Model of Autopower Europe
Autopower Europe
– Manufactures UPS for major installations
Four manufacturing plants Leipzig,
Germany Nancy, France Liege,
Belgium Tilburg, The Netherlands
Three harbors Amsterdam, The
Hague and Antwerp
Motor Distribution
Transportation Costs
Minimize the transportation costs involved in
moving the motors from the harbors to the
plants
A Transportation Model in Excel
神经网络初步
当你看到一条你从未见过的品种的狗时,你能
识别出它是狗吗?
神经网络(artificial neural network or ANN):
发现和辨别模式(pattern)的人工智能系统
神经网络的作用:识别、分类和预测
应用
– 金融机构使用神经网络发现市场潜在的机遇,例如找出
不同股票价格影响模式。
– 警方利用神经网络发现当地犯罪模式。
– 信用卡公司使用神经网络发现个人账户异常,以防止欺
诈行为
– 。。。。。。
神经网络的多层结构
输入层
隐含层
输出层
使用Joone建立一个最简单的神经网络:
XOR
XOR的真值表
Joone中的操作步骤
用下列字符串建立一个文本文件
– ;;
;;
;;
;;
Joone中的操作步骤
在Joone中建立并执行模型
验证模型的有效性
程序的方式
遗传算法
遗传算法(Genetic Algorithms ):遗传
算法是一种人工智能系统,它通过模仿
进化过程中适者生存规律从而产生的一
个问题的逐步改进的解决方案
遗传算法的进化法则
1. 选择(Selection) – 适者生存,适应
值高的个体有更大的机会把自己的基
因传给下一代。
2. 交叉(Crossover) – 将双亲的基因
片段交换,从而得到下一代孩子的基
因
3. 变异(Mutation) – 在某些基因位上
进行变异,以实现个体多样化
遗传算法的应用场合
GA最适于解决由多个变量组合而成的
几千甚至几百万个方案中选择最优方案
的问题,尤其当没有明确的模型可用于求
解时。
两个例子:
– 美国西部公司利用GA确定在多达100 000个
连接点的网络中的最佳光缆结构。以前完成
这个工作一个有经验的工程师至少也需要2
个月,而使用GA只需两天,得到的方案比
以前工程师设计的方案更优。
– 民航机场的机位分配
一个简单的遗传算法程序
参数优化
GA_Example/%E9%81%97%E4%BC%A0%E7%AE%97%E6%B3%95%E7%A4%BA%E4%BE%
GA实例讨论:装钉子
3 types of nails
per box
weight not to
exceed 20 ounces
no more than 30
nails per box
at least 5 and not
more than 10 nails
per box
钉子
尺寸
重量 成本 售价
4 1 4 8
6
3 3 5
4
2 2 3
1 2
CAN YOU…
1. Describe decision support system, list its
components, and identify the type of
application it’s suited to.
2. Describe artificial intelligence and list the
different types that are used in businesses.
3. Describe neural networks and the uses of
ANN tool.
4. Describe genetic algorithms and list the
concepts on which they are based and the
types of problems they solve.