第四章 环境规划与管理的数学基础
第一节 环境数据处理方法
一、数据的表示方法
1、列表法
例:研究电阻的阻值与温度的关系时,测试结果如下:
2、图示法
图示法的第一步就是按列表法的要求列出因变量y与自变量x相对应
的yi与xi数据表格。
作曲线图时必须依据一定的法则,只有遵守这些法则,才能得到与实
测量序号 温度t/℃ 电阻R/Ω
1 10.5 10.42
2 29.4 10.92
3 42.7 11.32
4 60.0 11.80
5 75.0 12.24
6 91.0 12.67
验点位置偏差最小而光滑的曲线图
形。
坐标纸的选择--常用的坐标系为直
角坐标系,包括笛卡尔坐标系(又
称普通直角坐标系)、半对数坐标系
和对数坐标系。
•半对数坐标系
•一个轴是分度均匀的普通坐标轴,另一个轴是分度不均匀的对数坐标
半对数坐标的标度法
轴。
•右图中的横坐标轴(x轴)是对数坐标。在此轴上,某点与原点的实
际距离为该点对应数的对数值,但是在该点标出的值是真数。为了说
明作图的原理,作一条平行于横坐标轴的对数数值线。
3、插值法计算数值
(1)作图插值法
例:用分光光度计法测定溶液中铁的含量,测得标准曲线数据如下:
Fe (μg/mL) 2 4 6 8 10 12
吸光度(A)
测得未知液的吸光度为,试求未知液中铁的含量。
在图的纵坐标上 处找到直线上对应点,读出其对应的横坐标即为
未知液中铁的含量
(2)比例法
(3)牛顿内插公式
一般的非线性函数都可以展开为多项式
工作曲线
y = 0. 0516x - 0. 0061
R2 = 1
0
0. 1
0. 2
0. 3
0. 4
0. 5
0. 6
0. 7
0 2 4 6 8 10 12 14
Fe的浓度( μ g/ mL)
吸
光
度
(A
)
(二)数据特征
数据特征是对环境总体状况进行估计判断的基础,是认识数据理论特
性的基本出发点,通常可分为以下三类:
位置特征数:表示数据集中趋势或刻画频数分布图中心位置的特征数;
离散特征数:用来描述数据分散程度;
分布形态特征数:刻划了根据所获数据绘制的分布曲线图的形态。
1. 位置特征数
(1)算术平均数:
式中:x1, x2, …, xn 为样本个体数据,n 为样本个数
(2)加权平均数
如果样本个体数据x1, x2, …, xn取值因频 数不同或对总体重
n
x
n
xxx
x
n
i
i
n
121
△
n
i
i
n
i
ii
n
nn
w
w
xw
www
xwxwxw
x
1
1
21
2211
△
△
要性有所差别,则常采取加权平均方法。
式中:wi是个体数据出现频数,或是因该个体对样本贡献不同而取的不
同的数值。
(5)中位数
环境数据有时显得比较分散,甚至个别的数据离群偏远,难以判断去
留,这时往往用到中位数。
样本数据依次排列(从大到小或者从小到大)居中间位置的数即为中
位数,若数据个数为偶数,则中位数为正中两个数的平均值。
只有当数据的分布呈正态分布时,中位数才代表这组数据的中心趋向,
近似于真值。
1. 位置特征数
环境统计中常常用到几何平均数。
不同的平均值都有各自适用场合,选择的平均数指标应能反映数据典型
水平,并非随意采用。几何平均直径:
31 2 1/
g 1 2 3
p
g
( ...)
ln
exp( )
或 nn n N
i i
d d d d
n d
d
N
2. 离散特征数
3. 分布形态特征数
二、异常数据的剔除
在处理实验数据的时候,我们常常会遇到个别数据偏离预期或大量统
计数据结果的情况,如果我们把这些数据和正常数据放在一起进行统
计,可能会影响实验结果的正确性,如果把这些数据简单地剔除,又
可能忽略了重要的实验信息。这里重要的问题是如何判断异常数据,
然后将其剔除。判断和剔除异常数据是数据处理中的一项重要任务,
目前的一些方法还不是十分完善,有待进一步研究和探索。
目前人们对异常数据的判别与剔除主要采用物理判别法和统计判别
法两种方法。
物理判别法就是根据人们对客观事物已有的认识,判别由于外界干扰、
人为误差等原因造成实测数据偏离正常结果,在实验过程中随时判断,
随时剔除。
统计判别法是给定一个置信概率,并确定一个置信限,凡超过此限的
误差,就认为它不属于随机误差范围,将其视为异常数据剔除。
剔除异常数据实质上是区别异常数据由偶然误差还是系统误差造成
的问题。
若是人为因素的偶然误差就应剔除,如果没有足够的理由证实是偶然
过失造成的时候,应对数据进行统计处理,采用一定的检验方法来决
定取舍。
本节着重介绍统计判别法。
1.拉依达准则
若可疑数据 xp 与样本数据之算术平均值的偏差的绝对值大于 3 倍(2 倍)
的标准偏差,即:
s23 或sxxd pp
则应将 xp 从该组数据中剔除,至于选择 3s 还是 2s 与显著性水平α有关,
显著性水平α表示的是检验出错的几率为α,或检验的可置信度为 1-α。
3s 相当于显著水平=,2s 相当于显著水平=。
2. 格拉布斯准则①
用格拉布斯准则检验可疑数据xp时,选取一定的显著性水平α ,若:
则应将xp从该组数据中剔除, 称为格拉布斯检验临界值,
可查相关表格得到。
以上准则是以数据按正态分布为前提的,当偏离正态分布, 特别是
测量次数很少时,则判断的可靠性就差。因此,对粗大误差除用剔除
准则外,更重要的是要提高工作人员的技术水平和工作责任心。另外,
要保证测量条件稳定,防止因环境条件剧烈变化而产生的突变影响。
3.狄克逊(dixon)法
狄克逊研究了n次测量结果,按其数值大小排列成如下次序:
当 xi 服从正态分布时
用不同的公式求得 f 值,再经过查表,得到相应的临界值,进行比较,
若计算值>f(n,α)视为异常值,舍弃;再对剩余数值进行检验,直到
没有异常值为止。狄克逊通过模拟实验认为:n≤7,使用 f10 ;8≤n≤
10,用 f11 ;11≤n≤13,用 f21 ;n≥14,用 f22 效果好。
(1) (2) ( )n L
例题
用狄克逊法判断下列测试数据(,, ,,)
中的是否应舍弃?
解:将数据排列,取 α =
,<
所以应保留。
三、数据的误差分析
(一)几种误差的基本概念
例题: 滴定的体积误差
V 绝对误差 相对误差
mL ① mL ①%
mL ① mL ①%
(二)误差的来源及分类
1. 随机误差
随机误差是在一定条件下以不可预知的规律变化着的误差。这些
偶然因素是操作者无法严格控制的,故无法完全避免随机误差。但它
的出现一般具有统计规律,大多服从正态分布。
2. 系统误差
系统误差是指由某个或某些不确定的因素所引起的误差。当条件
一旦确定,系统误差就是一个客观上的恒定值,它不能通过多次测量
取平均值的方法来消除,只能根据仪器的性能、环境条件或个人偏差
等进行校正,使之降低。
3. 过失误差
过失误差是由于操作人员不仔细、操作不正确等原因引起的,它
是可以完全避免的。
(三)误差分析
误差可能是由于随机误差或系统误差单独造成的,还可能是两者的叠
加。误差分析中,常采用精密度、正确度和准确度来表示误差的性质。
精密度反映了随机误差大小的程度,是指在相同条件下,对被测对象
进行多次反复测量,测量值之间的一致(符合)程度。
正确度指测量值与其“真值”的接近程度。
对于一组数据来说,精密度高并不意味着正确度也高;反之,精密
度不好,但当测量次数相当多时,有时也会得到好的正确度。
准确度指被测对象测量值之间的一致程度以及与其“真值”的接近程度。
准确度、正确度和精密度的关系
四、数据的标准化处理
在大批的环境统计数据中,当数据的物理量不同、单位或量值差别较
大时,常常会给下一步分析带来困难,这时就有必要对数据进行标准
化处理,从而提高计算的精度。
环境管理与规划中,常采用下面的公式进行标准化处理:
第二节 最优化分析方法
一、线性规划
在环境规划管理中,线性规划常常用来解决两类优化问题:一
是如何优化资源配置使产值最大或利润最高,二是如何统筹安排以便
消耗最少的资源或排放最少的污染物。
一般线性规划问题的求解,最常用的算法是单纯形法。
二、非线性规划
在环境规划与管理中,某些问题的决策模型可能会出现下面的
情况:①目标函数非线性,约束条件为线性;①目标函数为线性,约
束条件非线性;①目标函数与约束条件均为非线性函数。上述情况均
属于非线性规划问题,其数学模型的一般形式是:
数值求解非线性规划的算法大体分为两类:
一是采用逐步线性逼近的思想,通过一系列非线性函数线性化的过程,
利用线性规划获得非线性规划的近似最优解;
二是采用直接搜索的思想,根据部分可行解或非线性函数在局部范围
内的某些特性,确定迭代程序,通过不断改进目标值的搜索计算,获
得最优或满足需要的局部最优解。
三、动态规划
在环境规划管理中,经常遇到多阶段最优化问题,即各个阶段相互联
系,任一阶段的决策选择不仅取决于前一阶段的决策结果,而且影响
到下一阶段活动的决策,从而影响到整个决策过程的优化问题。这类
问题通常采用动态规划方法求解。
基本原理为:作为多阶段决策问题,其整个过程的最优策略应具有这
样的性质,即无论过去的状态和决策如何,对前面的决策所形成的状
态而言,其后一系列决策必须构成最优决策。
可以把多阶段决策问题分解成许多相互联系的小问题,从而把一个大
的决策过程分解成一系列前后有序的子决策过程,分阶段实现决策的
“最优化”,进而实现“总体最优化”方案。为使最后决策方案获得最优
决策效果,动态规划求解可用下列递推关系式表示:
第三节 常用决策分析方法
决策是指通过对解决问题备选方案的比较,从中选出最好的方案。
决策贯穿于环境管理与规划的各个方面,是管理与规划的核心。
决策技术
技术经济分析中的决策,是指对多方案进行评价与择优,从而选定一
个最满意的方案。
决策的分类
按决策的条件
确定型
非确定型
风险型
按决策的对象
宏观
微观
按决策在企业组织中的地位分类
高层决策
中层决策
基层决策
决策树法
决策树技术的含义
是把方案的一系列因素按它们的相互关系用树状结构表示出来,
再按一定程序进行优选和决策的技术方法。
决策树技术的优点
便于有次序、有步骤、直观而又周密地考虑问题;
便于集体讨论和决策;
便于处理复杂问题的决策。
决策树图形
适用对象
多阶段决策、前一阶段的决策影响后续阶段的结构和决策的项目。
方法
用决策树的形式列出决策问题的逻辑结构。
从决策树的末端向决策点倒退,计算出不同决策方案下的期望值,
将未占优的方案去掉,直到得出初始的决策方案。
运用决策树技术的步骤
(1)绘制决策树图;
(2)预计可能事件(可能出现的自然状态)及其发生的概率;
(3)计算各策略方案的损益期望值;
(4)比较各策略方案的损益期望值,进行择优决策。
若决策目标是效益,应取期望值大的方案;若决策目标是费用或损
失,应取期望值小的方案。
决策树例题(参考书目:环境管理学-杨贤智编著 )
有一石油化工企业,对一批废油渣进行综合利用。它可以先作实验,
然后决定是否综合利用;也可以不作实验,只凭经验决定是否综合利
用。作实验的费用每次为3000元,综合利用费每次为10000元。若做
出产品,可收入40000元;作不出产品,没有收入。各种不同情况下
的产品成功概率均已估计出来,都标在图1上。试问欲使收益期期望
值为最大,企业应如何作出决策。
根据图中给出之数据求解。决策树采用逆顺序计算法。
1. 计算事件点①、①、①的期望值
①40000×+0×=34000
①40000×+0×=4000
①40000×+0×=22000
原决策树根据以上算出的期望值可简化为(图2a):
2.在决策点2、3、4作出决策
2 按max[(34000-10000),0]=24000,决定综合利用。
- - 支 出 符 号- - 决 策 ( 事 件 ) 点 ;
- - 决 策 点
不 试 验
不 综 合 利 用
0
0
产 品 不 成 功 概 率 为 0 . 4 5
- 1 0 0 0 0
4 0 0 0 0
产 品 成 功 概 率 为 0 . 5 5综 合 利 用
44
0
0
不 综 合 利 用
产 品 不 成 功 概 率 为 0 . 9
产 品 成 功 概 率 为 0 . 1
概 率 为 0 . 4
不 好
- 1 0 0 0 0
综 合 利 用
33 4 0 0 0 0
不 综 合 利 用
0
0
产 品 不 成 功 概 率 为 0 . 1 5
- 1 0 0 0 0- 3 0 0 0
概 率 为 0 . 6
4 0 0 0 0
产 品 成 功 概 率 为 0 . 8 5综 合 利 用好试 验
2211
3 按max[(4000-10000),0]=0,决定不综合利用。
4 按max[(22000-10000),0]=12000,决定综合利用。
决策树继续简化为(图2b):
3.计算状态点①的期望值:24000×+0×=14400
4.在决策1作出决策。
5.最后得出整个问题的决策序列为:不作实验、直接综合利用,收入期
望值为12000元。
二、决策矩阵
b
a
1 2 0 0 0
综 合 利 用不 试 验
0
概 率 为 0 . 4
不 好
2 4 0 0 0
概 率 为 0 . 6
好
△
- 3 0 0 0
试 验
1 1
不 试 验
0
2 2 0 0 0
不 综 合 利 用
△
- 1 0 0 0 0
综 合 利 用
4
0
不 综 合 利 用
4 0 0 0
△
- 1 0 0 0 0
综 合 利 用
概 率 为 0 . 4
不 好
3
不 综 合 利 用
0
3 4 0 0 0
△
- 1 0 0 0 0
综 合 利 用
概 率 为 0 . 6
好
△
3 0 0 0
试 验
决策矩阵又称为损益矩阵,它是利用损益的期望值进行决策,常用于
有限条件下资源分配的最优化决策问题。
三、多目标决策方法
在环境管理与规划问题中,同时存在着多个目标,每个目标都要求达到
其最优值,并且各目标之间往往存在着冲突和矛盾,这类问题就是多
目标决策问题。解决这类决策问题的方法就是多目标决策方法。
第四节 环境数学模型
一、数学模型概述
环境数学模型是应用数学语言和方法来描述环境污染过程中的物理、
化学、生物化学、生物生态以及社会等方面的内在规律和相互关系的
数学方程。
它是建立在对环境系统进行反复的观察研究,通过实验或现场监测,
取得大量的有关信息和数据,进而对所研究的系统行为动态、过程本
质和变化规律有了较深刻认识的基础上,经过简化和数学演绎而得出
的一些数学表达式,这些表达式描述了环境系统中各变量及其参数间
的关系。
一、数学模型概述
环境数学模型主要应用于环境规划与管理、环境影响评价和环境质量
预测几个方面,其类型主要包括大气扩散模型、水文与水动力模型、
水质模型、土壤侵蚀模型、沉积物迁移模型和物种栖息地模型等,每
一类模型又可按模型的空间维数、时间相关性、数学方程特征等来进
行分类 .
二、模型建立
建立数学模型的步骤
规划模型
马氏链模型
图论模型
几何模型
初等数学模型
按数学方法分类
控制模型
决策模型
优化模型
预报模型
分析模型
描述模型
按建模目的分类
灰箱模型
黑箱模型
白箱模型
分类按对模型结构了解程度
不等式模型
函数方程模型
微分方程模型
代数模型
按模型所属数学分支
非线性模型
线性模型
按模型中变量阶次
确定性模型
随机模型
按模型是否含随机变量
按数学方程特征分类
稳态模型
动态模型
按时间相关性分类
三维模型
二维模型
一维模型
零维模型
按空间维数分类
(一)建模准备
了解问题的实际背景,明确建模目的,搜集必需的各种信息,尽量弄
清对象的特征。
(二)模型假设
根据对象的特征和建模目的,对问题进行必要的、合理的简化,用精
确的语言作出假设,是建模至关重要的一步,建模者能充分发挥想象
力、洞察力和判断力,善于辨别主次,而且为了使处理方法简单,应
尽量使问题线性化、均匀化。
二、模型建立
建立模型的方法
1、图解法
采用点和线组成的用以描述系统的图形称为图模型,可用于描述自然
界和人类社会中大量事物和实物之间的关系。
图模型形象、直观,对决策者了解系统结构和功能之间的关系很有帮
助。但图解建模法作为一种描述性方法,往往精确度较差,而且受人
的视觉影响而局限于三维空间中,因此它通常作为建立系统方程式模
型的辅助分析工具来用。
2、质量平衡法
根据质量平衡原则建立微分方程是最常用的建立白箱模型的方法。
应用质量平衡方法必须知道物质流的方向和通量,污染物质反应的方
式和速度,以及各种污染物之间的相关关系和关联作用。
环境数学模型中很多都是在质量平衡的基础上建立的。值得注意的是,
几乎每一个利用质量平衡原则建立的模型中都包含了一个或多个待
定参数,它们一般很难由过程的机理确定,且数值又随时间、空间变
化,因此需要借助于大量的观测数据最终确定参数。
3、概率统计法
回归分析法建立在对客观事物进行大量试验和观察的基础上,是一种
用来寻找隐藏在某些现象中的规律性的数理统计方法。
回归分析法就是通过分析因素之间的因果关系和影响程度进行预测,
用过去和现在的环境监测数据确定函数关系式,按最小二乘法原则确
定函数式中的参数值,进而建立回归预测模型,用于预测环境要素特
征发展变化的规律。
3、概率统计法
根据变量之间函数形式的不同,回归分析分为线形回归和非线性回归;
根据自变量个数的多少,可分为一元回归和多元回归。
根据数据处理方法的不同,时间序列预测方法主要分为移动平均法、
加权滑动平均法和指数平均法。
三、模型参数的估值方法
由于环境系统中的模型基本上都是灰箱模型,其中至少存在着一个待
定参数,因此参数的估计是建立环境数学模型非常重要的一项工作。
下面介绍几种主要的估值方法。
(一)图解法
凡是给定的公式或数据可以直接描述成一条直线,或经过一定处理
后可以转化为直线时,常常采用图解法估计参数。作图时,将自变量x
和因变量y标注在直角坐标系中,确定每一个数据点位,把所有的点
位连接起来,形成一条直线,其数学表达式为:
Y=b + ax (4-21)
式中:a是直线的斜率,b是直线在y轴上的截距。
(二)经验公式法
根据长时期的实际经验,人们提出了许多经验公式来估计数学模型
中的相关参数。应注意的是,使用经验公式要求该系统条件与建立经
验公式的条件一致或相近,否则就会出现很大偏差。
(三)线性回归法
此法适用于自变量xi(i=1,2,¡-n)与因变量y呈一次线性关系的情况。线性回
归分析有两个基本假设:一是所有的自变量的值xij(j=1,2,¡-m)均不存
在误差,因变量的值含有测量误差;二是与各测量值拟合得最好的线
性方程:y=a1x1+a2x2+¡-+aixi+¡-+¡-anxn+b
是能使各点到直线的竖向偏差的平方和
最小的直线。根据极值存在的条件,分别对Z做ai、b的一阶偏导,使:
由此可以求得偏差平方和Z最小时的参数值ai(i=1,2,…n)、b。
四、模型的检验
数学模型只能近似地反映实际问题中的关系和规律,到底反映得好不
好,还需要接受检验,如果数学模型建立得不好,没有正确地描述所
2
1
2211
1
2 )(
m
j
njnijijjj
m
j
j bxaxaxaxaydZ △△
0
b
Z
a
Z
i
给的实际问题,数学解答再正确也是没有用的。因此,在得出数学解
答之后还要让所得的结论接受实际的检验,检验其是否合理和是否可
行等。
所谓检验就是用独立于确定参数时所用数据的新观测数据与模型的
计算值相比较,进行误差分析,进行数据稳定性分析,如果不符合实
际,还应设法找出原因,修改原来的模型,重新求解和检验,直到比
较合理可行,才能算是得到了一个解答。但是,十全十美的答案是没
有的,已得到的解答仍有改进的余地,可以根据实际情况,或者继续
研究和改进;或者暂时告一段落,待将来有新的情况和要求后再作改
进。
检验包括两部分,一是检验模型的计算结果和实际观测数据之间的吻
合程度,二是对模型进行灵敏度分析。其中灵敏度分析用来估计模型
计算结果的偏差,本节仅介绍模型的吻合度检验方法。
四、模型的检验
(1)相关系数法
相关系数法假设观测值和计算值存在一定的线性关系:
习题
1. 计算下面数据的各种平均值、标准差、算术平均误差和级差。
,,,,,,,,,,,
2. 对某合金中铜的含量进行测定,不同的人员测定的数据为:,
,,,,,,,,,试
用格拉布斯准则检验是否有应舍去的数据。
3. 有一组三因子数据:x1=(1, 3, 4, 5),x2=(, , ),x3=(32, 35, 36),
试对它们进行标准化处理。