第30卷第6期武汉理工大学学报·信息与管理工程版Vol. 30 2008年12月Dec. 2008 JOURNAL OF WUT(INFORMATION &M ANAGEMENT ENGINEERING) 文章编号:1007 -144X(2008 )06 -0991 -04 港口集装箱吞吐量影晌因素研究陈涛焘,高琴(武汉理L大学交通学院,湖J~武汉430063) 摘要:针对港口集装箱吞吐量预测中重要指标难以选取的问题,从可能影响港口集装箱吞吐量的因素出发,采用主成分分析法,提取最关键影响因素。分别选取我国三大区域中的上海港、青岛港和广州港进行实证分析。这些影响指标的提取,将为三大区域构建港口集装箱吞吐量预测模型提供重要参考。关键词:港口集装箱吞吐量;主成分分析;影响因素中图法分类号:U691. 71 文献标志码:A港口;集装箱吞吐量是港口的主要生产指标,济圈、环渤海经济圈、珠三角经济圈)选取具有代对港口的建设和管理具有重大影响。港口集装箱表性的上海港、青岛港和广州港作为研究对象。吞吐量预测是港口项目建设可行性研究的重要内并收集了1996-2006年的上述港口集装箱吞吐容,直接影响着项目是否可建及其建设规模。科量数据,以及上海、江苏、浙江、山东和广东五省市学预测的前提就是要充分把握影响港口集装箱吞1996 -2∞6年的GDP、总人口数、工业总产值、社吐量的最主要因素,尤其是在构建预测港口集装会商品零售总额、外贸进出口额、第一产业值、第箱吞吐量预测模型时,所采用的影响指标对模型三产业值、第二产业值、铁路货运量、公路货运量的可靠性和结果精度至关重要。而目前国内多是和总货运量等数据。由于上海港的直接经济腹地凭借主观判断和经验选取定性的影响因素,有些为长三角地区,青岛港和广州港的直接经济腹地指标在定性分析时影响显著,但作为自变量在数分别为山东省和广东省,其货物吞吐量的90%以学模型中却对港口集装箱吞吐量的影响并不起主上来自本省,因此,影响上海港集装箱吞吐量因素要作用。这样往往会漏掉影响显著的因素而加入的数据为上海市、江苏省和浙江省的总和,青岛港冗余变量,不仅会减弱模型的解释能力,而且会降和广州港则以本省数据为基础O低模型的精度[1]。 单因素分析关系圈图1-图3给出了部分影响因素与港口集装1 单因素分析箱吞吐量的相关关系图。从单因素角度分析,其 数据来源12 ·工业总产值(万亿元)因素分析法是依据分析指标与其影响因素的nu COP(万亿元)志第二产业值(万亿元)关系,从数量上确定各因素对分析指标影响方向单艳阳响。。正♂少-A社会消费品总额(万亿元)和影响程度的一种方法。因素分析法既可以全面x外贸进tH口额(万亿兀)EOA分析各因素对某一经济指标的影响,又可以单独白tz讼分析某个因素对经济指标的影响。钟一般认为影响港口;集装箱运输的主要因素包2 括:港口的地理位置、腹地经济、政策环境、港口通。过能力和集疏运系统等。其具体内容包括:地区500 1 000 1 500 2000 2500 GDP,工业总产值、地区总人口、货运量、社会消费港口集装箱吞吐量/万TEU品总额和外贸进出口额等。图1上海港集装箱吞吐量与影响因素关系图笔者分别在国内的三大经济区域(长三角经收稿日期:2008-07 -09. 作者简介:陈涛焘(1982-) ,刃,安徽合肥人,武汉型工大学交通学院硕士研究生.
武汉理工大学学报·信息与管理工程版2008年12月992 5 方法,所提取的几个综合变量可以反映原来多个*玉、I~总产俏(万亿元)变量的大部分信息。为了使这些综合变量所含的4卡R’= /. .人II(千万人)也应器A第二产业值(万亿元)信息互不重叠,应要求它们之间互不相关。例如句39"wmEZEx第二产业值(万亿元)在评价企业的经营业绩时,要考虑许多指标,如利.第一产业值(万亿元)润、产值、产品数量、产品质量、固定资产和流动资战R’= 产等,若要全部列出,也许可以有几十个变量。因R’= 1 此,用少量的几个综合变量代替原来的许多变量R’= ’= 85 是有实际意义的。由这几个综合变量出发还可能。200 400 600 800 1 000 得到一个总的指标,按该总指标来排序、分类,问港口集装箱吞吐量/万TEU题就得以简化。图2青岛港集装箱吞吐量与影响因素关系图笔者选取可能影响港口集装箱吞吐量的指8642086420 标[6J有:地区GDP(X)、地区总人口数(X)、工12·铁路货运量(亿吨)业总产值(几)、社会消费品零售总额(X)、外贸x货运量刊乙吨)4每狸精图宣险 GDP(万亿元)进出口额(X)、第一产业值(X)、第二产业值56YJdA公路货运量(亿吨)JMt44Z\仍r(X)、第三产业值(X)、铁路货运量(X)、公路\77 89yirtmM\Mm掌第二」产业值(万亿元)y84-2货运量(X)和货运量(X)0其计算步骤如r:lOll(1)为了消除系统统计误差及量纲差异的影4=织一--一-一R"f万-u →响,对原始数据进行标准化处理:Xij= (xij -X)/σ" 一一石恬44o-o0mn04yny 5 1立装一一曲血港」一)吐其中,Xij为原始值,九为标准化值,X和σE分别为mm咀白U口集第i个指标的样本均值和标准差。(刽2)计算相关系数矩阵R= (υTi叨ρj)λpx叩pρ,其中,图3广州港集装箱吞吐量与影响因素关系图r飞~EUJ= z (μX缸句ki-X具叼阳iJ川((Xk苟j叩-乓Xj叼)/尺(矶m叫σE厅σ叽均叩-州)儿。其中,Tij 相关系数R都在以上,说明港口集装箱吞吐第i个指标X和第j个指标乓的相关系数,X,量和这些单个影响因素均存在较好的相关性[2]Oiki句分别为指标Xi、X的第k个样本值,n为样本个国内已有采用某一单因素来构建预测模型的研j数,p为指标个数。究,如采用GDP作为惟一的影响因素,利用灰色理论建立集装箱吞吐量预测模型[31O但是,由于(3)计算矩阵R的特征恒和特征向量。求出港口;集装箱吞吐量受多因素的影响,如果仅仅从特征值λ1,λ2 ,…,儿,并按从大到小顺序排列,同单因素分析,忽略其他影响指标,就很难剖析影响时求得对应的特征向量酌,酌,…,矶。港口集装箱吞吐量的机理,从而影响预测的准确(4)计算贡献率和累计贡献率。贡献率e性。而在考虑多影响因素的多元回归统计分析λ/L儿,累计贡献率Em= LÀ/三儿,其中,中,往往容易产生两方面问题:一方面为了避免遗p为指标个数,m为累计指标个数。漏重要信息而考虑尽可能多的指标;另一方面随(5)取累计贡献率大于一定数值的主成分,着考虑指标的增多增加了问题的复杂性。同时,求出主成分的因子载荷矩阵。其中涉及的数值视由于各指标均是对同一事物的反映,不可避免地解释精度而定,本研究取95%0 造成信息的大量重叠,这种信息的重叠有时甚至(6)因子载荷矩阵乘以主成分的贡献率,求会抹杀事物的真正特征与内在规律[4J。因此,需得各指标的重要度影响系数。要分析这些影响指标各自的重要程度,提取最重 实证分析要的影响因素。根据上述分析,可能影响港口吞吐量的相关2 重要影晌因素提取量化指标主要包括:GDP、对外贸易额、人口、第一产业产值、第二产业产值、第二产业产值、货运量、 计算方法铁路货运量和公路货运量[7J等。以上海港、广州主成分分析(principalcomponents analysis, PCA)也称为主分量分析[5J由HOTELLING于港和青岛港为例,笔者收集了1996-2006年[8J上1933年首先提出。它是一种通过降维把多个变述指标值的统计数据。其中,长三角地区1996-量(指标)化为少数几个综合变量(综合指标)的2∞6年相关指标一览表如表1所示。
第30卷第6期陈涛焘,等:港口集装箱吞吐量影响因素研究993 (1)标准化数据。根据以上公式,得到标准本的协方差矩阵,计算上述矩阵的特征值,从中得化后各指标数据如表2所示。到各主成分的特征值以及按从大到小顺序排列的(2)计算特征值及特征贡献率。标准化后样方差贡献率如表3所示。表1长三角地区1996-2(刷年相关指标一览表年份/年X/亿元X/万人X/亿元ζ/亿元X/亿美元几/亿元X/亿元X/亿元X/万吨X/万吨Xn/万吨s789101996 13 150 12 815 16 258 5 115 555 1 6δ3 6 903 4 594 194 362 12 502 122 994 1997 14 805 12 876 17 046 5 688 627 1 727 7 740 5 338 189 184 11 669 123 656 1998 16 054 12936 17 947 6 168 726 1 730 8 279 6 044 187 028 10 811 126 018 1999 17 330 12 994 19 560 6 678 882 1 718 8 880 6 733 193 931 10 561 127 728 2000 19 466 13 150 23 261 7 327 1 282 1 756 9 917 7 792 217 526 11 339 142 433 2001 21 565 13 202 26 634 8 089 1 451 1 832 10 884 8 850 219 386 12∞4 143633 2002 24 352 13 251 31 385 9 027 1 849 1 875 12 317 10 159 237 996 12 654 153 590 2003 28 842 13 299 41 244 10 110 2 875 1 961 15 093 11 788 260 535 13 520 165 906 2004 34 725 13 362 56 451 11 605 4 161 2 265 18 580 13 880 283 149 11 414 179 152 2005 40908 13 437 71 581 13 305 5217 2445 21 974 16 489 310 389 11 891 190433 2006 47 754 13 547 89 113 15 309 6 506 2 564 25 789 19 401 340 393 12 190 207 460 数据来源:上海市、江苏省及浙江省2007年统计年鉴并整理而得。表2长三角地区1996-2006年相关指标数据的标准化年份/年XXXXXXXXXXlQ X1 2 3 4 5 6 7 8 9 l1 1996 -1. 07 -1. 48 -O. 85 -1. 16 -O. 89 -O. 95 -1. 02 -1. 14 -O. 85 O. 75 -1. 03 1997 -O. 92 -1. 23 -O. 82 -O. 99 -O. 85 -O. 72 -O. 88 -O. 99 -O. 95 -O. 23 -1. 00 1998 1999 -1. 54 2000 -O. 52 -O. 08 -O. 57 -O. 49 -O. 53 -O. 63 -O. 54 -O. 48 2001 -O. 33 O. 13 -O. 26 -O. 39 -O. 38 -O. 26 O. 16 2002 2003 1. 94 却nA却υn却unnuυ 0'021'6i6 nυ n'nxIu'’'1-’30 咛1吁2 nυ。'0。I句t2i2 0 。1句。2句 nυn'句yIζtJOiH nJυ 。'A。Ui句ti nu叮tn/-y句nuo-o-MAnυ ,、句nυ8'nI2y'oi8or 0 且JIoooyff3TgJro寸。。-nuJnuq Joo。叫‘。。咱叫‘句句ovqJ JOHJ且匀,30MJ3nU30MJ33nHJ3n斗H唱Jddnu白00咱句咱Uii3ii表3各成分的特征值和方差贡献率表4主成分1和主成分2的因子载荷矩阵主成分方差贡累计方差主成分特征值综合得分献申%贡献率/%1 2 xxxxxxxxxzz 123456789mu 123456789ρi 90. 007 000 90.∞7000 8. 538 000 98. 546 000 1. 285 000 000 O. 068 000 99. 976 000 -0.俑10 O. 015 000 99. 990 000 000 ou nun un u nun un u 100.α)() 000 O. 000 000 100.α)() 000 ∞7 O. 000 095 100.α如000nu nun un u nun un v O. 000 000 100.α)() 000 ∞5 (3)因子载荷矩阵。由表3中可知,主成分 结果分析和主成分2的方差贡献率分别为%和以同样的方法可以计算出青岛港和广州港重毛,占主导地位,因此舍去累计贡献率大于要性指标及排名,经整理如表5所示。999岛的主成分,即保留主成分1和主成分2,计算按照排名,经整理得到影响各港口集装箱吞吐量排名前5位的因素[9J如表6所示。其因子载荷矩阵如表4所示。
武汉理工大学学报·信息与管理工程版2008年12月994 表5青岛港和广州|港重要性指标及排名商品流通渠道向居民和社会团体供应的生活消费青岛港广州港品总额,也是研究人民生活水平、社会消费品购买指标重要性排名重要性排名力和货币流通性等问题的重要指标。上述3个港 5 0 3 j 口集装箱吞吐量影响因素中,社会消费品零售总 11 4 L 额的重要性均排名前4位。 9 8 3 3 2 4 3结论 6 6 5 8 11 6 采用主成分分析法对国内3个主要港口集装 7 5 7 箱吞吐量的影响因素进行分析,提取了最主要的Xg 4 1 10 9 影响因素。通过研究发现,尽管影响不同港口集9 2 7 lO 装箱吞吐量因素的重要性排名有所不同,但最主 4 10 l1 要的影响因素却相似,包括城市GDP~货运量、第表4一0-要阳兰产业值和社会消费品零售总额等。这些影响指影晌各港口集装箱吞吐量排名前5位的因素重,缸民民标的提取将为构建港口集装箱吞吐量预测模型f上海港青岛港广州港(尤其是多元回归模型)提供重要参考。由于笔铁路货运量总货运量第三产业值者所研究的3个港口均是国内集装箱吞吐量排名2345 总货运量铁路货运量社会消费品总额靠前的大型国际港口,并处于不同的经济圈内,因第三产业恒社会消费品总额GDP 此具有广泛的代表性,但是对于中小型港口结论社会消费品总额第三产业值人口可能有所不同。此外,由于港口发展政策、口岸环GDP GDP 第二产业值境、地理区位、集疏运系统,以及周边其他港口的布局等指标不易量化,笔者没有考虑这些因素对尽管对于不同港口而言,由于其所处的地理港口集装箱吞吐量的影响,需要进一步研究。位置、发展政策和通过能力等不同,影响其集装箱吞吐量因素的重要性排名有所不同,但最主要的参考文献:影响因素却相似,包括城市GDP~货运量、第兰产业值和社会消费品总额等。[ 1 J 高琴.珠三角港口集装箱运输与区域经济互动关近年来,随着我国对外贸易实力的不断增强,系研究[J].珠江水运,2∞8(9):23 -26. 外贸货运总量不断上升,为各港口提供了丰富的[2J 王丹,杨赞.港口吞吐量影响因素分析[J].水货源,使港口货物吞吐量连年创历史新高,外贸货运工程,2∞7(7):34 -43. 物吞吐量持续增长,国际集装箱吞吐量更是高位[3J 姚宴斌,高金华.灰色模型GM(1. 2)在机场旅客吞增长。货运量作为城市经济的主要指标,对港口吐量预测中的应用[JJ.中国民航飞行学院学报,集装箱吞吐量影响显著。2006(3) :17 -21. [4J 邓超风.环渤海主要港口吞吐量预测模型研究从表6可知,3个港口集装箱吞吐量影响因[DJ.武汉:武汲理工大学图书馆,2伽.素中,城市GDP的重要性排名均进入前5位,属[5J 崔淑华,王娜,胡亚南.基于主成分分析的公路货运于比较重要的影响因素。从1978年至今,国民生量预测影响因素研究[JJ.森林工程,2仰(4):45 -48. 产总值与水路运输总周转量同步增长,国民经济[6J 何晓群.现代统计分析方法与应用[MJ.北京:中国的发展促进了各行业对运输的需求,为水路运输人民大学出版社,1998.提供了市场和发展机遇。[7J 宁涛.港口经济影响研究[DJ.大连:大连海事大在以往很多港口集装箱吞吐量的预测模学图书馆,2003.型[叫中,人们往往忽视了第二产业值这一指标对[8J 德铭.中国港口年鉴2005[MJ.上海:中国港口杂港口集装箱吞吐量的影响。从单因素角度分析第志社,2005.三产业值与港口集装箱吞吐量的相关关系时,3[9J 徐大振,朱秉秋.港口企业经营管理[MJ.北京:人民交通出版社,2003.个城市的相关系数均在以上,说明港口所在[ lOJ 邹俊善.现代港口经济学[MJ.北京:人民交通出地区的第三产业值也对港口集装箱吞吐量影响显版社,1997.著。随着我国城市化进程的加快,第三产业持续发展必然成为衍生强大运输需求的重要推动力。(下转第1003页)社会消费品零售总额主要反映的是通过各种