2009年第 5期 科技管理研究 Science and Technology Management Research 20o9No.5
文章编号:1000—7695 (2009)05—0296—03
基于支持向量机的技术成熟度预测
王丽芳 ,蒋国瑞 ,黄梯云
(1.北京工业大学经济与管理学院,北京 100124;
2.哈尔滨工业大学管理学院,黑龙江哈尔滨 150001)
摘要:技术成熟度是企业理解技术成长规律、制定技术战略的理论基础,而普遍用于技术成熟度预测的成长曲线
由于其函数本身存在的局限性即过拟合或欠拟合问题会影响预测结果的准确性。基于支持向量回归机的预测法,结
合专利分析法和文献计量法,以燃料电池技术为样本对其成熟度进行预测,并与成长曲线模型作 了对比分析,结果
表明基于支持向量回归机的预测曲线对于分析技术成长轨迹有很好的应用价值。
关键词:技术成熟度;成长曲线;支持向量;回归
中图分类号:F062.4 文献标识码:A
一 个国家或企业要得到长期稳定的发展,技术必然是一
个重要的源泉。普遍用于技术成熟度预测的发明问题求解理
论 (Theory of Invention Problem Solving,TRIZ)认为,任何产
品都是由核心技术支撑的技术系统 ,技术系统的进化要经历
婴儿期、成长期 、成熟期和衰退期四个阶段,这些阶段组成
了产品的技术生命周期,通常用 S曲线表示。某一技术在进
化过程中所处的阶段就是该技术的技术成熟度,确定其在 s
曲线上的位置,即为技术成熟度预测。
1 技术生命周期理论概述
生命周期理论来自生物学对生命体从出生及至死亡的循
环的观察与描述 ,将不同阶段所呈现的特质用来模拟人类社
会中有关产品、市场 、产业的相关动态变化。目前国内外 比
较成型的生命周期理论主要包括:产品生命周期理论、产业
生命周期理论以及技术生命周期理论。
技术生命周期是从产业生命周期分离出来的介于产品生
命周期和产业生命周期的理论 (Cainarca等,1992)。产品的
核心是技术 ,技术进步的价值只有通过产品的商品化和产业
化才能得到实现,它们彼此独立又相互重叠。Ayers(1988)
认为技术生命周期可以被定义为:从开创一个可供开发的新
领域的重大突破到下一个主要的技术壁垒的一个周期,如图
1所示。通常,技术进步遵循的 “S一曲线”主要经历4个阶
段:(1)初始阶段; (2)发展阶段; (3)成熟阶段; (4)
衰退阶段。
图 1 技术生命周期
2 主要预测方法
技术预测的方法很多,在预测技术成熟度时,主要以专
利分析法、文献计量法、S曲线及其组合预测为主。
2.1 专利分析法和文献计量法
专利预测法的核心即通过统计学方法,使专利信息转化
为具有总揽全局及预测功能的竞争情报 ,利用专利数量来判
断和研究技术的生命周期。
文献计量法是采用数学、统计学等的计量方法,研究文
献情报的分布结构、数量关系、变化规律和定量管理。文献
的数量常常可以反映新技术的成熟程度。
2.2 S曲 线预测模型
各类技术的增长特征不同,所以对不同的技术要用不同
的增长曲线加以描述。对于完整的 S型曲线通常由以下几种
模型表示 (如表 1所示)。
表 1 各 S曲线模型分析表
逻辑增长曲线 龚珀兹曲线 种类 皮尔曲线模型
模型 模型
数学 k dy,
模型 ,,+ 一 煮 (ym一 ) f=1/e 一
Y为预测变量:k K
,
Y 为常数,Y ,为预测变量;F
基本 为极限参数;a,b 是增长上限;a和
参数 为模型参数;t为 为饱和参数或极 b是拟合系数
;e
限值 时间变量 是自然对数的底
卜,一∞时,y_+0;t t 一∞时,Yt--,O; 是
一 种非对称 S 模型
— ,+∞时,y一 ; 拐点在 t=lna/b。 曲线
,拐点在 t= 性质 拐点在
t:lna/b, Y
m lna/b处 y=k/2 Yt 丁
按曲线增长速度划分技术成熟度,拐点以前为婴儿期或成 特点
长期,之后为成熟期或衰退期
2.3 S一曲线预测法局限性的简要分析
Pavitt(1986)指出,在分析技术生命周期时,必须意识到产
收稿日期:2oo8一O7—24,修回日期:2008—09一l2
基金项目:国家自然科学基金重点项目 “奥运科技产业化及基于奥运市场规则的国际发展研究”(70639002)
王丽芳等 :基于支持向量机的技术成熟度预测 297
业差别的存在,因为在核心技术的获取和发展上 ,不同产业存
在着显著不同的模式。因此,对基于 S型曲线的技术成熟度预
测,我们必须要清楚参数的极限与技术应用空间的关系,综合
判断技术的成熟度。另外,各类技术的 S型成长图式并不是由
唯一函数表达的,因技术特征不同,技术成长轨迹在总的 S型
框架下各有不同。正是这种多样性使研究者难以用一种固定
的模式概括,如能利用往后的资料,每年进行修正,才能使预测
结果更准确。近年来,随着机器学习理论研究的不断深化 ,统
计学习理论(Statistical Learning Theory,SLT)和支持向量机
(Support Vector Machine,SVM)建立了一套较好的有限训练样
本下机器学习的理论框架和通用方法,其核心思想就是学习机
器(又称学习函数)要与有限的训练样本相适应,这为技术成
熟度预测方法的研究提供了一种新的思路。
3 基于支持向量机的技术成熟度预测模型
支持向量机是 Vapnik等人于 1995年根据统计学理论首
次提出的一种新的通用学习方法,它是以统计学中的 VC维
(Vapnik—Chervonenkis Dimension)理论和结构风险最小原理
(Structural Risk Minimization Inductive Principle)为基础,能较
好地解决小样本、非线性、高维数和局部极小点等实际问题。
目前SVM在分类、函数逼近、时间序列预测等方面都有成功应
用,因其出色的学习性能而被认为是人工神经网络方法的替代
方法。 一
技术成熟度预测是解决一系列时间序列回归问题,因此,
我们采用支持向量回归机。支持 向量 回归(support vector re—
gression,SVR)问题就是假定根据某种概率分布 P(x,Y)( E
R ,Y∈R)生成的样本( l,YI),⋯,( ¨ Y1)∈(X x R),希望找
到适当的实值函数来拟合这些训练点 ,由统计学习理论确定
回归函数:
厂( )=∞· ( )+b (1)
其中妒:R 一F, ∈F,表示内积, 为 空间到F空问的
非线性映射,XER , 为权向量,∞∈F,b为偏置。
用 SVM解决回归问题是使经验风险与置信风险(模型的
复杂度)之和最小,使预测模型具有很好的函数逼近能力和泛
化能力。
,
R [ =尺 [ +A ll ll =王c( )+A ll 【I (2)
其中R⋯[ 为经验风险,ll 为置信风险,c(e )为模
型的经验损失,c()为损失函数,e =,(X )一Yi= 一 为样
本的预测值与真实值之差。
Vapnik还提出£不敏感损失函数,8用于控制回归逼近误
差宽度,控制支持向量的个数和泛化能力,其值越小则精度越
高、支持向量越多,但泛化能力减弱。常数 C>0,为惩罚系数,
它控制对超出误差 8的样本的惩罚程度。
核函数 K( , )= ( ) ( )描述了高维特征空间的内
积,可以在满足 Mercer条件的情况下选取 ,求解后得到回归函
数为:
N
)=∑(o —n )K( , 。)+b (3)
式 (3)中N为支持向量个数。支持向量回归避免了数
据的欠拟合和过拟合,因此支持向量机是一个更为通用和灵
活的解决回归问题的工具。
在选择核函数后,就可以利用专利和文献数据样本集对
SVM进行训练,进而对 目标即技术成熟度进行预测分析。
4 实例分析
燃料电池技术是 21世纪对人类生活具有最重大影响的十
大技术之一,它作为一种来源广泛、污染较小的新能源,既
是继蒸汽机、内燃机之后的第三代动力装置,又是继水力 、
火力 、核能之后的第四代发电设备。我们以燃料电池技术为
样本数据,对其技术成熟度进行预测和分析。
我们利用专利分析法和文献计量法,结合 s曲线模型、
支持向量回归机作预测及对比分析。首先将专利数据和文献
统计数据输入到 SPSS中,用 S一曲线作拟合回归预测,预测
结果如图2所示。
oobserved
— S
Oobserved
— S
图 2 基于 SPSS的专利和文献分析预测曲线
数据来源:Derwent Innovations Index(DI1)专利数据库
由图2看出,S曲线在技术发展的初期阶段能较好地拟
合样本数据,但是随着技术的不断发展,S曲线已经明显不
能准确预测技术发展的趋势;另外 ,由于 S曲线 自身存在的
极值问题,对于技术后期的发展轨迹不能很好地描绘,因此
在我们作技术成熟度预测时具有一定的局限性。
接下来,我们在Windows XP系统环境下以Matlab7.0为
工具,把专利和文献数据输入到支持向量回归机模型中,得
298 王丽芳等:基于支持向量机的技术成熟度预测
出我们的预测轨迹 (如图3所示)。
图3 基于 Matlab的专利和文献分析预测曲线
在支持向量回归问题中,惩罚因子 C决定函数的拟合优
度,C值过高会得到更多的支持向量,图中红色圆圈即代表
支持向量;但c值过高则回归的性能会下降,因此要选择一
个合适的惩罚因子有助于回归分析。不敏感参数 s解释回归
曲线的精确度.e越大则回归曲线的泛化性能会越低。此例
样本训练取核函数为高斯核函数 (RBF),损失函数为 8不敏
感损失函数,结果得出专利数据分析中 C为 10 000,£为50,
支持向量 (NSV)为 27;文献数据分析中 C为 10 000,£为
10,NSV为24。由图 3看出,用支持向量回归机通过训练样
本得出的预测曲线明显优于 S一曲线,我们可以清晰地分辨
出技术成长的阶段性,提高了预测精细度。
5 结论
根据技术预测曲线结果分析,燃料电池技术已经度过了
萌芽期,正处于其技术生命周期的成长阶段。国内外数据显
示,现在世界主要国家都已经认识到燃料电池技术对于国家
经济发展和国际竞争力提高的重要作用,各国政府和许多大
型跨国公司竞相把燃料电池研发当作投资的重点,国际竞争
日趋激烈,~些国家对基于燃料电池技术的产品已实验验证
成功,并且有计划地准备进入生产化和商品化阶段,与我们
的预测结果相吻合。可见,技术成熟度是制定技术在市场上
不同时期营销战略及管理策略的基础,根据生命周期不同阶
段采取有效的技术管理策略至关重要。
参考文献:
[1]赵瑾璐,潘志恒.国际技术转移与我国技术进步的实证研究
[J].北京理工大学学报 (社会科学版),2007(1):6l一65.
[2]刘玉琴,朱东华,吕琳.基于文本挖掘技术的产品技术成熟度预
测 [J].计算机集成制造系统,2008(3):506—510.
[3]李保红.基于标准生命周期的信息通信技术标准化策略研究
[D].中国博士学位论文全文数据库:北京邮电大学博士论文,
2006:44—46.
[4]温桂兵.技术战略与企业竞争优势研究 [D].中国优秀硕士学
位论文全文数据库:天津大学硕士论文,2005:31—32.
[5]吴新银.专利地图在企业专利战略中的应用研究 [D].武汉:
华中科技大学硕士论文,2004:7—9.
[6]REINHARD HAUPT,MARTIN KLOYER,MARCUS LANGE.Pa-
tent indicators for the technology life cycle development[J].Re—
search Policy,2007,36(3):387—398.
[7]TUGRUL U DAIM,GUILLERMO RUEDA,HILARY MARTIN,
PISEK GERDSRI.Forecasting eme呼ng technologies:USe of biblio-
metrics and patent analysis[J】.Technological Forecasting and So-
cial Change,2006,73 (8):981—1012.
[8]DANNER,TRAVIS WILLIAM.A formulation of multidimensional
growth models for the assessment and forecast of technology attributes
[D].School of Aerospace Engineering C.~orgia Institute ofTechnology
for Doctor Degree,2006:15—17.
[9]张换高.基于专利分析的产品技术成熟度预测技术及其软件开发
[D].中国优秀硕士学位论文全文数据库:河北工业大学硕士论
文.2003:29—31.
[10]夏安邦.定量预测引论 [M].南京:东南大学出版社,2001:
l39—140.
[11]THEODORE MODIS.Strengths and weaknesses of s—curves[J].
Technological Forecasting and Social Change,2007,74(6):866
— 872.
[12]杜熊禹.用于数据挖掘的支持向量机算法研究 [D].中国优秀
硕士学位论文全文数据库:电子科技大学硕士论文,2007:12
一 l3.
[13]杨志民,刘广利.不确定性支持向量机原理及应用 [M].北
京:科学出版社,2007:69—75.
作者简介:王丽芳 (1980一),女 ,汉族,河北邯郸人,在读硕士,
主要研究方向为管理科学与工程专业信息系统与信息管理。蒋国瑞
(1954一),男,河北蠡县人,教授,研究方向为管理信息系统、信
息管理 、项目管理。黄梯云 (1932一).男,汉族,安徽休宁人,教
授,博导,研究方向为管理信息系统、决策支持系统。
(本文责编:陈 夏)