0
CSMAR 2000
使用指南
中国股票市场研究数据库
使用指南
CHINA STOCK MARKET & ACCOUNTING RESEARCH
DATABASE GUIDE
香港理工大学中国会计与金融研究中心
深圳市国泰安信息技术有限公司
2000 年
1
中国股票市场研究(CSMAR)数据库
总顾问:陈工孟 博士
香港理工大学中国会计与金融研究中心主任
首席技术顾问:David K. Barclay
Chief Operating Officer
Center for Research in Security Prices
Graduate School of Business
The University of Chicago
0
目 录
用户许可协议 ................................................................................................................0
前 言 ........................................................................................................................0
第一章 CSMAR 数据库简介 ....................................................................................0
第一节 如何使用本说明书 .................................................................................0
1、针对的用户 ................................................................................................0
2、目前提供的产品 ........................................................................................0
3、本说明书的结构 ........................................................................................0
第二节 CSMAR 数据库特点和功能 ..................................................................0
1、特点 ............................................................................................................0
2、特色 ............................................................................................................0
3、功能 ............................................................................................................0
4、2000 年版数据区间 ...................................................................................0
第三节 安装配置要求 .........................................................................................0
第二章 数据说明 ........................................................................................................0
第一节 数据库基本文件介绍 .............................................................................0
第二节 回报率计算方法 .....................................................................................0
1、日个股回报率的计算 ................................................................................0
2、日收盘价的可比价格的计算 ....................................................................0
3、月个股回报率的计算 ................................................................................0
4、市场回报率的计算 ....................................................................................0
5、指数回报率的计算 ....................................................................................0
第三节 数据项说明 .............................................................................................0
第三章 数据调用 ........................................................................................................0
第一节 调用命令和程序 .....................................................................................0
1、简介 ............................................................................................................0
2、调用方法 ....................................................................................................0
第二节 调用实例 .................................................................................................0
附录:数据结构及说明表 1--表 12 ...........................................................................27
1
用户许可协议
版权与所有权声明
CSMAR(China Stock Market & Accounting Research )数据库系统是由香港理工大学中国会计
与金融研究中心(以下简称“研究中心”)设计,深圳市国泰安信息技术有限公司(以下简称“国泰安
公司”)开发。香港理工大学中国会计与金融研究中心主任陈工孟博士担任 CSMAR 数据库系统的总
顾问,芝加哥大学 CRSP(Center for Research in Security Prices)的首席营运官(Chief Operating
Officer)David K. Barclay 先生担任 CSMAR 数据库系统的首席技术顾问。CSMAR 数据库系统及其
文档的所有权归属于香港理工大学中国会计与金融研究中心和深圳市国泰安信息技术有限公司,并
受中华人民共和国国家《著作权法》、《商标法》和国际协约条款的保护。研究中心和国泰安公司共
同授权国泰安公司负责 CSMAR 数据库系统的更新、维护和销售等活动。用户不得从本系统中删去
版权声明,要保证为本系统的拷贝(全部或部分)复制版权声明,并同意制止以任何形式非法拷贝
本系统及文档。未经授权擅自复制或散布本数据库的部分或全部内容,将会面对民事起诉。
“CSMAR 数据库”的名称已受到注册商标和其它形式的所有权的保护。
用户许可协议声明
本协议一方为本数据库的个人或机构使用者,另一方为深圳市国泰安信息技术有限公司。用户
使用本数据库之前,须首先认可本许可协议,如持有异议,请不要使用,并于 30 日内,携带未开
封的软件和书面声明到本公司办理有关事宜。
如果用户对本协议条款有任何疑问,请按照如下方式与本公司联系:
广东省深圳市国泰安信息技术有限公司
地址:深圳市北环大道 7003 中审大厦 12 楼
邮编:518034
电话:0755-3940081
传真:0755-3940070
电子邮件:gta@
2
许可协议条款
1、 用户必须承认本系统提供的数据和资料花费了研究中心和国泰安公司大量的人力、
物力和财力。
2、 本系统仅给用户提供唯一使用许可权。用户必须承诺不把本系统提供的全部或部分
资料和数据以任何形式转移、出售和公开给任何第三者。
3、 用户必须同意并保证,采取必要和合适的措施保护本系统提供的资料和数据的版权
和所有权。
4、 用户必须通知其所有相关使用者有关本系统的版权声明和本许可协议,并要求所有
相关使用者都必须遵循本许可协议的一切条款。
5、 用户必须同意在本许可协议终止前,一直承担本协议所要求的一切责任和义务。
售后保证
本公司保证在正常使用的情况下,本系统软件载体无材料或工艺上的缺陷。自售出之日起九十
天内,经验证确有缺陷时,本公司负责退换数据载体,退换的载体享受原担保剩余时间或三十天的
担保。因事故、不依操作规程或错误应用导致的载体损害,本公司概不负责。
许可权利的终止
用户若违反本协议的任一条款或条件,深圳市国泰安信息技术有限公司可以随时终
止其使用许可。一旦许可权利被终止,用户必须立即销毁本系统及文档的所有拷贝,或
将其归还本公司。
适用法律
《知识产权保护条例》、《著作权法》、《商标法》、《专利法》等。
免责条款
深圳市国泰安信息技术有限公司尽力为用户提供可信的、准确的资料和数据,但无
法完全保证其百分之百的准确和完整。因此,无论在什么情况下,由使用本系统所产生
的任何形式的间接或直接的、特别或意外的、必然或偶然的损失和破坏,本公司概不负
责。在上述情况发生时,即使本公司事先被告知此类事情有可能发生,本公司亦不对由
此导致的任何后果承担责任。
3
本公司将尽快更新资料数据,但不承担由于使用数据资料延误造成的损失或责任。
如果用户发现数据文件中的错误,请立即通知本公司,本公司将尽最大的努力在下一个
版本中更正。
4
前 言
做研究难,对中国的证券市场进行研究更难。其中难点之一就是数据的不完整、不准确,
尤其是数据的不规范。美国股票市场内在机理及发展规律能得到世界各国学者非常全面、细致、彻
底的研究,且其研究成果大大推动了金融理论的发展和美国股票市场的规范,这在很大程度上得益
于美国股票市场有一个统一的、规范的市场交易数据库 CRSP 和公司财务数据库 Compustat。研究
人员可以利用 Fortran、C、Pascal 等语言直接调用 CRSP 和 Compustat 数据库中的数据,对金融理
论或模型进行验证。研究人员还可以用多种统计软件包,如 SAS,SPSS 等直接运用 CRSP 和
Compustat 数据库进行实证研究,所以统一与规范的 CRSP 和 Compustat 数据库大大提高了美国股票
市场的研究效率。
股票市场价格数据用于研究时,有一个很大的麻烦,就是价格或回报率的可比性问题。
比如说,某公司股票 1992 年初的发行价为每股 10 元,到 1998 年底的最后一个交易日的交易价为
每股 12 元,其间经历了 7 年。如果仅仅根据股票价格原始数据进行比较,这 7 年的回报率仅为
20%,但实际上这家公司在 1993 年拆细(1 拆 2),1994 年送红股(每 10 股送 5 股),1995 年进行
配股(每 10 股配 3 股),而每年又有红利。因而这家公司的实际回报率远远高于 20%,1998 年底的
实际可比价格也远远高于每股 12 元。所以在对股票市场进行研究时,必须对所有的日交易价格或
日回报率根据前后可比性原理进行调整,而这需要巨大的工作量。美国芝加哥大学开发的 CRSP 数
据库对美国所有上市公司几十年来每天的交易价格进行了调整,这为研究人员带来了很大的方便。
同时统一与规范的数据库也方便研究人员对不同的研究结论进行比较和讨论。
国内的学者一直没有中国的 CRSP 和 Compustat,使得有关中国股票市场的研究,尤其是
实证研究严重滞后,且研究效率极低。比如一篇对中国股市作实证研究的博士论文或研究项目,研
究人员一般要花数个月的时间对大量原始的股票交易数据与财务数据进行整理,找出所需要的项目,
这样往往涉及大量的手工收集及手工数据录入工作,而且得到的数据常常缺乏系统性、准确性与可
信性。此外相当多的研究人员不了解如何对股票价格的前后可比性进行调整。所以,中国股票市场
由于缺乏统一与规范的数据库,不仅大大降低了研究效率,增加了研究成本(研究人员的时间是最
大的成本),而且也降低了研究结论的可比性和可信性。
1996 年以来,香港理工大学会计学系陈工孟博士一直希望开发一个类似于 CRSP 及 Compustat
的中国股票市场研究数据库,以推动中国证券市场实证研究的发展。这项工作在 1996 年、1997 年
有了一定的进展,但由于开发成本较大,风险较高,人手不够等内外原因,而停顿下来。
2000 年初,香港理工大学中国会计与金融研究中心成立,我们又重新推动 CSMAR
数据库的开发,并且得到了深圳市国泰安信息技术有限公司的大力支持与合作。经过我
们的不懈努力,已于 2000 年 9 月成功开发 CSMAR 数据库的第一部分:市场交易数据
库,并计划于今年年底完成 CSMAR 财务数据库的开发。CSMAR 数据库的开发严格按
照国际标准数据库(CRSP 和 Compustat)的调整技术计算个股收益率,并计算市场日
回报率和月回报率。尤其是对历史的原始数据,我们进行了多种方法的严格查证和确认,
以保证原始数据的准确性,并以 Foxpro、Excel、TXT 等格式提供给用户使用,同时可
供 SAS 和 SPSS 等统计软件直接调用 。
CSMAR 数据库的开发成功将从根本上解决高等院校的会计与金融学者、中国
金融市场的研究机构和个人、金融机构、证券公司、投资银行的研究部门等所普遍面临
的中国股票市场数据不完整、不准确问题,从而建立起深入、全面、有效的研究中国金
融市场的资料与数据基础。我们希望中国股票市场研究(CSMAR)数据库的推出,将
对我国股票市场的实证研究有一个快速的、高质量的提高,同时提高中国金融市场研究
的深度和广度,促进中国金融市场的进一步发展和规范化。
5
香港理工大学中国会计与金融研究中心
深圳市国泰安信息技术公司
二零零零年十月一日
6
第一章 CSMAR数据库简介
第一节 如何使用本说明书
本說明書是<<中國股票市場研究(CSMAR)數據庫(2000 版)---市場交易數據庫>>的使用
說明。
CSMAR 数据库系统是一个包含中国股票市场交易数据库和上市公司财务数据库的大型数
据库资讯系统。CSMAR 数据库严格按照国际标准数据库(CRSP 和 Compustat)的调整技术计算个
股收益率、计算市场日回报率和月回报率,并以 Foxpro、Excel、SPSS 和 SAS 等数据库格式直接提
供给用户使用。本系统的推出将从根本上解决国内外会计与金融研究人员所普遍面临的中国上市公
司资料数据不完善、不准确的问题,从而建立起深入、全面、有效地研究中国金融市场的资料和数
据基础。这必将有利于提高中国金融市场研究的深度和广度,有利于中国金融市场的进一步发展和
规范化。
1、针对的用户
本公司所提供的资料和数据主要用于学术研究目的,针对的用户是高等院校的会计
与金融学者,中国金融市场研究机构和个人,金融机构、证券公司、投资银行的研究部
门等。
2、目前提供的产品
CSMAR 数据库包括两部分:市场交易数据库和上市公司财务数据库。市场交易数
据库已经过严格、系统的校正,目前可提供给用户使用。上市公司财务数据库,由于上
市公司公布的会计报表的不规范和不统一,为保证数据的准确、系统和完整,我们现正
进行大量的校正工作,预计于 2000 年 12 月底可提供给用户使用。
3、本说明书的结构
本说明书仅限于市场交易数据库部分,上市公司财务数据库的说明书将于不久和财
务数据库一并提供。
本说明书由五个部分组成:
用户许可协议和前言:介绍有关版权及所有权的声明,用户许可协议声明、许可协
议条款、售后保证、许可权利的终止、适用法律、免责条款等。
第一章:数据库简介。包括本数据库针对的用户,提供的产品、说明书的结构、特
点与特色、功能和安装说明等。
第二章:数据说明。包括数据文件说明,数据结构框架与说明及交易数据的调整方
法、回报率的计算公式等。
7
第三章:数据调用。给出本数据库的数据调用方法和实例等。
附录:给出 12 种类型数据文件的结构框架、字段及说明。
第二节 CSMAR数据库特点和功能
1、特点
完整性
CSMAR 数据库记录了自上海证券交易所和深圳证券交易所成立以来中国上市
公司的资料、全部交易数据和财务数据,并且实时跟踪调整和更新以保证其高度的连续
性和完整性。
证券交易所 数据库最早记录时间
上海 1990 年 12 月 19 日
深圳 1991 年 07 月 03 日
准确性
CSMAR 数据库主要是以学术研究为目的而设计开发的,具有高度的准确性。数据
来源于由上海证券交易所和深圳证券交易所指定发布的证券时报、上海证券报、中国证
券报等权威机构的一手资料数据。为保证数据的准确性,我们还应用大量的其他来源数
据对本数据库的数据记录逐条进行了细致的校订工作,基本避免了错漏情况的发生。尤
其是历史的原始数据,我们更是反复地以多种方法校验,从而又更大地提高了其准确性。
持续性和及时性
CSMAR 数据库更新的持续性和及时性。CSMAR 数据库将根据需要每年更新一次
或两次。
规范性和可比性
CSMAR 数据库借鉴了 CRSP(Center for Research in Security Prices)和 PACAP
(Pacific-Basin Capital Markets)等国际知名数据库的成功经验,采用国际上通行的数据
检验和调整方法以确保数据实际应用的可靠性,并力求与国际接轨。在数据项目上,
CSMAR 不仅提供经过调整的个股回报率,还提供了市场回报率和综合市场回报率。
本数据库的交易数据已经调整了其由于时间间隔(休息日、节假日)和上市公司原
因(配股、送股、分红等)引起的股价变化,保证用户使用本数据库作数据分析的可比
性和一致性。
便捷性
8
本数据库具有合理、清晰的分类,能随意根据上市公司的某项或多项财务指
标,或根据某项或多项交易数据的数值或数值区间,或根据某项或多项财务指标和某项
或多项交易数据的组合,方便地查找出符合条件的一系列股票,并能给出这一系列股票
的交易数据和财务指标。
2、特色
CSMAR 数据库与目前我们所见的同类的中国股票市场数据库相比,有如下特别之
处:
(1)借鉴 CRSP 和 Compustat 等国际知名数据库的成功经验,把个股回报率、市
场回报率和综合市场回报率等数据项目直接提供给用户使用。提供市场回报
率和综合市场回报率(由市场或综合市场上的所有股票的回报率加权平均得
到,包括等权平均、流通市值加权平均和总市值加权平均三种加权方法),
避免了目前对中国股票市场的市场组合回报率用综合指数或其他指数替代的
无奈之举。
(2)提供各只股票详细的股本变动情况。由于中国股票市场的发展时间较短,很
多地方还不规范,股票的股本变动情况非常复杂。我们提供了详细的股本变
动类型,包括新股上市、增发新股、职工股上市、转配股上市、配股除权、
配股上市、配股除权并上市、送股除权、送股上市、送股除权并上市、拆细
除权和拆细上市等十多种股本变动类型。对于每次的股本变动,我们都详细
提供总股数、国家股股数、境内发起人法人股股数、境外发起人法人股股数、
募集法人股股数、内部职工股股数、基金配售股数、转配股股数、优先股股
数、A 股股数、B 股股数、H 股股数、流通配送股尚未流通股数、高级管理
人员持股数等数据。
(3)提供收盘价的可比价格。由于送股、配股、拆细等原因引起的股本变动,交
易所公布的收盘价也经过调整,从时间上看,交易所公布的收盘价就不具有
可比性。为了解决这一问题,CSMAR 数据库提供了以上市首日的收盘价为
基准的各个交易日的收盘价的可比价格。
(4)结构合理查询方便。CSMAR 数据库系统能够方便快捷地检索和获取
满足一定条件的股票交易数据和财务指标,并能灵活地以 Foxpro、Excel、TXT
等格式输出,可供 SAS、SPSS 等统计软件和 Fortran、C、Pascal 等高级语言
直接调用。
3、功能
本公司提供两种服务方式,可针对不同用户提供相应的服务:
(1) 根据用户特定的数据需求,提供用户所需求的部分数据。这种服务方式的优
点在于用户不需要熟悉整个数据库的数据结构及数据调用方法。
(2) 提供整个数据库文件。用户可随时根据自己的需要调用 CSMAR 数据库中的
数据。
9
CSMAR 数据库提供的数据格式有文本格式和 DBF 格式两种,可直接供 SAS、SPSS 等通
用统计软件调用。
4、2000 年版数据区间
股票市场 数据区间
上海 A 股 1990 年 12 月 19 日~1999 年 12 月 30 日
上海 B 股 1992 年 02 月 21 日~1999 年 12 月 30 日
深圳 A 股 1991 年 07 月 03 日~1999 年 12 月 30 日
深圳 B 股 1992 年 02 月 28 日~1999 年 12 月 30 日
第三节 安装配置要求
硬件配置:
建议采用 Pentium / 266 以上 CPU,64M 内存,800*600 以上分辨率,256 色以上显示模式,2G
以上硬盘空间。
软件配置:
中文版 WINDOWS 95/98,或 NT;
VISUAL FOXPRO 。
10
第二章 数据说明
第一节 数据库基本文件介绍
市场交易数据库目前包括的数据文件分为 12 种类型:公司文件、汇率文件、日历文件、分配
文件、日个股回报率文件、日市场回报率文件、月个股回报率文件、月市场回报率文件、综合日市
场回报率文件、综合月市场回报率文件、指数文件和股本变动文件,我们在此简要说明,见附表,
详细的文件分类和各个文件的数据结构及处理说明参见附录。
( 1 ) 公司文件
记录上市公司的一些基本情况。数据项包括公司的国家代码、证券代码、证券简称、公司
代码、公司名称、行业代码、行业名称、公司成立日期、上市日期、数据库中最早交易数据记录的
日期、数据库中交易数据的计量货币、股票发行溢价、招股价格、招股价格的计量货币、招股数量、
股票面值的计量货币、招股日期、股票面值、区域码、公司活动情况、参考代码、情况变动日、备
注。目前共有 4 个公司文件,分别为上海 A 股公司文件、上海 B 股公司文件、深圳 A 股公司文件
和深圳 B 股公司文件。
( 2 ) 汇率文件
记录的是自 1990 年 12 月 19 日至 1999 年 12 月 31 日的人民币、港币和美元之间的汇率值。
数据项包括国家代码、汇率日期、汇率日星期、人民币对美元汇率、港币对美元汇率、港币对人民
币汇率。目前有 1 个汇率文件。
( 3 ) 日历文件
记录上海证券交易所和深圳证券交易所自成立以来至 1999 年 12 月 30 日的每天开市日历
记录(开市或休市)。数据项包括国家代码、日期、星期、开市情况。目前共有 4 个日历文件,分
别为上海 A 股日历文件、上海 B 股日历文件、深圳 A 股日历文件和深圳 B 股日历文件。
( 4 ) 分配文件
记录上市公司自 1990 年至 1999 年的分配情况,包括现金红利,送红股、配股、拆细等,
数据项包括国家代码、证券代码、分配类型、公告日期、除权(息)日期、支付日期、比率、配股
价格。目前共有 4 个文件,分别为上海 A 股分配文件、上海 B 股分配文件、深圳 A 股分配文件和
深圳 B 股分配文件。
( 5 ) 日个股回报率文件*
记录上市公司的每日交易数据以及根据交易数据和除权(息)情况计算得出的日个股回报
率。数据项包括国家代码、证券代码、交易日期、大类码、星期、行业代码、日开盘价、日最高价、
日最低价、日收盘价、日交易股数、日交易金额、总股数、国家股股数、法人股股数、A 股股数、B
股股数、H 股股数、转配股股数、基金配售股数、流通配送股尚未流通股数、内部职工股股数、高
级管理人员持股数、优先股股数、流通市值、总市值、考虑现金红利再投资的日个股回报率、不考
虑现金红利再投资的日个股回报率、考虑现金红利再投资的收盘价的可比价格、不考虑现金红利再
投资的收盘价的可比价格。目前共有 4 个文件,分别为上海 A 股日个股回报率文件、上海 B 股日个
股回报率文件、深圳 A 股日个股回报率文件和深圳 B 股日个股回报率文件。
11
( 6 ) 日市场回报率文件*
记录上海 A 股、上海 B 股、深圳 A 股和深圳 B 股四个市场的 6 种不同计算方法得出的日
市场回报率。数据项包括国家代码、交易日期、交易日星期、日交易股数、日交易金额、考虑现金
红利再投资的日市场回报率(等权平均法)、不考虑现金红利再投资的日市场回报率(等权平均
法)、考虑现金红利再投资的日市场回报率(流通市值加权平均法)、不考虑现金红利再投资的日市
场回报率(流通市值加权平均法)、考虑现金红利再投资的日市场回报率(总市值加权平均法)、不
考虑现金红利再投资的日市场回报率(总市值加权平均法)、计算日市场回报率的有效公司数量。
目前共有 4 个文件,分别为上海 A 股日市场回报率文件、上海 B 股日市场回报率文件、深圳 A 股
日市场回报率文件和深圳 B 股日市场回报率文件。
( 7 ) 月个股回报率文件*
记录上市公司的每月交易数据以及根据交易数据计算得出的月个股回报率。数据项包括国
家代码、证券代码、交易月份、区域码、行业代码、月开盘价、开盘价日期、月收盘价、收盘价日
期、月交易股数、月交易金额、总股数、国家股股数、法人股股数、A 股股数、B 股股数、H 股股
数、转配股股数、内部职工股股数、基金配售股数、流通配送股尚未流通股数、高级管理人员持股
数、优先股股数、流通市值、总市值、月交易天数、考虑现金红利再投资的月个股回报率、不考虑
现金红利再投资的月个股回报率。目前共有 4 个文件,分别为上海 A 股月个股回报率文件、上海 B
股月个股回报率文件、深圳 A 股月个股回报率文件和深圳 B 股月个股回报率文件。
( 8 ) 月市场回报率文件*
记录上海 A 股、上海 B 股、深圳 A 股和深圳 B 股四个市场的 6 种不同方法计算得出的日
市场回报率。数据项包括国家代码、交易月份、月交易天数、月交易股数、月交易金额、考虑现金
红利再投资的月市场回报率(等权平均法)、不考虑现金红利再投资的月市场回报率(等权平均
法)、考虑现金红利再投资的月市场回报率(流通市值加权平均法)、不考虑现金红利再投资的月市
场回报率(流通市值加权平均法)、考虑现金红利再投资的月市场回报率(总市值加权平均法)、不
考虑现金红利再投资的月市场回报率(总市值加权平均法)、计算月市场回报率的有效公司数量、
流通股本市场资本总值、总股本市场资本总值。目前共有 4 个文件,分别为上海 A 股月市场回报率
文件、上海 B 股月市场回报率文件、深圳 A 股月市场回报率文件和深圳 B 股月市场回报率文件。
( 9 ) 综合日市场回报率文件
记录上海证券交易所和深圳证券交易所全部 A 股、全部 B 股和全部 A、B 股的 6 种不同
计算方法计算得出的综合日市场回报率。综合市场包括 A 股综合市场(上海 A 股市场和深圳 A 股
市场的综合)、B 股综合市场(上海 B 股和深圳 B 股市场的综合)和 A、B 股综合市场(上海 A 股、
B 股和深圳 A 股、B 股市场的综合)。数据项包括国家代码、交易日期、交易日星期、日交易股数、
日交易金额、考虑现金红利再投资的综合日市场回报率(等权平均法)、不考虑现金红利再投资的
综合日市场回报率(等权平均法)、考虑现金红利再投资的综合日市场回报率(流通市值加权平均
法)、不考虑现金红利再投资的综合日市场回报率(流通市值加权平均法)、考虑现金红利再投资的
综合日市场回报率(总市值加权平均法)、不考虑现金红利再投资的综合日市场回报率(总市值加
权平均法)、计算综合日市场回报率的有效公司数量。目前共有 3 个文件,分别为 A 股综合日市场
回报率文件、B 股综合日市场回报率文件和 A、B 股综合日市场回报率文件。
( 10 ) 综合月市场回报率文件
记录上海证券交易所和深圳证券交易所全部 A 股、全部 B 股和全部 A、B 股的 6 种不同
计算方法得出的综合月市场回报率。数据项包括国家代码、交易月份、考虑现金红利再投资的综合
月市场回报率(等权平均法)、不考虑现金红利再投资的综合月市场回报率(等权平均法)、考虑现
金红利再投资的综合月市场回报率(流通市值加权平均法)、不考虑现金红利再投资的综合月市场
回报率(流通市值加权平均法)、考虑现金红利再投资的综合月市场回报率(总市值加权平均法)、
12
不考虑现金红利再投资的综合月市场回报率(总市值加权平均法)、计算月市场回报率的有效公司
数量、流通股本市场资本总值、总股本市场资本总值。目前共有 3 个文件,分别为 A 股综合月市场
回报率文件、B 股综合月市场回报率文件和 A、B 股综合月市场回报率文件。
( 11 ) 指数文件
记录上海证券交易所和深圳证券交易所 8 种指数(上证综合指数、上证 A 股综合指数、上
证 B 股综合指数、上证 30 指数、深证综合指数、深证 A 股综合指数、深证 B 股综合指数、深证成
分指数)及其回报率。数据项包括指数代码、交易日期、交易日星期、开盘指数、收盘指数、最高
指数、最低指数、指数回报率。目前有 1 个指数文件。
( 12 ) 股本变动文件
记录所有上市公司的股本变动情况,包括新股上市、增发新股、职工股上市、转配股上市、
配股除权、配股上市、送股除权、送股上市、拆细除权和拆细上市等引起的股本结构变动。数据项
包括证券代码、股本变动日期、股本变动类型、总股数、国家股股数、境内发起人法人股股数、境
外发起人法人股股数、募集法人股股数、内部职工股股数、基金配售股数、转配股股数、优先股股
数、A 股股数、B 股股数、H 股股数、流通配送股尚未流通股数、高级管理人员持股数。目前有 1
个股本变动文件。
13
附表 数据库文件一览表
文件类型 文件名 数据表名 文件索引号
上海 A 股公司文件 0010001
上海 B 股公司文件 0010002
深圳 A 股公司文件 0010003
公司文件
(文件个数:4)
深圳 B 股公司文件 0010004
汇率文件
(文件个数:1)
汇率文件 0020001
上海 A 股日历文件 0030001
上海 B 股日历文件 0030002
深圳 A 股日历文件 0030003
日历文件
(文件个数:4)
深圳 B 股日历文件 0030004
上海 A 股分配文件 0040001
上海 B 股分配文件 0040002
深圳 A 股分配文件 0040003
分配文件
(文件个数:4)
深圳 B 股分配文件 0040004
上海 A 股日回报率 0050001
上海 B 股日回报率 0050002
深圳 A 股日回报率 0050003
日个股回报率文件
(文件个数:4)
深圳 B 股日回报率 0050004
上海 A 股日市场回报率 0060001
上海 B 股日市场回报率 0060002
深圳 A 股日市场回报率 0060003
日市场回报率文件
深圳 B 股日市场回报率 0060004
上海 A 股月个股回报率 0070001
上海 B 股月个股回报率 0070002
深圳 A 股月个股回报率 0070003
月个股回报率文件
(文件个数:4)
深圳 B 股月个股回报率 0070004
上海 A 股月市场回报率 0080001
上海 B 股月市场回报率 0080002
深圳 A 股月市场回报率 0080003
月市场回报率文件
(文件个数:4)
深圳 B 股月市场回报率 0080004
A 股综合日市场回报率 0090001
B 股综合日市场回报率 0090002
综合日市场回报率
文件(文件个数:3)
A、B 股综合日市场回报率 0090003
A 股综合月市场回报率 0100001
B 股综合月市场回报率 0100002
综合月市场回报率
文件(文件个数:3)
A、B 股综合月市场回报率 0100003
指数文件
(文件个数:1)
(文件个数:1)
指数文件 0110001
股本变动文件
(文件个数:1)
股本变动文件 0120001
14
第二节 回报率计算方法
1、日个股回报率的计算
日个股回报率有两种计算方法,一种为考虑现金红利的日个股回报率,另一种为不考虑现
金红利的日个股回报率。考虑现金红利的日个股回报率 的计算由下面的公式给出:
其中: :股票 n 在 t 日的收盘价;
:股票 n 在 t-1 日的收盘价;
:股票 n 在 t 日为除权日时的每股现金分红;
:股票 n 在 t 日为除权日时的每股红股数;
:股票 n 在 t 日为除权日时的每股配股数;
:股票 n 在 t 日为除权日时的每股配股价;
:股票 n 在 t 日为除权日时的每股拆细数。
不考虑现金红利的日个股回报率的计算公式为:
变量定义如前。
2、日收盘价的可比价格的计算
由于送股、配股、拆细等原因引起的股本变动,交易所公布的收盘价也经过调整,从时间
上看,交易所公布的收盘价就不具有可比性。为了解决这一问题,CSMAR 提供日收盘价的可比价
格,包括考虑现金红利再投资的日收盘价的可比价格和不考虑现金红利再投资的日收盘价的可比价
格两种情况。日收盘价的可比价格的计算,以上市首日的收盘价为基准,从上市首日的收盘价进行
递推。下式为考虑现金红利再投资的日收盘价的可比价格的计算公式:
或者:
其中: :股票 n 在上市首日的收盘价;
:股票 n 在 t 日的考虑现金红利再投资的日收盘价的可比价格;
:股票 n 在 t-1 日的考虑现金红利再投资的日收盘价的可
比价
tnr ,
1
**
*)1(
,,,1,
,,,,,
,
tntntntn
tntntntntn
tn KSCP
DCSFP
r
tnP ,
1, tnP
tnD ,
tnF ,
tnS ,
tnK ,
tnC ,
1
**
*)1(
,,,1,
,,,,
,
tntntntn
tntntntn
tn KSCP
CSFP
r
)1(* ,1,, tntntn rPP
t
s
snntn rPP
2
,1,, )1(*
1,nP
tnP ,
1, tnP
15
格;
表示股票 n 在 t 日的考虑现金红利再投资的日个股回报率;
当计算公式中的日个股回报率以不考虑现金红利再投资的日个股回报率计算时,得出的可
比价格便为不考虑现金红利再投资的日收盘价的可比价格。
3、月个股回报率的计算
月个股回报率也分两种:考虑现金红利的月个股回报率,另一种为不考虑现金红利的月个
股回报率。下式为考虑现金红利的月个股回报率的计算公式:
其中: :股票 n 在 t 月的最后一个交易日的考虑现金红利再投资的日收盘价
的可比价格;
:股票 n 在 t-1 月的最后一个交易日的考虑现金红利再投资的日收盘
价的可比价格;
当 、 分别为 t 月和 t-1 月的最后一个交易日的不考虑现金红利再投资的日收盘价
的可比价格时,得出的便为不考虑现金红利再投资的月个股回报率。
4、市场回报率的计算
市场回报率指的是整个市场所有股票的加权平均回报率,其权重的计算方法有:等权平均
法、流通市值加权平均法和总市值加权平均法。
如前所述,个股回报率的计算有考虑现金红利和不考虑现金红利两种方法,所以市场回报
率的计算总共有六种方法。(1) 考虑现金红利的等权平均市场回报率;(2) 不考虑现金红利的等权平
均市场回报率;(3) 考虑现金红利的流通市值加权平均市场回报率;(4) 不考虑现金红利的流通市值
加权平均市场回报率;(5) 考虑现金红利的总市值加权平均市场回报率;(6) 不考虑现金红利的总市
值加权平均市场回报率。
设 表示股票 n 在 t 日(或月)的个股回报率, 为股票 n 在时段 t 的权重,则市场回
报率 由下式计算得到:
( 1 ) 当每一种股票的权重都等于 1,即 =1,那么:
① 若 表示的是考虑现金红利的个股回报率,则 为考虑现金红利的等权平均市场回
报率。
① 若 表示的是不考虑现金红利的个股回报率,则 为不考虑现金红利的等权平均市
场回报率。
tnr ,
1
1,
,
,
tn
tn
tn P
P
r
tnP ,
1, tnP
tnP , 1, tnP
tnr , tnw ,
tnR ,
n
tn
n
tntn
tn w
rw
R
,
,,
,
tnw ,
tnr , tnR ,
tnr , tnR ,
16
( 2 ) 当 表示股票 n 在 t-1 日(或月)的流通市值时,则 为流通市值加权平
均市场回报率。
其中: = ,
:股票 n 在 t-1 日(或月)的流通股数
:股票 n 在 t-1 日(或月)的收盘价
①若 表示的是考虑现金红利的个股回报率,则 为考虑现金红利的流通市值加权平
均市场回报率。
①若 表示的是不考虑现金红利的个股回报率,则 为不考虑现金红利的流通市值加
权平均市场回报率。
( 3 ) 当 表示股票 n 在 t-1 日(或月)的总市值时,则 为总市值加权平均市
场回报率。
其中: = ,
:股票 n 在 t-1 日(或月)的总股本数
:股票 n 在 t-1 日(或月)的收盘价
①若 表示的是考虑现金红利的个股回报率,则 为考虑现金红利的总市值加权平均
市场回报率。
①若 表示的是不考虑现金红利的个股回报率,则 为不考虑现金红利的总市值加权
平均市场回报率。
5、指数回报率的计算
其中: : 指数 n 在 t 日的回报率
: 指数 n 在 t 日的收盘指数
: 指数 n 在 t-1 日的收盘指数
第三节 数据项说明
一、 字段的命名规则:
( 1 ) 字段长度不超过 8 位。
(3) 在不同的文件中相同变量字段名一致。如“证券代码” 字段名为
“STKCD”。
tnw , tnR ,
tnw , 1,1, * tntn PV
1, tnV
1, tnP
tnr , tnR ,
tnr , tnR ,
tnw , tnR ,
tnw , 1,1, * tntn PV
1, tnV
1, tnP
tnr , tnR ,
tnr , tnR ,
1
1,
,
,
tn
tn
tn r
r
R
tnR ,
tnr ,
1, tnr
17
(4) 以“CD”结尾表示这一字段为某种代码名称,例如“国家代码”字段名
为“CUNTRYCD”,证券代码“STKCD”,行业代码“INDCD”。
(5) 一些基本单词的简写:
Code: CD Date: DT Price: PRC
Trade: TRD Share: SHR Number: N
Total: TTL Name: NME Value: VAL
Company: Co Stock: STK Currency: CUR
二、数据文件中的字段含义说明
各个数据文件的数据结构及其字段说明见附录表 1~表 12。下面给出用户在理
解上可能会稍微困难一点的一些字段的详细说明。
1、 公司文件
(1) 国家代码:指上市公司的注册所在国。目前上海和深圳证券交易所的上市公司都在中
国注册,因而这一项的内容均为中国,以 10 表示。
(2) 证券代码:指上市公司所在的交易所公布的代码。目前上海证券交易所用 6 位代码,
深圳证券交易所用 4 位代码,为了处理方便,本数据库统一成 6 位代码:上海的不变,
深圳的前面加上“00”。
(3) 公司活动情况:指上市公司在交易所的情况,包括仍在挂牌交易和摘牌等情况。目前
在上海和深圳交易所的上市公司都处于挂牌交易状态,以“A”表示。
2、 汇率文件
(1) 换算得到的港币对人民币汇率:由于有一段时期,港币对人民币没有直接汇率,因而
通过人民币对美元汇率和港币对美元汇率进行换算。
3、 日个股回报率文件
(1) 考虑现金红利再投资的收盘价的可比价格:由于送股、配股、拆细等原因引起的股本
变动,交易所公布的收盘价也经过调整,从时间上看,交易所公布的收盘价就不具有
可比性。为了解决这一问题,便引入本字段,详细说明见本章第二节。
(2) 不考虑现金红利再投资的收盘价的可比价格:其基本含义与前一字段类似,只是计算
公式中的日个股回报率以不考虑现金红利再投资的日个股回报率表示。
4、 综合市场回报率文件
综合市场回报率:其计算方法与市场回报率的计算方法一样。市场回报率只是考虑一
个市场上的所有股票回报率的加权平均,比如上海 A 股市场回报率,只考虑上海 A 股市场
上的所有股票回报率的加权平均。而综合市场回报率则考虑多个市场上的所有股票回报率
的加权平均,比如 A 股综合市场回报率,则考虑上海 A 股和深圳 A 股两个市场上的所有股
票回报率的加权平均。
5、 股本变动文件
(1) 股本变动类型:指引起上市公司股本变动的情况,包括新股上市、增发新股、职工股
上市、转配股上市、配股除权、配股上市、送股除权、送股上市、拆细除权和拆细上
市等。以字段名 ShrTyp 表示,ShrTyp 由五位数字字符组成,每位字符目前一共有五种
情况,分别为“0”、“1”、“2”、 “3”,“4”和“5”留作备用。若 ShrTyp=“ABCDE”,每位字符
18
的具体含义见下表:
0 1 2 3 4 5
A 其他变动类型 新上市 职工股上市 转配股上市 备用
B 无送股 送股除权 送股上市 送股立即上市 送股期间
C 无配股 配股除权 配股上市 配股立即上市 配股期间
D 无拆细 拆细除权 拆细上市 拆细立即上市
E 无增发 增发新股 增发新股上市 增发立即上市 增发期间
说明:
B 位中的“送股除权”、“送股上市”和“送股立即上市”的区别为:
送股除权 :指上市公司在当天实施送股方案,为除权日,但所送的红
股在当天不立即上市流通。经过“送股除权”后,上市公司的
流通股总数尚未增加,这部分股份归入“流通配送股尚未流
通股数”。
送股上市 : 指经过除权的红股在当天上市流通,此时流通股总数增加“流
通配送股尚未流通股数”相应的减少。“送股除权”和“送股上
市”类型发生于送股除权和流通不在同一天。
送股立即上市 :指送股除权和上市流通在同一天,此时流通股总数增加,
而且“流通配送股尚未流通股数”不发生变化。
D 位的拆细的情况与 B 位类似,但 C 位中的“配股立即上市”,这里指在 1993 年
之前的极少数配股情况,由于当时的配股除权日已难以考证,就认为在配股上市日
当天上市流通,这一天总股本和流通股本同时增加。
(2) 股本结构说明:本数据库的股本结构采用上市公司的年报公布的股本结构分
类,其各项含义如下:
1) 总股本:股份总额,指尚未流通股份和已流通股份的总和。
2) 国家股:有权代表国家投资的政府部门或机构以国有资产投入公司形成的股份。
3) 法人股:有法人资格的公司或机构以合法资产投入公司形成的股份。
4) 境内发起人法人股:发起的为境内法人,以股份制改建以前本企业自有资金形
成的股份。
5) 境外发起人法人股:发起人为适用外资法律的法人(外商、港、澳、台商等)所
持有的股份。
6) 募集法人股:在《公司法》实施之前成立的定向募集公司所发行的,来源于本
企业以外,社会上其它企事业单位以其有权支配的资金投资形成的股份。
7) 内部职工股:在《公司法》实施之前成立的定向募集公司所发行的,公司内部
职工以个人合法财产投入公司形成的股份。
8) 优先股:承担较小风险、享受较小权利,但在分配上比普通股享有优先权的股
份。
9) 基金配售:依《证券投资基金管理暂行办法》批设的证券投资基金对公开发行
量在 5000 万股(含 5000 万股)以上的新股申请配售,根据配售所得的股份。
19
10) 转配股:上市公司在配股时,国有股或法人股股东将配股权转让给社会公众股
股东,由社会公众股股东认购的股份。
11) A股:境内上市的人民币普通股,向境内社会公众公开发行,在境内公开的证
券交易场所流通转让。
12) B股:境内上市的外资股,以人民币标明股票面值,以外币认购和进行交易、
专供外国和香港、澳门、台湾地区的投资者者购买的股票。
13) H股:香港上市的外资股,指股份有限公司经批准,向境外(香港)特定的、非
特定的投资人募集股份,其股票在香港上市,在香港公开的证券交易场所流通
转让。
14) 流通配送股尚未流通部分:在除权息日到正式上市流通日之间,所送红股或配
股的股份。
15) 高级管理人员股:上市公司内董事、监事及其他高级管理人员的持股数量。
20
第三章 数据调用
第一节 调用命令和程序
1.简介
CSMAR 数据库中的数据调用,可以通过两种方法实现,一种是在 VISUAL
FOXPRO 的“命令”窗口中键入命令直接调用,另一种则是在 VISUAL FOXPRO
中编写程序实现数据调用。前述两种数据调用方法,其输出结果都可以保存为文本格式
文件(.TXT)或 VISUAL FOXPRO 数据库格式文件(.DBF)。
2.调用方法
双击 Visual FoxPro 图标,启动 Visual FoxPro。
*命令调用
( 1 ) 在“文件”菜单中选择“打开”命令;
( 2 ) 在”文件类型”列表框中选择“表(*.dbf)”;
( 3 ) 在”文件类型”列表框中打开调用数据所属的文件;
( 4 ) 在“窗口”菜单中选择“命令窗口”命令打开命令窗口;
( 5 ) 在“命令”窗口中键入 VISUAL FOXPRO 命令,按<Enter>键执行。
*程序调用
(1) 在“文件”菜单中选择“新建”命令。
(2) 在“新建”对话框中选择“程序”。
(3) 单击“新建文件”按钮。
(4) 在 VISUAL FOXPRO 打开的一个称为“程序 1”的新窗口中,键入应用程序。
(5) 在“程序 1”的新窗口中单击“运行”按钮(或 Ctrl+E)执行。
(6) 若之前未保存程序,则会先跳出“是否保存程序” 对话框,选择“是”后程 序
将继续执行。
*命令语法描述
USE〈文件名〉
SELECT 〈文件字段名〉
FROM〈文件名〉
WHERE〈判定条件〉
TO FILE〈存储文本格式文件名〉
21
INTO DBF〈存储数据库格式文件名〉
NOWAIT------程序继续执行
注:上述文件名指调用数据所属文件的文件名。
NOWAIT 项仅在结果输出到文本格式文件并且输出数据较多时使用。
3. 判定条件描述
1)逻辑运算(AND/OR)
( 1 ) 〈条件 1〉AND〈条件 2〉……AND〈条件 N〉:
当条件 1,条件 2,……条件 N 都满足时,上面的条件表达式为逻辑真,否则为逻
辑假。
( 2 ) 〈条件 1〉OR 〈条件 2〉……OR 〈条件 N〉:
当条件 1,条件 2,……条件 N 只要其中一个条件满足时,上面的条件表达式为逻
辑真,否则为逻辑假。
2) 关系运算(>/=/<)
(1) 〈表达式 1〉 > 〈表达式 2〉…… 表达式 1 大于表达式 2
(2) 〈表达式 1〉 < 〈表达式 2〉…… 表达式 1 小于表达式 2
(3) 〈表达式 1〉 = 〈表达式 2〉…… 表达式 1 等于表达式 2
(4) 〈表达式 1〉>= 〈表达式 2〉…… 表达式 1 大于等于表达式 2
(5) 〈表达式 1〉<= 〈表达式 2〉…… 表达式 1 小于等于表达式 2
(6) 〈表达式 1〉<> 〈表达式 2〉…… 表达式 1 不等于表达式 2
第二节 调用实例
以下示范程序均已经过上机检测通过,程序假设 CSMAR2000 数据库装载在计算
机的 C 盘根目录下,程序中的 VISUAL FOXPRO 关键字用黑体表示,字段名、文件名
和条件表达式用斜体表示。
1、命令调用
例 1:查找证券代码为 600603 的上市公司证券简称、公司名称、上市日期并且把结果
形成文本格式文件。
(1) 在“文件”菜单中选择“打开”命令,打开 c:\CSMAR2000\ 文件在“命
令”窗口中键入:
SELECT STKCD,STKNME,CONME,LISTDT FROM C:\CSMAR2000\ WHERE
STKCD="600603" TO FILE C:\
(2) 打开 c:\ 文件,结果如下:
STKCD STKNME CONME LISTDT
600603 兴业房产 Shanghai Xingye Housing Co. LTd. 19920113
22
其中: 为上海 A 股公司文件,STKCD 为证券代码,STKNME 为证券简称,CONME
为公司名称,LISTDT 为上市日期, 为生成的文本格式文件。
例 2:查找汇率日期为 19980701~19980716 的汇率数据并且把结果形成文本格式文件。
(1)在“文件”菜单中选择“打开”命令,打开 C:\CSMAR2000\ 文件
(2)在“命令”窗口中键入:
SELECT TRDDT,RMBUSD,HKDRMB FROM C:\CSMAR2000\
WHERE TRDDT>=19990701 AND TRDDT<=19990716 TO FILE C:\
NOWAIT
打开 C:\ 文件,结果如下:
TRDDT
RMBUSD HKDRMB
19990701
19990702
19990705
19990706
19990707
19990708
19990709
19990712
19990713
19990714
19990715
19990716
其中: 为汇率文件,TRDDT 为汇率日期,RMBUSD 为人民币对美元汇率,
HKDRMB 为港币对人民币汇率, 为生成的文本格式文件。
例 3:查找于 1991 年之前在上海证券交易所上市的公司的证券代码、证券简称、公司
名称、上市日期并且把结果形成 DBF 格式文件。
(1) 在“文件”菜单中选择“打开”命令,打开 C:\CSMAR2000\ 文件
(2) 在“命令”窗口中键入:
SELECT STKCD,STKNME,CONME,LISTDT FROM C:\CSMAR2000\
WHERE LISTDT<19910101 INTO DBF C:\
打开 C:\ 文件,结果如下:
STKCD STKNME CONME LISTDT
600601 延中实业 Shanghai Yanzhong Industrial Co. Ltd. 19901219
600602 真空电子 Shanghai Vacuum Electron Devlces Co. Ltd. 19901219
600651 飞乐音响 Feilo Acoustics co. Ltd. Shanghai 19901219
600652 爱使股份 Shanghai Ace co. Ltd. 19901219
600653 申华实业 Shanghai Shenhua Industrial Co. Ltd. 19901219
600654 飞乐股份 Shanghai Feilo Co. Ltd. 19901219
600655 豫园商城 Shanghai Yuyuan Tourist Mart Co. Ltd. 19901219
600656 浙江凤凰 Zhejiang Province Phoenix Chemical Co. Ltd. 19901219
其中: 为上海 A 股公司文件,STKCD 为证券代码,STKNME 为证券简称,
23
CONME 为公司名称,LISTDT 为上市日期, 为生成的 DBF 格式文件。
2、程序调用
例 4:查找证券代码为 600602 的上市公司在 ~ 期间的日收盘价、
考虑现金红利再投资的日个股回报率并且把结果形成文本格式文件。
(1)在“文件”菜单中选择“新建”命令。
(2)在“新建”对话框中选择“程序”。
(3)单击“新建文件”按钮。
(4)在 VISUAL FOXPRO 打开的一个称为“程序 1”的新窗口中,键入应用程
序。
(5)在“程序 1”的新窗口中单击“运行”按钮(或 Ctrl+E)执行。
程序内容:
USE C:\CSMAR2000\ ;
SELECT STKCD,TRDDT,CLSPRC,DRETWD;
FROM C:\CSMAR2000\;
WHERE STKCD="600602" AND TRDDT<=19930808 AND TRDDT>=19930801;
TO FILE C:\。
打开 C:\ 文件,结果如下:
STKCD TRDDT CLSPRC DRETWD
600602 19930802
600602 19930803
600602 19930804
600602 19930805
600602 19930806
其中: 为上海 A 股日个股回报率文件,STKCD 为证券代码,TRDDT 为交
易日期,CLSPRC 为日收盘价,DRETWD 为考虑 现金红利再投资的日个股回报率,
为文本格式文件。
例 5:查找证券代码为 600601 和 600603 的上市公司在 ~ 期间的月交量、考虑现金
红利再投资的月个股回报率并且把结果形成 DBF 格式文件。
(1)在“文件”菜单中选择“新建”命令。
(2)在“新建”对话框中选择“程序”。
(3)单击“新建文件”按钮。
(4)在 VISUAL FOXPRO 打开的一个称为“程序 1”的新窗口中,键入下面的程序。
(5)在“程序 1”的新窗口中单击“运行”按钮(或 Ctrl+E)执行。
程序内容:
USE C:\CSMAR2000\;
SELECT STKCD,TRDMNT,NSHRTRD,MRETWD;
WHERE (STKCD="600601" OR STKCD="600603") AND TRDMNT<=199910 AND
TRDMNT>=199907;
24
FROM C:\CSMAR2000\;
INTO DBF C:\。
打开 C:\ 文件,结果如下:
STKCD TRDMNT NSHRTRD MRETWD
600601 199907 134353069
600601 199908 43904333
600601 199909 29871033
600601 199910 17630804
600603 199907 146226354
600603 199908 183256049
600603 199909 38729847
600603 199910 15525801
其中: 为上海 A 股月个股回报率文件,STKCD 为证券代码,TRDMNT 为交易月
份,NSHRTRD 为月交易量,MRETWD 为考虑现金红利再投资的月个股回报率, 为
DBF 格式文件。
例 6:查找上证综合指数在 ~ 期间的最高指数、收盘指数、指数代码、指数回
报率并且把结果形成 DBF 格式文件。
(1)在“文件”菜单中选择“新建”命令。
(2)在“新建”对话框中选择“程序”。
(3)单击“新建文件”按钮。
(4)在 VISUAL FOXPRO 打开的一个称为“程序 1”的新窗口中,键入下面的程序。
(5)在“程序 1”的新窗口中单击“运行”按钮(或 Ctrl+E)执行。
程序内容:
USE C:\CSMAR2000\;
SELECT INDEXCD,TRDDT,HIINDEX,CLSINDEX,RETINDEX;
WHERE INDEXCD=”999101” AND TRDDT<=19990710 AND; TRDDT>=19990701;
FROM C:\CSMAR2000\;
into dbf c:\。
打开 C:\ 文件,结果如下:
IDXCD HIINDEX CLSINDEX RETINDEX TRDDT
999101 19990701
999101 19990702
999101 19990705
999101 19990706
999101 19990707
999101 19990708
999101 19990709
其中: 为指数文件,INDEXCD 为指数代码,HIINDEX 为最高指数,CLSINDEX
为收盘指数,RETINDEX 为指数回报率,TRDDT 为交易日期, 为 DBF 格式文
件。
25
表 1 公司文件数据结构及处理说明
字段顺序 字段内容 字段名 字段类型 字段宽度 小数位数 字段说明
1 国家代码 Cuntrycd 数值型 2 0 本数据库以 10 表示中国
2 证券代码 Stkcd 字符型 6 0
上海 A、B 股以上交所公布的证券代码为准,深圳 A、B 股以深交所公布的证券代
码前加上 00
3 证券简称 Stknme 字符型 8 0 以交易所公布的中文简称为准
4 公司代码 Cocd 字符型 8 0 全部为空,留待日后扩充
5 公司全称 Conme 字符型 72 0 以公司公布的英文名为准,部分缺少的暂时以拼音代替
6 行业代码 Indcd 字符型 4 0 0001=金融,0002=公用事业,0003=房地产,0004=综合,0005=工业,0006=商业
7 行业名称 Indnme 字符型 50 0
Finance=金融,Utilities=公用事业,Properties=房地产
Conglomerates=综合, Industrials=工业,Commerce=商业
8 公司成立日期 Estbdt 数值型 8 0
以 YYYYMMDD 列示,年月日全部缺少以-9999 表示,部分缺少在相应位置上以
00 表示,如 1993 年 12 月某日表示为 19931200
9 上市日期 Listdt 数值型 8 0 同上
10 数据库最早交易记录的日期 Favaldt 数值型 8 0 以 YYYYMMDD 列示
11 数据库中交易数据的计量货币 Curtrd 字符型 3 0
A 股以人民币计价,上海 B 股以美元计价,深圳 B 股以港币计价
RMB=人民币,HKD=港币,USD=美元
12 股票发行溢价 Ipoprm 数值型 10 0 本数据库暂时以-9999 表示,留待日后扩充
13 招股价格 Ipoprc 数值型 10 4 缺少以-9999 表示,计量单位:元/股
14 招股价格的计量货币 Ipocur 字符型 3 0 RMB=人民币,HKD=港币,USD=美元
15 招股数量 Nshripo 数值型 14 0 计量单位:千股 缺少值以-9999 表示
16 股票面值的计量货币 Parvcur 字符型 3 0 计量货币:人民币,计量单位:元,RMB=人民币
17 招股日期 Ipodt 数值型 8 0 以 YYYYMMDD 表示,缺少以-9999 表示
18 股票面值 Parval 数值型 8 3 均为人民币 1 元
19 区域码 Sctcd 数值型 1 0 1=上海,2=深圳
20 公司活动情况 Statco 字符型 1 0 全部为 A=活动中
21 AB 股交叉码 Crcd 字符型 6 0
A 股和 B 股的交叉码,指同时拥有 A 股和 B 股的公司的 A(B)股对应的 B(A)
股代码
22 情况变动日 Statdt 数值型 8 0 全部为空,留待日后扩充
23 备注 Commnt 字符型 200 0
26
文件个数:4
SHACO: 上海 A 股公司文件 SHBCO: 上海 B 股公司文件
SZACO: 深圳 A 股公司文件 SZBCO: 深圳 B 股公司文件
27
表 2 汇率文件数据结构及说明
字段顺序 字段内容 字段名 字段类型 字段宽度 小数位数 字段说明
1 国家代码 Cuntrycd 数值型 2 0 本数据库以 10 表示中国
2 汇率日期 Trddt 数值型 8 0 以 YYYYMMDD 表示
3 星期 Daywk 数值型 1 0
1=星期一,2=星期二,3=星期三,4=星期四,5=星期五
6=星期六,0=星期天
4 人民币对美元汇率 Rmbusd 数值型 10 6 1 美元兑换 x 人民币
5 港币对美元汇率 Hkdusd 数值型 10 6 1 美元兑换 x 港币
6 港币对人民币汇率 Hkdrmb 数值型 10 6 1 人民币兑换 x 港币
7
换算得到的港币对人
民币汇率
Ihkdrmb 数值型 10 6
通过人民币对美元的汇率以及美元对港币的汇率转换而成,当缺
少港币对人民币汇率时,深圳 B 股使用本汇率进行处理
28
文件个数:1
EXCHANGE: 汇率文件
29
表 3 日历文件数据结构及处理说明
字段顺序 字段内容 字段名 字段类型 字段宽度 小数位数 字段说明
1 国家代码 Cuntrycd 数值型 2 0 本数据库以 10 代表中国
2 日历日期 Clddt 数值型 8 0 从上海、深圳交易所开市的第一天起按日历顺序以 YYYYMMDD 列示
3 星期 Daywk 数值型 1 0
1=星期一,2=星期二,3=星期三,4=星期四,5=星期五
6=星期六,0=星期天
4 开市情况 Statse 字符型 1 0 ‘O’=开市(Open),‘C’=休市(Close)
文件个数:4
SHACALE : 上海 A 股日历文件
SHBCALE : 上海 B 股日历文件
SZACALE : 深圳 A 股日历文件
SZBCALE : 深圳 B 股日历文件
30
表 4 分配文件数据结构及处理说明
字段顺序 字段内容 字段名 字段类型 字段宽度 小数位数 字段说明
1 国家代码 Cuntrycd 数值型 2 0 本数据库以 10 代表中国
2 证券代码 Stkcd 字符型 6 0
上海 A、B 股以上交所公布的证券代码为准,深
圳 A、B 股以深交所公布的证券代码前加上 00
3 分配类型 Disttyp 字符型 2 0
CA=现金红利,SD=送红股,RO=配股
DS=拆细
4 公告日期 Annodt 数值型 8 0 本数据库缺省,以-9999 表示
5 除权(息)日期 Exdistdt 数值型 8 0 以 YYYYMMDD 表示
6 支付日期 Paydt 数值型 8 0
如果分配类型是 CA,指现金红利实际到帐日。如
果分配类型是 SD、RO、DS,指增加的股票实际
上市流通日
7 分配比率 Amount 数值型 12 6
以每股作为分配基准单位,缺少以-9999 表示,
如果分配类型是 CA,计量货币为人民币,计量单
位为元,如果分配类型是 SD,RO 或 DS, 计量单位
为股
8 配股价格 Roprc 数值型 8 4
除 RO 外其他分配类型为 0,计量货币为人民币,
计量单位为元
31
文件个数:4
SHACPTL : 上海 A 股分配文件
SHBCPTL : 上海 B 股分配文件
SZACPTL : 深圳 A 股分配文件
SZBCPTL : 深圳 B 股分配文件
32
表 5 日个股回报率文件数据结构及处理说明
字段顺序 字段内容 字段名 字段类型 字段宽度 小数位数 字段说明
1 国家代码 Cuntrycd 数值型 2 0 本数据库以 10 代表中国
2 证券代码 Stkcd 字符型 6 0 上海 A、B 股以上交所公布的证券代码为准,深圳的以深交所公布的证券代码前加上 00
3 交易日期 Trddt 数值型 8 0 以 YYYYMMDD 表示
4 区域码 Sctcd 数值型 1 0 1=上海,2=深圳
5 星期 Daywk 数值型 1 0 交易日星期,1=星期一,2=星期二,3=星期三,4=星期四,5=星期五,6=星期六,0=星期日
6 行业代码 Indcd 字符型 4 0 0001=金融,0002=公用事业,0003=房地产,0004=综合,0005=工业,0006=商业
7 日开盘价 Opnprc 数值型 9 3
计量单位:元/股。A 股以人民币计,上海 B 以美元计,深圳 B 以港币计。
-8888=停牌或停止交易,-9666=无交易额,-9999=缺少资料
8 日最高价 Hiprc 数值型 9 3 同上
9 日最低价 Loprc 数值型 9 3 同上
10 日收盘价 Clsprc 数值型 9 3 同上
11 日交易股数 Nshrtrd 数值型 12 0 计量单位:股。0=没有交易量,-9999=缺少资料
12 日交易金额 Nvaltrd 数值型 16 3 计量货币:人民币,计量单位:元。0=没有交易量,-9999=缺少资料
13 总股数 Nshrttl 数值型 16 2 计量单位:股,字段说明见“字段含义附注”
14 国家股股数 Nshrstt 数值型 14 2 同上
15 法人股股数 Nshrlp 数值型 14 2 同上
16 A 股流通股数 Nshra 数值型 14 2 同上
17 B 股流通股数 Nshrb 数值型 14 2 同上
18 H 股流通股数 Nshrh 数值型 14 2 同上
19 转配股股数 Nshrrot 数值型 12 2 同上
20 基金配售股数 Nshrmf 数值型 15 2 同上
21 流通配送股尚未流通股数 Nshrunl 数值型 15 2 同上
22 内部职工股股数 Nshremp 数值型 12 2 同上
23 优先股股数 Nshrprf 数值型 15 2 同上
24 高级管理人员持股数 Nshrsms 数值型 12 2 同上
25 流通市值 Mvosd 数值型 16 2
个股的流通股数与收盘价的乘积,计量单位:千元,A 股以人民币计,上海 B 股以美元计,
深圳 B 股以港币计
26 总市值 Mvtll 数值型 16 2 个股的总股数与收盘价的乘积,计量单位:千元,A 股以人民币计,上海 B 股以美元计,深
33
圳 B 股以港币计
27 考虑现金红利再投资的日个股回报率 Dretwd 数值型 10 6 上市首日的前收盘价取招股价,-9666 表示数据无效,字段说明见“回报率计算方法”
28 不考虑现金红利再投资的日个股回报率 Dretnd 数值型 10 6 同上
29 考虑现金红利再投资的收盘价的可比价格 Adjprcwd 数值型 11 6
计量单位:元。A 股以人民币计,上海 B 以美元计,深圳 B 以港币计,去除由于时间间隔
和股本变动原因引起变化的以上市首日为基准的经过调整后的收盘价。
30 不考虑现金红利再投资的收盘价的可比价格 Adjprcnd 数值型 11 6 同上
文件个数:4 SHADALYR: 上海 A 股日个股回报率文件 SHBDALYR: 上海 B 股日个股回报率文件
SZADALYR: 深圳 A 股日个股回报率文件 SZBDALYR: 深圳 B 股日个股回报率文件
34
表 6 日市场回报率文件数据结构及处理说明
字段顺序 字段内容 字段名 字段类型 字段宽度 小数位数 字段说明
1 国家代码 Cuntrycd 数值型 2 0 本数据库以10代表中国
2 交易日期 Trddt 数值型 8 0 以YYYYMMDD表示
3 星期 Daywk 数值型 1 0
1=星期一,2=星期二,3=星期三,4=星期四 5=
星期五,6=星期六,0=星期日
4 日交易总股数 Nshrtrd 数值型 12 0
计量单位:股。
0=没有交易量,-9999=缺少资料
5 日交易总金额 Nvaltrd 数值型 14 3
计量货币:人民币,计量单位:元。
0=没有交易量,-9999=缺少资料
6 考虑现金红利再投资的日市场回报率(等权平均法) Dretwdeq 数值型 11 6
-977表示数据库的第一条记录,即市场开市
首日,字段说明见“回报率计算方法”
7 不考虑现金红利再投资的日市场回报率(等权平均法) Dretndeq 数值型 11 6 同上
8 考虑现金红利再投资的日市场回报率(流通市值加权平均法) Dretwdos 数值型 11 6 同上
9 不考虑现金红利再投资的日市场回报率(流通市值加权平均法) Dretndos 数值型 11 6 同上
10 考虑现金红利再投资的日市场回报率(总市值加权平均法) Dretwdtl 数值型 11 6 同上
11 不考虑现金红利再投资的日市场回报率(总市值加权平均法) Dretndtl 数值型 11 6 同上
12 计算日市场回报率的有效公司数量 Nstkcal 数值型 4 0 上一交易日和今日皆有交易为有效公司
文件个数:4
35
SHADALYM : 上海 A 股日市场回报率文件
SHBDALYM : 上海 B 股日市场回报率文件
SZADALYM : 深圳 A 股日市场回报率文件
SZBDALYM : 深圳 B 股日市场回报率文件
36
表 7 月个股回报率文件数据结构及处理说明
字段顺序 字段内容 字段名 字段类型 字段宽度 小数位数 字段说明
1 国家代码 Cuntrycd 数值型 2 0 本数据库以10代表中国
2 证券代码 Stkcd 字符型 6 0 上海A、B股以上交所公布的证券代码为准,深圳A、B股以深交所公布的证券代码前加上00
3 交易月份 Trdmnt 数值型 6 0 以YYYYMM表示
4 区域码 Sctcd 数值型 1 0 1=上海,2=深圳
5 行业代码 Indcd 字符型 4 0 0001=金融,0002=公用事业,0003=房地产,0004=综合,0005=工业,0006=商业
6 月开盘价 Opnprc 数值型 8 3 -8888=停牌,-9666=没有交易,-9999=没有资料
7 月开盘日期 Opndt 字符型 2 0 以DD表示,为OPNPRC的所在日,“DD”=本月无交易
8 月收盘价 Clsprc 数值型 8 3 -8888=停牌,-9666=没有交易,-9999=没有资料
9 月收盘日期 Clsdt 字符型 2 0 以DD表示,为CLSPRC的所在日,“DD”=本月无交易
10 月交易股数 Nshrtrd 数值型 14 0 月内该股票的交易数量,-9999=缺少资料,计量单位:股
11 月交易金额 Nvaltrd 数值型 14 2
月内该股票的交易金额,-9999=缺少资料
计量货币:人民币,计量单位:元
12 总股数 Nshrttl 数值型 16 2 计量单位:股,字段说明见“字段含义附注”
13 国家股股数 Nshrstt 数值型 14 2 同上
14 法人股股数 Nshrlp 数值型 14 2 同上
15 A股流通股数 Nshra 数值型 14 2 同上
16 B股流通股数 Nshrb 数值型 14 2 同上
17 H股流通股数 Nshrh 数值型 14 2 同上
18 内部职工股股数 Nshremp 数值型 12 2 同上
19 高级管理人员持股数 Nshrsms 数值型 12 2 同上
20 转配股股数 Nshrrot 数值型 12 2 同上
21 基金配售股数 Nshrmf 数值型 15 2 同上
22 流通配送股尚未流通股数 Nshrunl 数值型 15 2 同上
23 优先股股数 Nshrprf 数值型 15 2 同上
24 流通市值 Mvosd 数值型 16 2
个股的流通股数与月收盘价的乘积,计量单位:千元。A股以人民币计,上海B以美元计,
深圳B以港币计
25 总市值 Mvttl 数值型 16 2
个股的总股数与月收盘价的乘积,计量单位:千元。A股以人民币计,上海B以美元计,深
圳B以港币计
37
26 月交易天数 Ndaytrd 数值型 2 0 月内实际交易的天数
27 考虑现金红利再投资的月个股回报率 Mretwd 数值型 10 6 -977表示上市首月,-9666表示数据无效,字段说明见“回报率计算方法”
28 不考虑现金红利再投资的月个股回报率 Mretnd 数值型 10 6 同上
文件个数:4
SHAMNTH: 上海 A 股月个股回报率文件 SHBMNTH: 上海 B 股月个股回报率文件
SZAMNTH: 深圳 A 股月个股回报率文件 SZBMNTH: 深圳 B 股月个股回报率文件
38
表 8 月市场回报率文件数据结构及处理说明
字段顺序 字段内容 字段名 字段类型 字段宽度 小数位数 字段说明
1 国家代码 Cuntrycd 数值型 2 0 本数据库以10代表中国
2 交易月份 Trdmnt 数值型 6 0 以YYYYMM表示
3 月交易天数 Ndaytrd 数值型 2 0 以月内实际交易的天数表示
4 月交易总股数 Nshrtrd 数值型 14 0 月内所有个股交易量的汇总数,计量单位:股
5 月交易总金额 Nvaltrd 数值型 14 2 月内所有个股交易金额的汇总数,计量货币:人民币,计量单位:元
6
考虑现金再投资的月市场回报率
(等权平均法) Mretwdeq
数值型 11 6
-977表示数据库的第一条记录,即市场开市首月,字段说明见“回报率计
算方法”
7
不考虑现金再投资的月市场回报率
(等权平均法) Mretndeq
数值型 11 6 同上
8
考虑现金再投资的月市场回报率
(流通市值加权平均法) Mretwdos
数值型 11 6 同上
9
不考虑现金再投资的月市场回报率
(流通市值加权平均法) Mretndos
数值型 11 6 同上
10
考虑现金再投资的月市场回报率
(总市值加权平均法) Mretwdtl
数值型 11 6 同上
11
不考虑现金再投资的月市场回报率
(总市值加权平均法) Mretndtl
数值型 11 6 同上
12 计算月市场回报率的有效公司数量 Nstkcal 数值型 4 0 上月和今月皆有交易为有效公司
13 月流通市值 Mmvosd 数值型 20 3
月内所有个股的流通市值(流通股数*月收盘价)汇总数,计量单位:千
元。A股以人民币计,上海B股以美元计,深圳B股以港币计
14 月总市值 Mmvttl 数值型 20 3
月内所有个股的总市值(总股数*月收盘价)汇总数,计量单位:千元。A
股以人民币计,上海B股以美元计,深圳B股以港币计
文件个数:4
39
SHAMONT : 上海 A 股月市场回报率文件
SHBMONT : 上海 B 股月市场回报率文件
SZAMONT : 深圳 A 股月市场回报率文件
SZBMONT : 深圳 B 股月市场回报率文件
40
表 9 综合日市场回报率文件数据结构及处理说明
字段顺序 字段内容 字段名 字段类型 字段宽度 小数位数 字段说明
1 国家代码 Cuntrycd 数值型 2 0 本数据库以10代表中国
2 交易日期 Trddt 数值型 8 0 以YYYYMMDD表示
3 星期 Daywk 数值型 1 0
1=星期一,2=星期二,3=星期三,4=星期四 5=
星期五,6=星期六,0=星期日
4 日交易总股数 Nshrtrd 数值型 12 0
计量单位:股
0=没有交易量,-9999=缺少资料
5 日交易总金额 Nvaltrd 数值型 20 3
计量货币:人民币,计量单位:元。
0=没有交易量,-9999=缺少资料
6 考虑现金再投资的综合日市场回报率(等权平均法) Dretwdeq 数值型 11 6
-977表示数据库的第一条记录,即市场开市
首日,字段说明见“回报率计算方法”
7 不考虑现金再投资的综合日市场回报率(等权平均法) Dretndeq 数值型 11 6 同上
8 考虑现金再投资的综合日市场回报率(流通市值加权平均法) Dretwdos 数值型 11 6 同上
9 不考虑现金再投资的综合日市场回报率(流通市值加权平均法) Dretndos 数值型 11 6 同上
10 考虑现金再投资的综合日市场回报率(总市值加权平均法) Dretwdtl 数值型 11 6 同上
11 不考虑现金再投资的综合日市场回报率(总市值加权平均法) Dretndtl 数值型 11 6 同上
12 计算日市场回报率的有效公司数量 Nstkcal 数值型 4 0 上一交易日和今日皆有交易为有效公司
文件个数:3
CNAADALYM : A 股综合日市场回报率文件
41
CNBBDALYM : B 股综合日市场回报率文件
CNABDALYM : A、B 股综合日市场回报率文件
42
表 10 综合月市场回报率文件数据结构及处理说明
字段顺序 字段内容 字段名 字段类型 字段宽度 小数位数 字段说明
1 国家代码 Cuntrycd 数值型 2 0 本数据库以10代表中国
2 交易月份 Trdmnt 数值型 6 0 以YYYYMM表示
3
考虑现金红利再投资的综合月市场
回报率(加权平均法) Mretwdeq
数值型 11 6
-977表示数据库的第一条记录,即开市首月,字段说明见“回报率计算方
法”
4
不考虑现金红利再投资的综合月市
场回报率(加权平均法) Mretndeq
数值型 11 6 同上
5
考虑现金红利再投资的综合月市场
回报率(流通市值加权平均法) Mretwdos
数值型 11 6 同上
6
不考虑现金红利再投资的综合月市
场回报率(流通市值加权平均法) Mretndos
数值型 11 6 同上
7
不考虑现金红利再投资的综合月市
场回报率(总市值加权平均法) Mretwdtl
数值型 11 6 同上
8
考虑现金红利再投资的综合月市场
回报率(总市值加权平均法) Mretndtl
数值型 11 6 同上
9 计算月市场回报率的有效公司数量 Nstkcal 数值型 4 0 上月和今月皆有交易为有效公司
10 月总流通市值 Mmvosd 数值型 20 2
月内所有个股的流通市值(流通股数*月收盘价)汇总数,计量货币:人
民币,计量单位:千元
11 月总市值 Mmvttl 数值型 20 2
月内所有个股的总市值(总股数*月收盘价)汇总数,计量货币:人民币,
计量单位:千元
文件个数:3
43
CNAAMONT : A 股综合月市场回报率文件
CNBBMONT : B 股综合月市场回报率文件
CNABMONT : A、B 综合月市场回报率文件
44
表 11 指数文件数据库结构及字段说明
字段顺序 字段内容 字段名 字段类型 字段宽度 小数位数 字段说明
1 指数代码 Indexcd 字符型 6 0
999101:上证综合指数, 999102:上证综合 A 股指数
999103:上证综合 B 股指数,999130:上证 30 指数
999201:深证综合指数, 999202:深证综合 A 股指数
999203:深证综合 B 股指数,999230:深证成份指数
2 交易日期 Trddt 数值型 8 0 以 YYYYMMDD 表示
3 星期 Daywk 数值型 1 0
1=星期一,2=星期二,3=星期三,4=星期四,5=星期五
6=星期六,0=星期日
4 开盘指数 Opnindex 数值型 9 3 每日交易中的第一条指数
5 收盘指数 Clsindex 数值型 9 3 每日交易中的最后一条指数
6 最高指数 Hiindex 数值型 9 3 每日交易中的最高一条指数
7 最低指数 Loindex 数值型 9 3 每日交易中的最低一条指数
8 指数回报率 Retindex 数值型 9 6
-977 表示该指数的第一条记录,-9666 表示缺数据,字段说明见“回
报率计算方法”
文件个数:1
45
INDEX :指数文件
46
表 12 股本变动文件数据结构及说明
字段顺序 字段内容 字段名 字段类型 字段宽度 小数位数 字段说明
1 证券代码 Stkcd 字符型 6 0
上海 A、B 股以上交所公布的证券代码为准,深
圳 A、B 股以深交所公布的证券代码前加上 00
2 股本变动日期 Shrchgdt 字符型 8 0 上市公司股本发生变化的日期
3 股本变动类型 Shrtyp 字符型 5 0 字段说明见“字段含义附注”
4 总股数 Nshrttl 数值型 15 2 计量单位:股,字段说明见“字段含义附注”
5 国家股股数 Nshrstt 数值型 15 2 同上
6 境内发起人法人股股数 Nshrlpd 数值型 15 2 同上
7 境外发起人法人股股数 Nshrlpf 数值型 15 2 同上
8 募集法人股股数 Nshrlpn 数值型 15 2 同上
9 内部职工股股数 Nshremp 数值型 15 2 同上
10 基金配售股数 Nshrmf 数值型 15 2 同上
11 转配股股数 Nshrrot 数值型 15 2 同上
12 优先股股数 Nshrprf 数值型 15 2 同上
13 A 股流通股数 Nshra 数值型 15 2 同上
14 B 股流通股数 Nshrb 数值型 15 2 同上
15 H 股流通股数 Nshrh 数值型 15 2 同上
16 流通配送股尚未流通股数 Nshrunl 数值型 15 2 同上
17 高级管理人员持股数 Nshrsms 数值型 15 2 同上
47
文件个数:1
CAPCHG : 股本变动数据结构文件