第七届海峡两岸统计与概率学术研讨会于2010年7月上旬在台湾成功大学举行。本次研讨会是与台湾南区第19次统计研讨会一起举办的,因此为海峡两岸更多的专家、学者提供了相互交流和学习的机会。参加本次研讨会的统计与概率方面的专家、学者超过500名,其中大陆代表40名。会议共收到学术论文200篇。尤其难得的是,会议邀请到著名统计学家刁锦寰教授做了关于探寻数据中异常值方法的专题讲座,使与会者获益匪浅。

本次研讨会所涉及的议题非常广泛。论文和报告中有对统计学基本理论与方法前沿问题的探讨,更多的则是讨论统计学在生物医学、人口社会、资源环境、经济金融等诸多领域的应用问题。现将本次研讨会的主要学术观点综述如下。
一、关于统计设计与统计数据收集方法
如何有效地收集统计数据是统计学研究的一个重要方面。尤其是在政府统计所涉及的社会经济领域,由于所研究对象的复杂性以及所采用的收集数据方法主要是观察而难以像自然或工程领域那样通过试验来进行,因此对于统计设计的要求很高。在本次研讨会上部分专家对此进行了较深入的探讨。
随着中国社会经济的快速发展,常规统计的调查难度加大,统计调查对象数量大量增加,同时信息化、数字化处理手段也发生了重大变革。面对这些挑战,国家统计局成立专门的工作小组,开展了企业数据采集一体化设计(即企业一套表)的研究工作,并进行了试点。国家统计局胡晓微在题为“企业数据采集的一体化设计”的报告中就此进行了介绍。作者总结了全国历次企业数据采集一体化设计经验教训,阐述了建立“企业一套表”的意义和作用,介绍了“企业一套表”的基本框架和试点工作以及“企业一套表”业务分工和业务工作流程。
国家统计局孙学光对基于行政记录的统计调查进行了探讨。作者认为,开发行政记录不仅是市场经济条件下搜集统计资料的有效方法,而且是提高统计数据质量、降低统计调查成本的重要途径。作者就行政记录的定义、行政记录在统计调查中应用的前提、国外行政记录在统计调查中应用的经验等进行了综述,并提出了我国统计调查中应用行政记录的一些建议。
国家统计局胡英介绍了中国人口普查中使用的长短表技术以及相应的抽样方法和实践中的具体做法。人口普查表长短表技术是指在人口普查中,将人口普查表分为“普查表短表”和“普查表长表”两种。“普查表短表”,其特点是表中项目少,“普查表长表”,是表中项目多。“普查表长表”是抽取一定比例的户填报,“普查表短表”是由其余的户填报。在普查总体中抽取填报长表的户,称为普查表长表抽样。人口普查表长表抽样设计与其它全国范围内的抽样设计不同,它不是一项独立的抽样设计, 而是人口普查工作中的一部分,具有普查和抽样调查相结合的特点。中国于2000年第五次全国人口普查首次采用了普查表长短表技术。2000年普查结果显示,长表填报数据质量好,代表性强,长短表技术在人口普查中应用取得了较好的效果。根据第六次全国人口普查方案,第六次人口普查仍采用长短表技术。
河南省统计局王正炎就如何以经济普查为基础建立我国服务业统计制度进行了探讨。作者认为,我国的服务业应该建立以经济普查为基础,抽样调查为主体,政府综合统计与部门统计相结合,全面调查、抽样调查等多种方法综合运用,科学、简便、实用的服务业统计调查体系。针对河南省服务业发展现状,结合河南省部门统计数据的实际情况,作者提出:在统计调查方法的选择上,对党政群机关、教育行业、个体服务业,尽量利用财政、教育、税务、工商等部门现成统计数据推算,避免重复调查;对规模较大的规模以上单位实行全数调查;对大量规模较小的规模以下单位实行抽样调查,并解决分行业、分地区数据代表性问题;逐步推行各部门全行业统计。
宁波市统计局罗吕榕则认为,现代服务业统计调查制度的设计和实施必须在对第一、二、三产业中的现代服务业部分分别进行科学界定的基础上,按照“统一制度、在地实施、部门协作、集中处理”的原则,明确调查对象、调查内容和调查方法等,形成完整的现代服务业统计组织、监测、核算体系。
北京市统计局侯小维做了关于“北京市‘统计业务流程重构’的探索与实践”的报告。她认为,统计业务流程是指统计数据生产与提供的全部过程,包括:统计制度设计、统计数据采集、统计数据处理、统计数据分析、统计信息发布环节。“统计业务流程重构”作为北京市大都市统计体系建设的重要内容,就是以研究改革与完善统计业务的组织和管理方式为主要内容,以提高统计生产效率为核心,推动首都大都市统计体系建设。
部分学者则就自然工程等领域统计数据收集的主要方法--试验设计--进行了探讨。
台湾成功大学黄郁芬探讨了带有定性和定量因素的可切片响应面(Sliceable Response Surface Designs)试验设计问题。带有定性和定量因素的响应面设计曾经被著名统计学家Cox(1984)认为是当时试验设计领域11个未解决的问题之一,这一问题至今仍然没有得到完全解决,特别是当存在两个及两个以上的定性因素时。作者提出了一个一般的方法来构造一类新的设计--可切片响应面设计--来处理这一问题。这类新的设计具有两个较好的特性:当限定定性因素时,定量因素设计是一个四水平的部分因子设计;对任一水平的定性因素的组合,相应的子集设计是一个二水平的部分因子设计。这一方法的实施非常简单且不需要大量的计算,并能处理两个及以上的定性因素。作者还给出了一些例子来说明这一方法的使用效果。
在工业试验中,当因素很难发生变化或变化成本较高时,人们常采用裂区设计的方法来进行试验。在裂区试验中,主区因子的不同水平被随机地分配到主区单位且副区的处理水平被随机地分配到每个主区单位内的副区。但是,由于试验资源或条件的限制,有时候并不能保证所有的试验都能在相同的条件下实施,从而使得裂区试验在不同的区组进行。台湾师范大学蔡碧玟等提出了一种一般的方法来构造和选择区组的裂区试验。在该方法中,作者考虑了区组裂区设计的三种分层方差。结果表明:作者提出的方法可以得到更好的试验设计。
二、关于数理统计的理论与方法
经济社会的快速发展和科技进步对统计学提出了更高的挑战。为了适应经济社会发展的需要,必须加强统计理论研究,发展出更多新的统计方法来解决实际中提出的数据处理问题。本次研讨会中相当一部分学者的研究主题即是关于统计理论与方法的。
台湾中央大学统计研究所王婉伦等做了题为“多重纵向数据的多元t线性混合模型的估计”的报告。多元线性混合模型(MLMM)经常被用于多重纵向数据的联合分析。考虑到模型对于具有拖尾和可能的序列相关的潜在异常值或数据的敏感性,本文试图对原有MLMM进行扩展,建立一个稳健性的模型。作者提出了一个混合ECME得分方法来计算模型参数的最大似然估计,得到了参数的方差,推导出一种用于检验自相关存在性的得分检验方法。然后,作者将这种方法应用于一组AIDS数据并进行了解释。
台湾中央大学邹宗山等讨论了利用泊松和负二项分布似然作为连续型数据的代理似然函数问题。对于连续变量用连续的分布,离散的变量用离散的分布来构建模型是很自然的事情。而作者证明,在独立同分布的情况下,经过适当的调整,泊松和负二项似然函数能够用来替代某些非负连续分布的边侧似然函数(Profile likehood),这些连续分布包括gamma和逆高斯分布。文章给出了理论证明,作者对实际数据的实证分析也证实了该种方法的适用性。
高雄大学黄锦辉等讨论了前向选择的两样本的二项检验问题。来自两样本的比较二项试验数据是实践中广泛应用的数据,如临床试验。在比较两个独立的小样本的二项分布参数时,常用的方法是Fisher精确检验(FET)。 FET是一个有条件的方法,它将超几何分布看成一种零分布。2008年Gerald G G.rans和Jonathan J.Shuster指出,将FET应用于这种对比数据会得到很低的第一类错误概率。此外,他们提出调整的方法,定义新的显著性水平α*=α+ε,其中α是预先指定的,ε是一个小的正数,给出了一个交叉表,其中包含所有新的显著性水平、各样本容量和目标α。调整的方法提高了测试的规模,提高了第一类错误的概率,并且更强大。 从另一个角度来看,他们提出的方法适用于两个独立的二项分布计算第一类错误的概率,拒绝域的可能的结果是基于超几何分布。在本文中,作者再提出一个可能的结果进入拒绝域的情况。该方法不使用超几何分布,而是考虑两个独立的二项式分布作为参考。最后,通过对一些方法的数值模拟的比较研究,作者认为他们提出的方法具有一定的优势。
香港大学的Philip L. H. Yu等研究了极差数据的贝叶斯条件自回归几何过程模型。极值理论表明,对一个局部的财务资产回报来说,极差是一种有效的估计。作者提出了一种关于极差的新的几何过程(GP)数据框架,它基于著名的条件自回归范围(CARR)模型。 该方法将GP模型扩大到条件自回归几何过程范围(CARGPR)模型,它允许灵活的趋势形式,跳跃和杠杆效应。出于稳健性的考虑,广泛使用的对数正态(误差)分布被对数t分布所取代。作者通过模拟研究证明了CARGPR模型参数估计精度高。实证研究中,作者分析了AORD指数的极差,表明模型无论在样本内预测还是样本外推测,都要优于CARR模型。
台湾大学洪弘讨论了动态降维问题。考虑推断响应变量和自变量之间的联系的问题。当自变量是高维时,降维就是一个很重要的工具。人们试图根据响应变量找到一种自变量的低维变换而不丢失信息。自从Li(1991年)提出切片逆回归(SIR)方法以来,学者们在这方面做了大量工作。然而,很多情况下,研究者对导出后的响应变量(如对响应变量做某种变换)而不是原始响应变量感兴趣。例如,我们可能观察到因变量是个体的生存时间Y0,我们感兴趣的是预测生存时间在预先指定的时间点t之内的个体的情况。也就是说,当我们考虑不同的响应变量时,降维后的子空间(SDR)可能发生变化。在本研究中,作者考察了不同子空间之间的关系。另外,作者的实证分析发现,导出的SDR的直接估计可能引起有效性问题。作者提出了一种修正的方法来对子空间进行估计。模拟研究研究的结果支持了这种方法的合理性。
淡江大学黄逸辉做了关于将带有零截断响应变量及协变量有测量误差的广义线性模型应用于捕获-再捕获(Capture-recapture)试验的报告。协变量的测量误差可能会导致回归分析中的有偏估计。为了减少这种偏差,不同的回归模型已经提出了相应的修正模型。然而,在零截断回归中,测量变量的数量可能与响应变量有关,存在的修正模型的共同的假设可能不成立。在本文中,作者引入一种误差加强算法(error augmentation algorithm)重新建立代理条件。这种算法容易实现,而且常规分析也是适用的。模拟试验表明了该算法的优点。
北京科技大学薛留根提交的论文是“集群数据(Clustered data)的经验似然局部多项式回归分析”。在该文中,作者将经验似然方法和局部多项式拟合结合起来,为集群数据的非参数回归模型构建了简单的经验似然比。作者得到了回归函数及其导数的极大经验似然估计,并建立了这些估计量及相关比率的渐进分布。
华东师范大学刘玉坤做了题为“具有高阶精度的调整的经验似然函数”的报告。经验似然是一种常用的非参数或半参数的统计方法,拥有众多好的统计特性。然而,当样本容量非常小时,或伴随的估计函数维度较高时,卡方近似的低精度和估计的方程解的不存在就会阻碍经验似然函数方法的应用。在本文中,作者证明调整的经验似然方法对解决这两个问题是有效的。在特定的调整水平上,调整的经验似然达到了Barlett修正的高阶精度,也保证了估计方程的解的存在。
中国科学技术大学吴耀华等也讨论了修正的经验似然问题。大样本或渐进统计方法是统计推断中常用的统计方法,这是因为估计或检验统计量的精确分布通常很难确定,我们必须利用其极限分布来做统计推断。基于一阶渐进分布的大样本方法的精确性在样本量较小时可能较差,所以统计学中一个重要的是如何改进这一方法。作者将修正的经验似然的思想应用于非参类似然,给出了修正指类型经验似然和修正指数型倾斜似然,证明了修正后的统计量收敛到极限卡方的速度为O(n-2),而作者的模拟结果也表明修正后统计量的置信域的覆盖率与修正前相比较有较大的提高。
结构方程模型是一种结合数据与经验知识研究变量间网络结构的方法,但是由于该方法是从数据出发的,在模型选择方面仍存在一些争议。北京大学房祥忠等讨论了建立评分标准选择最合适已知数据的结构方程时会出现的问题,并类似于区间估计的方法,在一般意义上建立模型的置信集,再将所建立的方法应用于结构方程模型的选择之中。
中国科学院数学与系统科学研究院郭绍俊等研究了带有变参数的加速失效时间模型的基于秩的局部推断问题。作者提出了一种基于局部线性光滑技术估计回归系数并建立了估计量的渐进正态分布的局部秩估计函数。所有估计都可通过线性过程来获得,同时也提供了一系列实践中需要的统计分析工具。
三、关于统计方法的应用
将统计学应用于经济社会等领域是海峡两岸历届统计研讨会的重点议题,本次研讨会也不例外。本次研讨会的一个特点是除传统的经济金融领域外,关于统计方法在医疗保健、环境资源、生物信息等领域的应用方面进行探讨的文献越来越多。
1.医疗保健领域
台湾大学王德荣报告的题目是“对医疗保健产业中的生活质量和生存进行综合评估”。在对医疗保健业进行评价时,生存和生活质量(QOL)是两个关键的测度指标。前者可以客观地确定,然而后者只能通过病人的主观报告来获得。考虑到这两个结果函数联合起来可以派生出一个关于医疗保健评估的普遍的方程,这个方程以生存质量调整年作为共同的单位,这时QOL以效用或者偏好来测量。由于很多组病人仅仅跟踪了一小段有限的时间,因而数据就存在很高的截断率(差不多高于50%),作者利用蒙特卡罗方法得到关于年龄和性别相匹配的一般人口统计信息,来外推生存函数的生存时间。当QOL函数是通过心理学工具来测度时,结果评分能够被用于临床医学的结果评价;当QOL函数被医疗费用报销所取代时,模型能够获得一个具体的健康状况一生的财政负担;两方面的发展可以被用于医疗保险业的比较结果评价。
外科手术时间的估计对于医院管理来说是非常有用和重要的信息,尤其对于手术室的调度。台湾中山大学洪宛频讨论了这一问题。通过对实际数据的考察,作者发现对数和混合对数正态分布可以用于描述这一问题。作者的结论通过对台湾南部一个较大的医学院的13个妇科手术的分析得到了解释。
一般认为医疗费用随着年龄增加而增加,因此人口老化将加重医疗费用上涨的压力。然而过去许多研究结果并未发现人口老化对医疗费用有显著的影响。部分学者指出问题在于从年龄医疗费用的角度来理解人口老化的影响忽略了真正引发高龄者医疗费用较高的原因——死亡。个人一生医疗费用大多集中于临终前,显然老人的平均医疗费用比年轻人高不是因为年龄较大,而是老年人较年轻人更接近死亡。因此Zweifel等人主张死亡距离(time to death)才是探讨人口老化对医疗费用影响的关键因素。台湾中正大学李大正等利用台湾的医疗保健资料对死亡距离与医疗费用的关系进行了考察。
台北大学黄怡婷等探讨了有删失数据的医疗成本的估计方法。在医疗成本研究的过程中,常有因个体提早离开研究而导致资料观测不完全的情况,利用三种未控制共变数的传统估计式去估计成本,忽略了未观察成本部分而产生有偏的成本估计式。作者引用Lin(1997)将研究期间分为数个区间,并对各个区间成本存活几率权重概念,及Tsiatis(2000)利用未设限几率权重方式对成本估计式做修正;另外,Lin(2000)所提的方法没有详细讨论成本相关的情况,作者用有限制的极大似然估计方法估计共变异数矩阵来修正模型系数的标准误估计可能导致的偏误。最后利用模拟比较在未控制共变数情况下,存活几率及未设限几率两种不同权重方式,在资料类型不同时,如设限情况严重、适中、轻微,其成本估计值的表现。
增量成本效益比(Incremental cost-effectiveness Ratio,ICER)的估计是实践中经常遇到的问题。如在对治疗效果进行评价时,增量成本效益比可以表示为治疗干预的成本变化与干预效果的变化的比率。尽管可以很直观地将其解释为每增加单位效益时所增加的额外成本,但是估计两个随机变量的比率的分布却是一个挑战。所有以前的研究提出的估计量都是有偏。台湾中原大学吴建华首次提出了ICER的无偏估计。为了得到成本效益比率(CER)的无偏估计,作者使用了零截距的二元正态回归。在平衡数据中,应用Iman-Conover算法构建要求的两个随机二元样本的方差协方差矩阵,然后按照与CER相同的方法获得ICER的无偏估计。对于不平衡数据则使用Iman-Conover的Bootstrap方法。模拟结果表明,作者提出的回归型方法比均值估计量的表现要好。
中医学为祖国几千年来知识经验的流传,以中医治疗痤疮,有独特功效,因此,以中医观点诊断痤疮的文献日益增多。辅仁大学郑雅文等针对大量中医诊断痤疮的文献,以文本挖掘技术探讨文章之间的关键信息,建立词库,并探讨词库内,词与词之间的因果关系,再进一步利用文字探勘技术所产生的重要性分数,探讨各字词间的关联性,期望能让痤疮临床上的中医师与从事中医学的教育人员,在诊断上能有更明确的了解,甚至提供痤疮患者基本的自我保健方法。研究结果表明,词库中“肺热”、“风热”、“血热”为相对重要的关键词,而在药用方面“黄芩”、“赤芍”、“丹参”、“连翘”为相对重要的关键词。
2.环境资源领域
台湾中山大学罗梦娜等讨论了淡水河与高屏溪流域水质污染检测分析。为了了解台湾不同河川流域水质污染的情况及来源,作者利用时间数列建立水质变化模型,采用因子分析方法,探讨影响水质污染较重要的环境因子与污染来源建立潜在的共同结构因素,以解释河川流域水质污染的主要来源。根据相关水质监测资料,对淡水河与高屏溪流域进行的分析发现,在污染重区域,其水质检测数据具有序列相关现象。接着利用向量自回归模型来消除数据间的动态相依性,并对残差进行因子分析。利用上述过程,所得到的因子分析模型,更能充分地解释水质监测变化与该地区环境污染的潜在关系。
台湾中山大学林义衡等探讨了南化水厂水质浊度净化的最佳处理方法。作者主要探讨原水浊度、原水PH值以及聚氯化铝价药量对净化水质浊度的最优化问题。利用二阶段回归方法,首次回归分析寻找最佳加药量与原水浊度间的回归关系,以此模型进一步寻找三个解释变量下对净化水质浊的度回归模型。依据原水浊度回归分析结果,来探讨在设定净化后浊度期望值条件下,推断出最佳加药量,以作为未来净化水质值最佳加药处理方式的参考。
辅仁大学黄孝研究了台北地区交通空气污染物对年轻人心血管功能的影响。作者搜集了健康年轻人交通空气污染暴露量与心跳率异常的第一手资料来进行分析。由于数据资料里的环境因子会受到本身前期的影响,呈一种与时间相关的非线性性能,且测量方式为时间上的重复测量,所以作者选择适当严谨的广义可加混合模型(GAMM)来进行分析,并比较了线性混合模型与广义可加混合模型等不同的统计方法在此类型的数据资料所建立的模型的差异。
甘肃省统计局刘晓梅等对基于“绿色经济”模型的绿色GDP核算进行了探讨。作者在对联合国等国际组织所发布的《综合环境经济核算体系》中所提出的两种绿色GDP的核算路径进行比较研究的基础上,认为在国内生产净值的基础上通过扣减环境成本核算绿色GDP的路径虽然被学术界普遍认可,但有很多问题实际上已经陷入理论困境。作者坚持绿色GDP的实质就是绿色经济GDP的理论观点,认为绿色GDP核算的关键是绿色经济体系的构建与模拟,而非核算方法的变革。作者将经济体系与资源环境置于同一个系统之内,对“绿色经济”模型的构建理论、模拟方法等若干理论与方法问题进行了研究。
黑龙江省统计局王怀生对循环经济发展水平评价方法进行了探讨。作者在结合目前国内外众多关于区域循环经济发展水平评价体系的研究及其黑龙江省具体省情的SWOT分析的基础上,初步设计出一套由社会经济发展、资源节约使用、循环利用、污染减排及生态安全4个子系统42个指标构成的黑龙江省循环经济评价体系,并对黑龙江的实际情况进行了实证分析。
福建省统计局郭华生在对节约型社会的基本含义进行分析的基础上,提出了社会效率概念,围绕国民经济生产、流通和消费各环节,构建了一套节约型社会评价指标体系,并对福建省近年在建设节约型社会方面取得的成效进行了实证分析。
3.生物信息领域
辅仁大学杜圣尧等讨论了用微阵列资料(Microarray Data)探讨阿拉伯芥LEA基因表现的关联性。作者利用已公开发表在网站NASC上阿拉伯芥的原始微阵列资料,不仅研究样本中除了种子发育时期外的其他时期,还进一步延伸到植株各个不同部位、不同的非生物性逆境处理。接着以LEA基因的表现量进行群集分析,利用基因在不同的情况表现的高低做分组,发现了在不同发育时期以及在相同非生物逆境处理下的不同部位LEA蛋白的表现量有所不同。接着分析LEA基因与转录因子基因间的表现关联性,首先使用相关系数分析,此方法可以直接看出LEA基因可能和哪些转录因子有直接的关系,接着利用Liquid association进一步去探查在相关系数分析里可能忽略的多方关系。最后,从经过分析后的大量资料采取有用的资讯,建立基因表现的网络关系。另外,辅仁大学秦浩刚等则用微阵列资料(Microarray Data)探讨了水稻品种间基因表现差异。
模式识别在工程上的一个重要应用就是用来区别不同声音的模式。在工程文献中,大部分的方法都假设时间数列是一个服从高斯分布的信号加噪声的模式,然后再发展出能计算观察的时间数列的判别函数。中华大学罗琪等以两个人说中文的声音为例,提出了一种双变量时间数列的统计频谱估计与判别分析方法。作者假设两个人说中文字“芝麻开门”的频谱是未知的。由样本频谱估计未知频谱,再利用样本频谱的抽样分布来建立未知频谱的置信区间及假设检验。最后采用由频域近似所得的判别函数去辨别两个人说中文字“芝麻开门”的声音模式。由于每个人在录音时同时有左右两个声音的时间数列,所以也考虑此两个数列的交叉频谱、相位频谱与同调性的估计。研究的结果得到十位录音者共45组两两录音的前40个声音资料,它的平均错误率只有约1.528%,由此可知用时间数列频域的判别分析方法辨别两个人说中文的声音模式的效果是相当不错的。
4.经济与金融领域
对于货币和财政政策而言,估计潜在产出和产出缺口一直以来都是一个非常重要的问题。针对这个目的有一系列方法,包括单因素非趋势法,多元滤波方法,系统方法和结构的VAR方法。所有这些方法的共同点是假定对所有未观测到的潜在GDP单位根都存在。然而这个假定对于季节调整后的美国和大多数的欧洲国家的数据是合适的,但对台湾经济却不适合。台湾的宏观经济数据几乎都未进行季节调整,季节单位根必须体现在模型中。东华大学林金龙分析了季节因素对各种潜在产出测量的影响。为了得到模型的稳健性和其结果对未来NAIRU和失业缺口方面变动的敏感性,要区分NAIRU的种类,失业缺口的情况。实证分析表明了季节行为的重要性。从单位根向季节单位根的转换提高了估计台湾潜在GDP和产出缺口的效率,提供了更多关于执行货币政策和财政政策的信息。
上海财经大学葛守中基于当前世界经济危机的视角对国际货币基金组织2001版政府财政统计进行了研究。修订于亚洲金融危机之后的IMF《2001政府财政统计(GFS)》作出了四大革命性变革:扩大核算范围;以权责发生制取代现金收付制;重新定义财政收入和支出;废弃财政赤字,建立一组新的核心指标体系。作者认为,修订后的2001GFS确实更能及时发现政府财政运行的脆弱性根源。
辅仁大学刘正夫以台湾的股票市场为例讨论了马尔可夫伯努力试验在股票投资报酬中的应用问题。作者利用伯努利试验来描述股票操作方法以及推导投资报酬,并在马尔可夫概率模型下,计算投资报酬的数学期望值,由此期望值推算出在特定涨跌幅门槛下,期望报酬为正的充要条件。另外,由程序模拟多次交易下的平均报酬显示,投资报酬会随着交易次数的增加而增加。最后,利用台湾的股市资料,验证此模型及实际报酬,也得到不错的结果。
高雄大学林士贵等讨论了跳跃风险下状态转换模型可节约参与型保单循环评价公式在股价指数中的实证应用。Hamilton(1989)提出状态转换模型,说明受到景气扩张与衰退的影响,股价有不同变动,然而观察股价指数发现,当有重大信息来临时,股价有跳跃现象,因此引入跳跃风险下状态转换模型,以达到更精确描述报酬率的变动过程。作者的研究分为两部分:理论部分,假设投资组合价值为状态转换模型、跳跃风险状态转换模型下使用Liao,Chang,and Lin的循环评价公式,定价可解约参与型保单的保费。实证部分,以1999--2008年的31当股票指数为研究样本,说明股价指数有状态转换及跳跃现象,利用EM算法估计模型的参数,以SEM算法计算估计参数的标准差,并使用LR检定有29档指数说明跳跃风险下状态转换模型适合描述股价指数。
外生随机需求冲击在供应链中往往扮演举足轻重的角色。为了能在这一不确定性因子存在的情况下,精确评价供应链的价值,并分析市场参数对供应链价值的影响程度,政治大学王弘试图建立一个含有外生随机需求冲击因子的二阶序列式动态供应链模型,采用连续时间形态的实质期权方法,尝试供应商在产品的最佳制造量与零售商在产品的最佳销售量的决策下,寻找供应链价值的封闭解。除此之外,作者还得到了市场无风险利率与外生随机需求冲击因子的供应链价值呈现负相关的结论。
此外,专家学者还对抽样调查如何满足不同层次政府数据信息需求问题、统计数据质量问题、统计法的修订和实施等问题进行了探讨。
国家统计局石庆焱利用分层贝叶斯(Hierarchical Bayes)方法建立了一个小区域估计模型,对县域农民人均纯收入进行估计。作者的实证分析结果表明,利用小区域估计方法对县域农民人均纯收入进行估计是可行的。这一结论为抽样调查中如何满足不同层次政府对数据信息的需求提供了一个新的思路和解决办法。
统计数据质量问题严重影响着政府决策和社会公信力。四川省统计局熊祖辕运用博弈论分析方法,分析、说明了声誉资本大小、失信惩戒力度、报假收益及监督力度是影响统计数据失真的重要因素,证明了引入统计信用可以在有限的成本下防范数据失真,并提出完善统计信用惩戒制度是统计信用发挥作用的制度基础。
国家统计局宋德家对统计法修订中的若干理论问题----统计调查项目的管理、统计数据质量的保障、统计资料的管理和法律的监督检查----等进行了分析和解读。作者认为,总体上看,2009年修订后的统计法,是一部在适应市场经济体制和经济社会发展的新形势下,能够比较有效地组织统计工作、能够基本保障统计数据真实可信、基本符合国际通行统计规则的统计法律。
国家统计局统计科学研究所 石庆焱
中央财经大学统计学院 高 倩
|