首页>>科研动态>>科研快讯

英国皇家统计学会2009年国际会议学术观点综述
2009-10-26   国家统计局统计科学研究所

  英国皇家统计学会(RSS)成立于1834年,是英国唯一的专业统计学术团体,也是世界上非常有影响力的统计学会。该学会实行国际会员制度,目前注册的会员来自全球50多个国家。从2004年开始,该学会将每年一度的会议范围扩大成为吸引世界各国统计学家参加,到2009年已成功地举办了6届国际会议。2009年9月7—11日在英国爱丁堡大学举行的主题为“社会变革中的统计学——175年的历程”的国际统计学术会议,共设立7个主会场和30个分会场,来自英国政府的首席科技顾问John Beddington、牛津大学的David Cox、芝加哥大学统计学院教授Stephen Stigler等11人分别在7场全体会议上发表讲话,介绍了他们各自的统计研究成果;美国、法国、瑞典、欧盟等国家和国际组织的统计学会主席也应邀到会发表演讲。本届会议共收到论文260多篇,其中特邀论文110篇,议题涉及官方统计、国际统计学会、社会变革中的普查、农业统计、统计职业标准、统计学历史、统计学教育、数据规模变化、贝叶斯统计、纵向研究、气候变化统计、军事统计学、生物信息工程、市场研究、图像分析统计、金融风险统计等。来自世界各国和地区的300多名代表出席了会议。应英国皇家统计学会邀请,国家统计局科研所派杨京英、姜澍两位同志参加了此次会议,并在会议期间开展了积极的学术与工作交流。现将本届会议的主要学术综述如下:

  一、官方统计建设

  英国、美国等国家统计局介绍了官方统计建设的经验。为提高统计公信力和保证官方统计数据质量,他们主要从五个方面开展工作:

  一是加强立法与监管。不仅要依法统计,更要加强对统计数据生产的监督。为此有必要成立专门的、独立的监管机构,为官方统计提供有力保障。

  二是官方统计必须以需求为导向,为社会与科学决策提供优质服务。

  三是必须加强统计队伍自身的建设,主要是提高统计人员业务水平。

  四是必须注重数据质量控制方法的研究。在统计过程中,做到质量评估和统计数据生产同时独立进行,要及时按评估的结果修正统计数据。

  五是必须注重统计方法研究与统计实务工作相结合。在统计工作中,统计方法研究的内容要对官方统计具有建设性、指导性和务实性。

  这五个方面的工作经验是:

  (一)官方统计的监管

  英国统计委员会是英国政府新建立的官方统计监管机构,委员会主席Michael Scholar先生在会上详细介绍了该委员会的成立过程与监管工作目标,及委员会最新的工作成果。

  根据2007年统计与注册服务法案,2008年4月英国建立了统计委员会,该委员会的报告直接提交给国会和司法部门。其任务有两个:一是管理英国最大的官方统计数据生产者国家统计局(简称ONS);二是发布《官方统计实践指南》,并对所有英国官方统计产品依据《官方统计实践指南》进行独立审查。英国统计委员会的目标是:一是确保官方统计工作的范围;二是维持高水平的职业标准;三是对官方统计进行很好地解释,以利于政策制定和符合公共利益。

  英国统计委员会在2009年初出版了《官方统计实践指南》,对官方统计的实践行动进行指导,以实现既定的工作原则和目标,该指南是英国统计立法框架中的一个新的里程碑。《官方统计实践指南》包含8项原则和3项草案。8项原则分别为:满足用户需求原则、公正和客观原则、完整性原则、方法合理性与确保质量的原则、保密性原则、合理费用负担原则、统计资源充足性原则、诚实和获得性原则。针对每项原则,《官方统计实践指南》都提出了具体的行动准则。3项草案为:统计用户参与草案、公开发布统计产品草案、利用行政资源进行统计草案。

  英国统计委员会将保证官方统计的质量和全面性,并且保证和官方统计关联的实践活动的正确性,当官方统计行为与《官方统计实践指南》不符时,委员会有责任采取行动维护《官方统计实践指南》的原则。此外,委员会有责任和权力对各种官方的统计评级,并及时发布,对影响官方统计的问题及时汇报给国会和司法部门。

  2009年7月,英国统计委员会向国会提交了首份年度统计监管报告——《英国统计委员会2008/09年度报告》。报告的主要内容包括六个部分:委员会的介绍、监管和评估报告、国家统计局报告、政府统计服务年度报告、财务与管理报告、财务会计核算报告。

  (二)官方统计的需求

  随着2008年金融危机的爆发,英国统计界对官方统计产品产生了一些质疑。例如,为什么官方统计产品没有及时准确地反映出经济的变化?来自英国的独立统计学家Jim Cuthbert先生在会上提出了他的观点,他认为英国的官方统计没有提供足够的数据来支撑对经济的判断,甚至在某种程度上对英国经济有极大的误导作用。Jim给出三个例证,分别是私人主动融资(PFI)、资源价格和经常账户赤字。以私人主动融资(PFI)为例,根据英国通用会计法案,融资被分为金融融资和经营融资两类,金融融资在资产负债表中应计入“金融租赁估值”科目。一旦私人主动融资(PFI)被公共审计部门判定属于公共金融租赁,国家统计局即将其计入资产负债表。在实际操作中,英国国家统计局不对金融租赁债务进行直接估值,而是从相关机构直接获取数据,分别作为公共部门资本存量和公共部门净借款以及金融租赁的负债。英国信息自由化法案通过后,公众获得了这些政府关于私人融资项目的数据,认真审视即可发现国家统计局在私人主动融资(PFI)统计方法上的缺陷。2006年,英国私人主动融资(PFI)合同签订总额460亿英镑,其中230亿应该计入当年政府资产负债表,但是国家统计局只计入了49亿英镑,这与230亿英镑显然有巨大的差距。虽然英国国家统计局试图从租赁费用与资本之间的差异、项目未结束就不计入资产负债表等角度阐述原因,但仍未获得公众信服。Jim认为,从上述例证说明错误的统计混淆了公共部门和私人部门的区别,从中得到最大的教训是错误的统计会改变世界本来的面目。

  (三)官方统计队伍建设

  统计人员的素质是保证官方统计工作质量的重要因素之一,来自英国和美国众多统计机构的领导者都在会议上介绍了关于建设统计专业队伍的实践经验。

  英国国家统计局的统计方法司主管Stephen Penneck先生介绍了统计公务员的职业再深造(CPD)计划。据介绍,英国国家统计局认识到官方数据的主要目的之一是为政策制定提供依据,政策种类的多样性决定统计公务员队伍需要各类专业的人才,例如经济学家、社会学家和科学家等。但是,每年毕业生中真正符合招收条件的人数并不多,因此,英国国家统计局有必要对统计公务员进行培训、不断更新工作人员的职业技能,CPD计划应运而生。

  美国统计学会主席Ron Wasserstein先生认为统计人员职业化发展道路应该多样化,这是由统计人员的多样性决定的。美国统计学会的注册统计学家有42%来自学术界、31%来自商业和工业行业、11%来自政府、另外16%来自于其他诸如咨询等服务领域。尽管过半数的成员都拥有博士学位,但成员的年龄层次、教育和职业背景还是存在一定的差异。Ron先生介绍,美国统计学会所提供的统计职业化发展服务正是有针对性的服务。

  英国皇家统计学会的统计学家Andy Garrett先生提出:在全球一体化背景下,社会对专业统计人员的需求量急剧增大,应该加强国际统计职业化队伍建设。以英国为例,随着生产数据的递增、计算能力的提高、统计分析软件的不断开发,统计数据挖掘水平得到飞速提升。各行业的统计专家越来越多地与其他国家同行业的统计专家合作办公,特别是在那些对专业化人才要求很高的行业,Andy Garrett先生认为有必要在理论领域和实践领域建立国际统计职业化认证系统。需要注意的是,这一认证系统必须有别于数学。为达到这一目的,需要进一步加强国际协作,注重统计职业化发展,提高统计人员的待遇。

  (四)数据质量控制方法研究

  以普查的统计数据质量控制方法为例,2011年英国将进行人口普查,围绕这一主题,英国国家统计局的Jane Naylor女士与苏格兰注册署负责人口普查的Peter Scrimgeour主任都主张要认真衡量风险和收益,对2011年人口普查实施“统计信息暴露控制(SDC)”,风险主要指普查信息的保密度,而统计结果的价值即是收益。Jane 女士认为,基于立法、政策和伦理的考虑,必须对普查对象的信息严格保密,实行统计信息暴露控制(SDC)可以保证统计结果尽可能地提高价值。而Peter先生则强调了吸取过去普查工作经验的重要性,他在会议上做了主题为“2011年人口普查:吸取以往经验”的发言,他指出苏格兰政府在历届人口普查期间都会建立备忘日志,记录解决过的问题以及下次普查可以改进之处,积累了很多有益的经验,苏格兰人口普查现已发生很多变化。

  英国国家统计局(ONS)提交的论文“2011年人口调查覆盖面评估和调整(CAA)”工程,主要是研究评估人口普查质量的方法。该论文指出任何普查都难以确保100%的普查覆盖率,人口调查覆盖面评估和调整(CAA)工程的目标就是尽可能地减少2011年人口普查的漏统。人口调查覆盖面评估和调整(CAA)工程的方法可以归结为6点:一是普查覆盖调查(CCS)与普查活动相互独立,普查覆盖调查(CCS)从每个地方统计机构都抽取样本,样本总人数占整个人口的1%;二是通过自动和人工方式将普查覆盖调查(CCS)记录与普查相匹配;三是需要找到那些普查覆盖调查(CCS)抽查到而没有普查到的样本;四是通过使用双系统估计(Dual-system estimation, 简称DSE)等统计方法估计漏统的数量、特点和地区分布;五是调整普查数据库;六是重复这样的调整。在整个普查覆盖调查(CCS)控制中,双系统估计(DSE)方法是人口普查评估的核心统计技术。

  来自埃塞克斯大学的Kevin教授介绍了整合历史微观普查数据(I-CeM)项目。历史普查数据是分析19世纪英国社会的重要数据依据,但是目前数据的可获得性与可计算性很差,严重影响了历史统计分析。整合历史微观普查数据(I-CeM)项目旨在建立自1851——1911年完整的普查数据库,并将数据进行计算机化处理,使数据标准化和电子化,埃塞克斯大学与英国数据档案局共同开展该项工作。整合历史微观普查数据(I-CeM)项目开展的工作包括:重整数据格式、查询和清理数据、重新进行统计标准编码、行政管理的时段划分标准化等。历史普查数据的发布将充分利用网上发布系统、GIS地图定位系统等现代方法。整合历史微观普查数据(I-CeM)将建成世界上最大、最全面的历史普查数据库。

  (五)统计方法研究

  以农业统计和环境统计方法研究为例,来自英国环境与农业科学中心的Jon Barry博士利用简单抽样的原理建立模型估计物种数量。估计物种数量是生态统计学中一个经典的命题,如何利用Hamon简单抽样平方区内的物种数量估计抽样区外的种群数量是难题之一。Jon博士首先回顾了解决方法的历史演进,Fisher et al(1943)采用在伽玛分布(Gamma distribution)中设定泊松比(Poisson rate)参数的方法,Craig(1953)假定所有物种随机分布的密度相同,采用最大似然法(Maximum likelihood estimator)进行物种数量的估计。估计方法后历经发展。Jon博士提出他的新方法,即利用肯特大学Barry et al教授提出的海床生物空间格局模型,该模型采用Matern聚类的方法,通过最大似然法估计Matern聚类的参数。

  统计学家Martin Boer先生使用混合模型在多环境实验(Multi-environment trials)中进行数量标记分析(QTLs)。多环境实验中的统计分析包括以下几步:首先选择反映各种环境之间的关联性模型,这是下一步进行多环境分析的基础。第二步是通过环境交叉发现数量标记和数量遗传特征。最后,在那些具有显著环境交叉效应的数量标记中,找到对环境协变量(例如温度和降雨等)有反映的数量遗传标记。

  二、数理统计研究的新进展

  (一)纵向研究(Longitudinal studies)

  英国布里斯托大学Harvey Goldstein研究的主题是:纵向数据摩擦及无响应的处理。他介绍了纵向研究中处理数据摩擦以及缺失值的方法,对复杂多重数据采用多重插补法。多重插补法是指给每一个缺失值都构造m个插补值(m>1),这样就产生了m个完整数据集,对每个完整数据集分别使用相同的方法进行处理,得到m个处理结果,最后再综合这个处理结果,最终得到对目标变量的估计,同传统方法相比多重插补法通过选取随机数值构造插补值,提高了有效性。Harvey Goldstein采用蒙特卡罗的马氏链方法(MCMC)。Harvey Goldstein的两个研究兴趣包括:一是统计模型在建立和分析教育考试中的应用,二是多重模型的使用方法。

  伦敦的统计专家Bianca de Stavola先生研究的主题是:“跨越三代的家庭及社会经济因素对胎儿成长的影响:1915—2002年瑞典乌普萨拉市多代生育情况研究”。Bianca通过分析乌普萨拉市多代生育数据(UBCoS Multigen)量化生物不良因素的遗传,生物的不良因素可归因于早期社会的不良环境。UBCoS Multigen包括1915年——1929年出生于乌普萨拉市的男性及女性的社会和人口统计学变量,变量数据还包括2003年以前出生的子辈和孙辈。用路径分析将祖辈和孙辈的血缘关系分为:遗传的、家族特定的以及隔代环境影响。Bianca还讨论了缺失数据的作用及模型中处理缺失数据的技巧,对标准线性回归模型结果进行比较并且得到了一些普遍的结论。

  统计学家John Bynner介绍了期刊《纵向及生命历程研究》。该期刊填补了纵向研究这一新兴领域的空白,于2009年4月份出版发行第一期,发行方式采用在线发布,全世界从事纵向及生命历程研究的人们可以免费阅读。期刊部由70个编辑部成员和4个编辑组成。John不但介绍了期刊在文章选择的倾向性,还摘取两篇论文作为例子说明这本杂志介绍的统计知识的类型。

  (二)变化数据规模(Changing data sizes)

  Michael Titterington介绍了过去30年来判别分析的发展历程。判别分析的发展带动了新的统计方法的融合,激发了很多研究者对数据集进行分析的兴趣。判别分析是根据已知对象的某些观测指标和所属类别来判断未知对象所属类别的一种统计方法。它首先需要对所研究的对象进行分类,再选择若干能够较全面地描述观测对象的变量,建立判别函数。对未确定类别的个案只要将其代入判别函数就可以判断它属于哪一类总体。常用的判别方法有马氏距离判别法、贝叶斯概率判别法以及费氏多类判别模型法。马氏距离判别法的思想就是建立马氏距离,当被判断个案距离哪个总体中的马氏距离最小,该个案就隶属于这个总体。假定有A、B两个总体,则:
           X∈A    若d(x,A)<d(x,B)
          X∈B    若d(x,A)>d(x,B)
           待判    若d(x,A)=d(x,B)
  贝叶斯概率判别法是根据被判断个案应当归属于出现概率最大的总体或者归属于错判概率最小的总体的原则进行判别的。费氏多类判别模型法是一种通过坐标变换的方式将个案类别进行划分的方法。当个案数据点的分布在原有的变量空间无法通过变量的取值来区分时,坐标变换将数据点投影到另一个坐标系,在新的坐标系中个案的不同水平差异显著,用一元方差分析的检验手段就可以将不同种类区分开来。即按照不同类之间离差平方和最大,同类之间内离差平方和最小的原则,使二者之比最大来确定判别函数。

  (三)其他

  英国约克大学的Jian Zhang教授研究的主题是“半参数格子模型的应用”。他指出两步聚类法存在的问题越来越多地引起了人们的注意,例如:功能基因组学、文本挖掘和市场研究等领域。Jian Zhang教授采用半参数格子模型族进行两步聚类分析,层估计采用BIC准则,采用公式测验来选择有效的层,用Metropolis 算法来计算模型中未知参数的极大似然估计量。模型包含两部分:一部分是拟似然,另一部分是响应变量的对数线性层分解,这种新方法与原始的格子模型相比有很多优点。特别是通过证明方差函数使得模型服从误差项的整体分布,大大增加了一般格子模型的范围。在某些条件下,从信息差异角度证明了模型可以条件识别,还证明了一步估计量的渐进性。通过两项模拟研究及将模型应用于两个真实数据库,表明半参数格子模型大大改进了原来的模型。

  英国哈特福尔大学的Neil Spencer教授研究的主题是“使用向前搜索法检测多层次模型中的错误假设”。他介绍了如何使用Atkinson 和Riani的向前搜索法检测多层次模型中的错误假设。当多层次模型存在错误假设时,不同层的残差或许不服从正态分布,此时,残差的结构可以用向前搜索法进行检测。向前搜索法是检测数据集中异常点的常用方法,同时也可以用来检测类。为了检查多层次模型中的残差,向前搜索法从一个数据集的若干样品开始,首先计算每个残差到这个数据集中心的距离。然后选择一个新的数据集,其中有一个元素比以前的数据集大,新的数据集包含距离原数据集中心最近的残差。通常新的数据集包含原数据集中的所有元素和一个新的元素。这个扩充数据集的过程持续进行下去,直到所有的残差都包括在数据集中。同时,记录下每一步中数据集外相关联的残差同数据集中心之间的距离的最小值,如果这些残差服从正态分布,这些最小距离将呈现逐步增加的趋势。但是,如果这些残差不服从正态分布,最小距离就会有突然的改变,这可以通过最小距离的趋势图看出。同其他用于检测非正态性的方法比较,向前搜索法有以下优点:它既适用于单变量又适用于多变量,同时还可以用于对样品进行聚类及估计多层次模型中的错误假设带来的影响。

  三、应用统计中的热点问题研究

  (一)金融风险统计

  金融危机凸显统计在金融风险控制中的重要性,本届会议主要围绕银行资本准备模型展开的,多位统计专家提出了对传统估算模型(即巴塞尔Ⅱ协议规定的模型)的修改意见。英国赫瑞瓦特大学Alexander McNeil教授指出巴塞尔Ⅱ协议规定的银行资本准备额估算模型具有一定的缺陷,即模型的风险衡量比较分散,是按照资产的类型来进行的,对不同资产的风险加总也只是在粗略的关联关系假设的条件下进行的,这就低估了潜在的金融风险,传统模型的漏洞在金融危机时刻尤为明显。因此有必要建立整体风险随机模型(Integrated stochastic model),正确解释造成金融市场和宏观经济风险的原始关联因素与传导过程。Alexander教授在会上介绍了他建立的整体风险随机模型,并与传统模型做了比较研究。

  (二)市场调研

  消费者购买行为与习惯是市场调研的重要课题。统计专家Dave教授和英国卡迪夫大学Anatoly教授介绍了各自的相关研究。Dave教授通过整合市场研究数据了解消费行为,其研究的数据来源是TESCO超市的1300万会员卡信息,将会员有倾向性的消费行为按照产品类别进行消费项目、时间和原因的整合统计。Anatoly教授则利用混合泊松模型(Mixed Poisson model)来研究消费者购买行为。他首先比较以往相关统计模型的检验和参数估计方法,然后提出了修改意见。例如,处理零买家(zero-buyer)问题的建议、对模型进行季节调整的建议和验证Dirichlet模型中关于品牌选择的假设条件。

  四、统计学会的发展与国际合作

  英国、美国、瑞典、法国和欧盟等国家和国际组织统计学会主席介绍了他们的工作内容、面临的挑战以及工作规划和发展等。

  英国皇家统计学会(RSS)的Andrew先生详细地介绍了英国皇家统计学会及其主要工作。1833年,英国高端技术协会成立了统计分部,该统计分部于次年成立了英国皇家统计学会,并于1838年开始出版学会的统计月刊,期刊创收已成为支撑学会工作的重要资金来源。作为英国唯一的统计专业与学习社团,英国皇家统计学会致力于支持统计学和统计学家的发展,其工作内容主要包括出版统计期刊、举办统计会议、制定和维护统计职业标准、为大学统计课程评级和举办考试、宣传统计知识、鼓励统计生产者和使用者实践、为会员提供专业化和职业化的统计培训与支持。

  美国统计学会(ASA)现任主席Sally女士介绍,美国统计学会于1839年在波士顿成立的,现今已有170年的悠久历史,拥有18000名会员,与英国皇家统计学会一样,正在积极评估现状和展望未来,并希望能够加强与世界其他国家统计学会的协作。美国统计学会的主要工作包括支持统计实践和研究、出版期刊、提供统计会议平台、提升统计教育、促进统计的准确应用、满足协会成员的需求、应用统计准则加强人类福利。Sally女士认为目前美国统计学会的工作主要面临两方面的挑战:一是如何提高统计公共认知程度;二是如何向统计专业领域和统计学会吸纳专业的统计学家。近年来,美国统计学会工作的重点主要放在六个方面:即主办统计会议、出版学术期刊、杂志、统计研究指导等出版物、提供统计培训项目、为统计研究提供资助、帮助统计学家进行职业规划和提供统计专业各类奖金。此外,美国统计学会与英国皇家统计学会之间不断加强沟通与对话,协作解决双方共同面临的挑战。

  瑞典统计学会(SSA)主席Bernhard先生介绍了瑞典统计学会的工作情况,瑞典统计学会是为提高统计学家统计科学和应用水平而设立的组织。该学会有三个分部门:调查统计部门、行业统计部门和医学统计学会。学会注重成员之间的交流,每年秋天都会举办为期一天的成员会议,讨论各式命题并选入新成员。此外,也很注重对统计教育的支持,每隔一年都会开办夏季学校,培训学生或学会成员进行统计研究。

  欧盟统计局统计专家Marie女士介绍了欧盟作为地区组织在应对官方统计挑战中的重要作用。欧盟统计局面临的挑战主要包括:不断扩展的统计服务、使统计适应新的发展、既要提高统计的透明度和可信度又要减轻成本负担而产生的两难困境等。信息技术和统计方法论的发展对欧盟统计局解决上述困境有着深远的影响。例如,充分利用跨多边数据收集的方法可以减轻统计反馈成本。Marie女士认为统计机构和人员的素质、立法条件、公众对官方统计的态度同样是解决统计问题的必备因素。现在,欧盟在建立了通用的信息通信技术工具箱、统计方法论和行政管理框架后,尝试使用小样本估值的方法取代从每个欧盟国家采取代表性样本估值的方法,这使得统计工作更加合理化。Marie女士强调欧盟的统计工作已不断扩展,通过在欧共体层面上开展各国联合统计与共同发布数据,统计得到了更广泛的使用。

  总之,随着信息化发展以及社会经济的转型和不断变革,时代对官方统计工作提出新的要求,社会各方面的需求也在不断提高,统计工作面临前所未有的挑战。为此,统计工作要与时俱进,深入开展统计理论与方法研究,建立和完善反映时代特点的新指标体系和新制度方法框架,提高数据质量和时效性,更好地为政府决策和市场需求提供优质统计服务。深入进行国际统计学术研究和广泛开展国际学术交流,可以汲取各国有益的经验,以各国统计的实践和共同的探索来迎接挑战。目前,各国和有关国际组织的统计机构,在国际范围内逐步以创建工作组的形式开展各项研究攻关与交流合作活动,解决当前全球统计工作发展中的困难和实际问题。中国应该积极参加国际统计合作和交流,以国际交流促了解,以国际交流促发展,以国际交流促创新,及时跟踪国际统计发展的最新动态,提高中国在国际统计领域的话语权,加快中国统计与国际统计接轨的步伐,推动中国统计事业迈向更高水平和更高阶段。

 

                      国家统计局统计科学研究所 杨京英、姜澍 



欢迎来到中国统计学会 中国统计科学研究网!
版权所有:中国统计学会 国家统计局统计科学研究所 不得转载
通信地址:北京市西城区月坛南街75号 邮政编码:100826 电子邮箱:yjsinfo@stats.gov.cn