1 引言
我国地域辽阔、人口众多,体育水平也随之在空间上呈现出多样化的差异。探究体育水平空间分异现象,即用地理学的视角观察并解决体育领域当中的问题,属于体育与地理的共轭领域。以往的研究多运用传统统计学的方法分析体育水平的空间分异[1-4]。近年来,空间统计及回归分析等量化研究方法在国外的网球、橄榄球、篮球、澳式足球、棒球、体育设施及体育旅游产业等广泛的体育领域得到了应用[5-11]。相对而言,国内该方面的研究多是集中在对理论的探讨[12-14]或者有限的只是从规划和探讨等角度对其应用进行了初步的研究等[15-17]。利用地理信息系统中的空间统计方法可以将空间信息与属性信息进行统一的考虑,研究特定属性之间或属性与空间位置的关系,根据多样的数据来研究空间事物的分布特征等信息。因此,本文针对我国体育水平空间分异这一问题,利用ArcGIS软件空间统计工具进行空间异质性分析。另外,进一步运用回归分析的方法就体育水平的影响因素进行探究,发现显著因子,从而有助于在实际中充分调动各种积极要素,为合理布局我国体育资源做出一定贡献。
2 研究方法
空间异质性指空间中的每个位置具有一定程度的内在独特性[18],即每一个空间区位上的事物和现象都具有区别与其他区位上的事物和现象的特点[19]。本论文旨在通过对一些具有空间特征的体育属性数据进行空间统计分析来探索和揭示我国各省份体育水平的空间异质性。总体而言,有两类空间分析方法,一类为全局统计,主要探索某一属性在区域中的分布特征;另一类为局部统计,通过对子区域中信息分别分析,探查区域信息变化是否平滑或存在突变,即是均质还是异质。两种统计的指标分别为全局G统计量和局部G统计量。
2.1 全局G统计量
全局G统计量用于探测整个区域内是否存在高/低值聚类。
全局G统计的公式如下:
(1)
其中和为要素i和j的属性值;是一个空间权重矩阵,表示要素i和j之间的空间权重值;是数据集中要素的数量;i≠j,表明要素i和j不能是同一要素。
z得分可通过下面的公式来计算:
(2)
这当中 (3)
(4)
利用z检验可对其进行统计推断,p值是标准化的z得分,可通过正态分布的方法来获取[20],从而作为检验统计量对零假设进行显著性检验。一般显著性水平取0.05(与95%的置信度相对应,0.05是与之相对应的临界p值),p值大于0.05,则接受零假设,反之便可拒绝零假设,即空间要素或与之相关的属性值在空间上非随机分布。在此前提下,当G>0时,表明研究区内存在高值聚集区;当G<0时,表明研究区内存在低值聚集区。
2.2 局部G统计量
局部G统计量用于探测区域i和邻域j是否存在有统计学意义的高值聚集区或低值聚集区[21]。
Getis-Ord局部统计可表示为:
(5)
其中是要素j的属性值,是要素i和j之间的空间权重,n为要素总数,且:
(6)
(7)
统计是z得分,因此无需做进一步的计算。
局部G统计同样可以利用z检验对其进行统计推断。z得分即,当z>1.96(同样与95%的置信度相对应,1.96是与之相对的临界z得分)时,表明研究区域内存在(统计学意义的)高值聚集区;当z<﹣1.96时,表明研究区域内存在(统计学意义的)低值聚集区;介于﹣1.96和1.96之间的为中间过渡带,表明存在不具有统计学意义的聚集性。
2.3广义线性混合模型
回归分析利用的是广义线性混合模型GLMM(General Liner Mixed Model)。GLMM的基本模型为:
(8)
(9)
其中Y:n*1维观测向量;
μ:观测的观测向量;
():单调可微连续函数g()的逆函数,可根据观测向量的不同分布类型选择适宜的连接函数g(),将观测的均数向量与模型参数联系起来;
X:协变量矩阵;
Z:随机效应变量矩阵;
β和γ分别是模型的固定效应和随机效应参数向量,随机效应γ假设服从均数为0和方差矩阵为G的正态分布,即γ~N(0,G),Var(γ)=G。
从数学原理上讲,GLMM是在广义线性模型的基础上加入随机效应,因此能够有效地解释数据间的相关性,处理过度离散、纵向研究等资料。
3 实现过程
3.1空间异质性分析
空间异质性分析以省级行政区划为单位,分析对象为各省的体育水平,该指标由各省输送世界冠军的水平、大球项目足球和篮球的水平、全运会竞技水平、国民体质水平、体育教育水平及体育场馆数量水平经量化、标准化去量纲、相加获得。
3.1.1 数据来源与处理
(1)数据来源 各省世界冠军的数据源于“国家体育总局资料库”。足球数据源于“雪缘园足球资料库”。篮球数据源于“新浪中国篮球数据库”和“中国篮球协会资料库”。全运会数据引用于罗智发表的相关文献[22]。国民体质水平数据源于《2010年国民体质监测公报》。体育场地数据源于《第四次全国体育场地普查有关数据》。体育教育水平数据源于“全国招收体育训练专业高校简介”和“教育部高校体育学学科评估”及“全国体育类院校排名”。
(2)数据处理 世界冠军的分析指标采用的是近32年各省世界冠军人次与其人口数的比率,根据输送地将冠军人次落实到各省进行比率计算,单位人口选择的是100万。足球水平的分析指标采用的是各省球队近20年来在我国顶级足球联赛中的积分值,通过所在地将参赛球队积分落实到各省;篮球水平的分析指标采用的是近19年来各省球队在我国顶级篮球联赛中的胜率值,同样通过所在地将参赛球队胜率值落实到各省;全运会竞技水平则采用的是六运会以来历届全运会各省总得分。为突出各地区现有的体育竞技实力,同时出于竞赛水平在时间上的依存关系,增加不同年份成绩之间的可比性,在此针对足球、篮球及全运会成绩引入了时效权重系数,借此突出各年份成绩对现有竞技实力影响的重要程度。时效权重系数的设置借鉴了罗智的相关研究 [22],在方便计算的前提下,取最近的一个全运会周期的权重系数为1,其余按时间接近程度依次为0.9、0.8、0.7和0.6 ,以此作为权值进行加权平均值的计算。国民体质水平采用的是《2010年国民体质监测公报》中的国民体质综合指数。体育教育水平采用的是教育部针对各省招收体育训练专业的高校体育学科进行的学科评估打分结果,对于分数缺失的高校参考“全国体育类院校排名”进行了补充,同样根据学校所在地落实到各省。体育场地水平采用的是第四次全国体育场地普查所得到的各省体育场地相关数据,出于弱化各省面积大小对体育场地数量影响的目的,采用单位面积(10000㎞2)所拥有的体育场地数量。
在此基础上,对以上各项数据进行了标准化去量纲,然后将各省的各项结果相加从而获得反映各省(市、自治区)体育水平的综合指标——体育指数。
表1 我国各省体育指数统计表
省份 |
体育指数 |
省份 |
体育指数 |
省份 |
体育指数 |
北京 |
4.251 |
浙江 |
2.987 |
川渝 |
2.225 |
天津 |
2.870 |
安徽 |
0.968 |
贵州 |
0.456 |
河北 |
1.360 |
福建 |
2.208 |
云南 |
0.899 |
山西 |
1.548 |
江西 |
1.793 |
西藏 |
0.259 |
内蒙古 |
1.120 |
山东 |
4.295 |
陕西 |
1.591 |
辽宁 |
4.779 |
河南 |
1.948 |
甘肃 |
0.500 |
吉林 |
2.734 |
湖北 |
1.929 |
青海 |
0.199 |
黑龙江 |
1.664 |
湖南 |
1.760 |
宁夏 |
0.544 |
上海 |
5.282 |
广西 |
1.621 |
新疆 |
1.170 |
江苏 |
3.617 |
粤琼 |
4.911 |
|
|
由于数据缺失,港澳台三地不包括在研究区内。另外,由于重庆市及海南省分别是于1997年1988年从四川省和广东省分离,而部分统计数据的时间区间跨越了这两个时间点前后,从而导致重庆和海南两地的数据有一定缺失,而相应的四川和广东两地的数据有所增加。因此在分析中分别将重庆和海南纳入四川省和广东省,分别以川渝和粤琼表示。
3.1.2全局分析
全局General G分析结果显示如下:
图1 高/低聚类报表图像
表2 General G汇总
参数 |
数值 |
General G 观测值 |
0.040287 |
General G 期望值 |
0.035714 |
方差 |
0.000004 |
z 得分 |
2.387499 |
p 值 |
0.016963 |
结果显示:p值小于检验水准0.05,因此可以排除零假设,即与省域面要素相关的体育属性值在空间上非随机分布。全局G统计量0.040287大于0,提示研究区内存在高体育水平聚集区。
3.1.3局部分析
局部Getis-Ord Gi*分析结果显示如下:
图2我国体育水平局部G统计分析结果图
表3 局部G统计结果z得分与p值表
省份 |
Gi-Z Score |
Gi-P Value |
省份 |
Gi-Z Score |
Gi-P Value |
黑龙江 |
1.175 |
0.240 |
河南 |
0.908 |
0.364 |
内蒙古 |
1.040 |
0.298 |
江苏 |
2.367 |
0.018 |
新疆 |
-1.975 |
0.048 |
安徽 |
2.401 |
0.016 |
吉林 |
1.738 |
0.082 |
川渝 |
-2.528 |
0.011 |
辽宁 |
1.881 |
0.060 |
湖北 |
1.582 |
0.114 |
河北 |
1.788 |
0.074 |
上海 |
1.814 |
0.070 |
甘肃 |
-1.918 |
0.055 |
浙江 |
2.194 |
0.028 |
北京 |
1.788 |
0.074 |
江西 |
1.445 |
0.148 |
山西 |
1.220 |
0.222 |
湖南 |
0.608 |
0.543 |
天津 |
1.788 |
0.074 |
云南 |
-1.225 |
0.221 |
青海 |
-2.455 |
0.014 |
贵州 |
-0.519 |
0.604 |
陕西 |
-0.844 |
0.399 |
福建 |
1.042 |
0.298 |
宁夏 |
-0.814 |
0.416 |
广西 |
-0.352 |
0.725 |
山东 |
1.954 |
0.051 |
粤琼 |
-0.123 |
0.902 |
西藏 |
-1.975 |
0.048 |
|
|
|
表3显示:z(Gi)为正值的有18个省份,其中z(Gi)大于1.96的地区包括江苏、浙江和安徽,这三个省份构成高体育水平聚集区;而z(Gi)为负值的有11个省份,其中负值绝对值大于1.96的地区包括新疆、西藏、川渝、青海,这四个省份(四川和重庆在此算作同一省份)构成低体育水平聚集区。以ArcGIS聚类与分布制图工具实现分析结果的可视化,如图2所示,z(Gi)值大于1.96的区域在图上显示为深红色,表示的是具有显著性的高水平聚集区;z(Gi)值小于-1.96的区域在图上显示为深蓝色,表示的是具有显著性的低水平聚集区;其他地区的z(Gi)值介于±1.96之间,不存在有统计学意义的聚集性,为中间过渡带。总体表现为:高水平的长三角省份和低水平的西南省份及部分西北省份在空间上趋于聚集。
3.2 回归分析
影响因子的预设借鉴了王良建等的相关研究 [23]。预设的影响因子有高程、年均气温、年均降水量、人口密度、优秀运动员人数、专职教练员人数、体校从业人员人数、学校体育场地面积、体育科研项目数量、人均GDP、居民消费水平、体育彩票公益金、体育单位数量、公益指导人员数量等。体育指数作为目标因子。
3.2.1数据来源与处理
(1)数据来源 高程、年均降水量、年均气温及人口密度数据源于地理科学空间数据库。有关优秀运动员、专职教练员及体校从业人员的数据源于《中国社会统计年鉴2009》。学校体育场地面积数据源于《中国教育统计年鉴2009》。体育科研项目数量数据源于国家体育总局政策法规司公布的2006年-2014年体育哲学社会科学研究项目立项名单。人均GDP数据来源于“国泰安”数据库。居民消费水平数据源于《中国统计年鉴2009》。体育彩票公益金数据源于《中国彩票年鉴2009》。体育单位数量数据源于《中国基本单位统计年鉴2009》。公益指导人员数量数据源于《中国社会统计年鉴2009》。
(2)数据处理 以上数据中高程、年均降水量、年均气温及人口密度数据可满足县级尺度,其余数据均是省级尺度。针对此情况,利用源于《中国县(市)统计年鉴2009》的各县(市)人口数据和地方财政一般预算收入数据计算各县市人口和经济在全省所占的比例,再根据比例将省级尺度的“资源”的分配到县级。其中优秀运动员人数、专职教练员人数、体校从业人员人数、学校体育场地面积、体育科研项目数量、体育单位数量、公益指导人员数量均是根据人口进行分配;体育彩票公益金直接根据财政收入进行分配;居民消费水平则是将各省内各县(市)的地方财政一般预算收入比例进行标准化,再分别与各自省份的居民消费水平相乘获得。
回归分析需要的数据是txt格式的数值矩阵。因此在以上基础上,利用ArcGIS软件进行克里金插值以获取各项数据所对应的栅格表面。克里金插值需要利用到的参数步长、主要范围、偏基台和块金值的获取在GS + 9.0软件中进行。像元大小为1042m,与直接获得的栅格数据高程等保持一致。在此基础上,利用ArcGIS 转换工具集中的Raster to ASCII工具导出与各个影响因子数据相对应的ASCII文件,通过修改头文件可获得txt格式的数值矩阵。
3.2.2回归分析
结合本研究中我国体育水平空间异质性的存在、同一县(市)不同属性之间的相关性及影响因子与目标因子之间的非线性关系的特点,采用广义线性混合模型作为预测模型进行回归分析。回归分析借助R语言编程实现。主要利用到的是R语言Mass包中的库函数glmmPQL。
下表显示了回归分析所得到的显著性影响因子,即在95%的置信水平下,返回的p值小于0.05的影响因子。
表4:显著性影响因子
变量 |
变量名 |
p值 |
体校从业人员人数 |
Numemp |
0.0342 |
优秀运动员人数 |
Numath |
0.0189 |
人均GDP |
Avegdp |
0.0153 |
学校体育场地面积 |
Areaplay |
0.0247 |
专职教练员人数 |
Numcoa |
0.0285 |
体育科研项目数量 |
Numsci |
0.0143 |
人口密度 |
Denpop |
0.0359 |
高程 |
Dem |
0.0296 |
结果表明:对我国体育水平产生影响的显著性因子有:人均GDP、人口密度、优秀运动员人数、专职教练员人数、体校从业人员人数、学校体育场地面积及高程。其中,高程、人均GDP和人口密度之间本身存在相关性。我国人均 GDP和人口密度的分布情况与高程所反映的三级阶梯的地形状况基本一致,表现出自西向东逐渐增大的趋势,可以理解为由地势所决定的经济及人口状况对体育水平具有显著的影响作用。因此,发挥经济对体育的带动作用,以及充分利用人口资源优势,发掘优秀体育人才,对于提高我国体育水平意义重大。另外,由于在体育水平的衡量中引入了竞技体育层面的东西,所以不难理解优秀运动员人数作为一个显著影响因子出现。优秀运动员人数因素所体现的运动员人才基础,以及专职教练员人数、体校从业人员人数、学校体育场地面积、体育科研项目数量等所反映的竞技体育服务业水平,体现了专业性竞技体育和体育基础建设等对于我国体育水平的提升作用非常重要。
4 结束语
目前阶段,体育统计数据有限,因此在研究中存在时间和尺度上的差异。尽管采取了相关的计算方式对这一缺点进行了规避,但还是无法保证最终结果能非常准确地反映客观现实;另外,影响因素的回归分析仅仅采用了一个时间上的横截面数据,因此难以分析各影响因素的动态变化趋势。
参考文献
[1]李咸英,柳永.新形势下我国竞技运动项目的布局[J].天津大学学报,2003,5(1):87-89.
[2]吕患成,吕召. 论中国体育运动的地理分异[J].松辽学报,2007,10(4):61-65.
[3]卢福玲,白景锋.我国竞技体育发展的时空分异及影响因素[J].许昌学院院报,2005,24(5):69-72.
[4]强海东.我国竞技体育发展不均衡现象地理学分析[J].科技信息,2004,21(3):262-265.
[5]Ahlfeldt,G.M. , Feddersen,A. Geography of a sports metropolis[J].
Region et Developpement,2010,31(1):10-35.
[6]John,H. , Nicholas,W. Geographies of scale in international rugby union[J].
Geographical Reasearch ,2001,49(4):375-383.
[7]Lopez,F.A. , Martinez,J.A.,Ruiz,M. Spatial pattern analysis of shot attempts in basketball;The
case of Lakers[J]. REV INT MED CIENC AC, 2013,13(51):585-613.
[8]Geoff,W. , Matthew,B.Measuring spatial variations in sports talent development: the approach,
methods and measures of‘Talent Tracker’ [J].Australian Geographer, Carfax Press ,Oxford,
England, 2013,44(1):23-29.
[9]Boyd,T.C. , Krehbiel,T.C. An analysis of the effects of specific promotion types on attendance at major league baseball games[J].Mid - American Journal of Business, 2006,21(2):21-32.
[10]Nathalie,B.,Jean-Michel,O.etc.Investigating disparities in spatial accessibility to and
characteristics of sport facilities: Direction, strength, and spatial scale of associations
with area income[J].HEALTH & PLACE ,2007,17(1):114-121.
[11]Margaret,J.D. Central place theory and sport tourism impacts[J]. Annals of Tourism Research ,2006,34(2):332-347.
[12]史兵.关于体育地理学研究内容的讨论[J].西安体育学院院报,2006,23(1):1-5.
[13]史兵.体育地理学理论体系构建研究[J].体育科学,2007,27(8):3-24.
[14]王东旭.体育地理学理论研究综述[J].体育研究与教育,2011.
[15]程晓鹏.GIS在体育学领域中的可行性研究[J].内蒙古体育科技 ,2010,23(4):37-39.
[16]王震,史兵.关于构建中国体育文化区的讨论[J].西安体育学院院报, 2005,22(4):1-4.
[17]史兵,王宇红.关于构建国家体育地理信息系统的初步研究[J].西安体育学院院报,2007,24(2):1-8.
[18]宇林军,孙丹峰,彭仲仁,张健.城市家庭居住地选址的空间异质性分析[J].地理科学进展,
2012,31(8):1024-1031.
[19]王晓丹,王伟龙.广东省区域经济差异的探索性空间数据分析:1999-2009[J].城市发展研究, 2011,18(5):43-48.
[20]鲁风,徐建华.中国区域经济差异的空间统计分析[J].华东师范大学学报,2007,3(2):44-51.
[21]应倩,陈坤.应用G统计量分析2006年浙江省肺结核的空间异质性[J].中华预防医学杂志,2012,46(6):524-526.
[22]罗智.我国全运会竞技集团实力差异及时空变化差异[J]. 西安体育学院学报,2003,20(4):74-77.
[23]王良建,何琼峰.省际竞技体育水平空间分布的影响因素研究[J].北京体育大学学报,2009,32(10):109-112.