哪个省市的旅游景点多?
要说景点,那得看两个指标:一是是否有A级景区(这个A级景区不是旅游风景区,而是国家旅游局评定的景区等级);二是该景区是否在互联网上能够搜索到门票价格信息。二者结合起来,可以较为全面地反映一个地区的知名景区情况。 这里,我们根据2016年5月30日携程旅行网公布的“国内景区数据报告”,选取国内80家5A级旅游景区作为研究对象,利用Python进行简单的数据挖掘,看看哪个省份的景点最多、最热门。
在80个5A级旅游景区中,有72个景区门票价格信息可以在网上查到。对于剩下那8个没有门票价格的景区,我们采用替代变量法对其门票价格进行估计。具体方法如下:如果景区某年的游客接待量高于上一年,且高于所有同类型景区的接待量均值(即排除极端情况),则取其平均门票价格作为其当年的门票收入;否则,取其前一年的门票收入作为其当年门票收入。这样处理后的数据仍可用于比较分析。 经过处理,我们有72组(80个景区-8个替代表景区)可比的年份间数据。对每组数据进行标准化处理,得到标准分数,然后对其进行单因素方差分析(ANOVA),得到F值以及对应的P值。如果P<0.01,说明地区间的景点数量差异在0.01的水平上显著;反之,则不显著。经检验,各省市区的景点数量存在显著差异。
从F值来看,景点最多的前三名依次是云南、西藏和四川;而广东则位列最后。 从P值来看,有9个省份的景点数量在0.01的水平上显著少于平均水平;有4个省份则显著多于平均水平。可以说前面9个省市属于“普通省份”,后面4个省份则属于“景点大省”。 对这72组数据还进行了多重比较,结果与前述单因素方差分析基本一致。其中,与平均值相比,云南、西藏和四川的景点数量分别多了2.38、2.33和2.32倍,重庆的景点少了1.57倍,湖南的景点少了1.45倍,陕西的景点少了1.37倍,湖北的景点少了1.18倍,江西的景点少了1.17倍,河北的景点少了1.13倍,黑龙江的景点少了1.07倍。
值得注意的是,在这“九省十强”之中,除了河南以外,其他省份都是西部省份或少数民族聚居区。这说明,西部地区(特别是藏族、苗族、彝族等民族聚居区)的旅游业似乎更发达。这可能是因为这些地区自然风光比较壮丽、人文景观比较独特而且距离经济发达的地区相对较远,因此在旅游者心目中具有比较高的“吸引力”。