西安市作为陕西省的省会,十三朝古都,世界级历史文化名城,丝绸之路起点,历史文化悠久,遗迹丰富,留下了一大批历史文化遗存,如兵马俑、大唐芙蓉园、华清宫、汉未央宫、隋大兴城、唐大明宫等,是中国最佳旅游目的地。高A级景区(4A、5A)级景区作为一个城市乃至全国的旅游形象代表,对研究城市乃至地区具有极高的价值,本研究选取西安市高A级景区和具有代表性景区作为研究对象,对其进行旅游品牌分析。
2.数据来源
(1)本研究品牌影响数据来自携程网游客评论,携程网在旅游服务方面是我国最大、综合性最强的服务平台,游客信息也是经过实名认证的,可靠性较强。本次样本选取西安市高A级景区(4A、5A)级景区游客评价,考虑到个别景区没有门票服务,游客无法进行评价,摘除个别景区外,对各景区前200条游客评论进行收集,抓取游客评论4054条。
(2)本研究分析数据来源于网络收集、景区咨询和游客问卷调查。
3.研究方法
(1)确定研究目标后,考虑到影响城市旅游品牌影响因素较多,为了直观明了确定因素影响,本文采取文本可视化法对网络数据进行语料库建立,网络数据采取利用后羿采集器对携程网研究样本游客评论进行收集,因为抓取的数据较杂,很多偏向口语化,必须对其进行清洗,借助Rost Content Mining软件对数据进行内容挖掘,首先对其进行分词、频词分析,清洗摘除部分不合标准、辅助词汇,最后在进行可视化标签云处理。
(2)根据筛选的频词,找到游客关注点,结合资料收集,针对性进行问卷设计,针对游客景区游客到访率、游客归属地、游客旅游景点数量、游客获取信息渠道、游客游玩景区原因,游客留下最深印象等数据进行统计,得出研究结论。
三、研究分析
(一)文本可视化分析
对携程网评论抓取分词后进行频次分析,通过软件功能性分析可得出高频词汇,考虑到有些词汇如很多、有的、一些、非常等对研究意义不大,对其进行清洗,选择排名前60高频词汇,得出下表1,以及游客评论关注度较高的标签云图(图1),标签云图中词的大小和出现频率呈现正相关,频率越高,字越大。
从下表1游客评论高频词汇统计可知,绝大部分是名词,形容词和动词占据相对较少。因为景区名称原因,“城墙”“芙蓉园”“大唐不夜城”“海洋馆”“大慈恩寺”“烽火台”“兵谏亭”等出现频率较高,其中排名首位的是“城墙”,西安城墙作为中国规模最大,最完整的城墙,西安最具特色代表之一,是游客关注度较高的点。“丝绸之路”“出土文物”“珍藏”表达了西安的文化底蕴,西安作为丝绸之路起点,文化底蕴深厚,文物典藏丰富。“游客”作为游玩的主体,“游览”“游玩”作为游客旅游活动的行为动作,出现频率次之。“方便”“值得”“性价比”“舒服”“舒适”等表达了游客游览后的体验,“面积”“卫生”“住宿”“面食”体现了一个景区的服务质量,“创意”“绿化”“绿色”体现了景区的环境氛围,“完整”“全面”“完美”“完善”“扩建”体验了景区的完整程度,这些都是游客关注的重点,这直接影响游客对该景区的满意度和重游意愿。“人山人海”“流连往返”说明游客反映景区人多,但是更多游览后感觉还是流连往返,可游览性较强。
表1 前60位游客评论高频词汇表
序号 |
词条 |
词频 |
序号 |
词条 |
词频 |
序号 |
词条 |
词频 |
1 |
城墙 |
590 |
21 |
佛像 |
37 |
41 |
兵谏亭 |
17 |
2 |
游客 |
331 |
22 |
唐玄宗 |
37 |
42 |
节目 |
16 |
3 |
方便 |
321 |
23 |
人山人海 |
35 |
43 |
卫生 |
15 |
4 |
值得 |
317 |
24 |
早点 |
35 |
44 |
完善 |
15 |
5 |
导游 |
286 |
25 |
佛塔 |
34 |
45 |
住宿 |
15 |
6 |
芙蓉园 |
212 |
26 |
珍宝 |
33 |
46 |
扩建 |
14 |
7 |
游览 |
211 |
27 |
院门 |
28 |
47 |
院落 |
12 |
8 |
游玩 |
191 |
28 |
绿化 |
26 |
48 |
绿色 |
12 |
9 |
面积 |
115 |
29 |
创意 |
25 |
49 |
舞台剧 |
11 |
10 |
海洋馆 |
92 |
30 |
城南 |
24 |
50 |
流连往返 |
11 |
11 |
性价比 |
85 |
31 |
烽火台 |
23 |
51 |
旅游团 |
9 |
12 |
城门 |