如何利用Python网络爬虫获取旅游景点信息

今天就跟大家聊聊有关如何利用Python网络爬虫获取旅游景点信息，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。

创新互联公司，为您提供成都网站建设、成都网站制作、网站营销推广、网站开发设计，对服务围栏护栏等多个行业拥有丰富的网站建设及推广经验。创新互联公司网站建设公司成立于2013年,提供专业网站制作报价服务,我们深知市场的竞争激烈，认真对待每位客户，为客户提供赏心悦目的作品。与客户共同发展进步，是我们永远的责任！

爬虫系列：

当我们出去旅游时，会看这个地方有哪些旅游景点，景点价格、开放时间、用户的评论等。

1、项目目标

获取网站的景点名称、开放时间、精彩点评、价格等信息。

2、涉及的库和网站

先列出网址，如下所示：

网址：https://go.hao123.com/ticket?city=%E5%B9%BF%E5%B7%9E&theme=all&pn=1

网址city=%E5%B9%BF%E5%B7%9E指的是广州这个城市、pn指的是页数。

需要用到的库：requests、lxml、pprint

3、具体实现

导入我们需要的库

import requestsfrom lxml import etreefrom pprint import pprint

导入库之后，我们定义一个class类，然后定义一个init方法继承self再定义一个主函数main，定义一个init方法：首先准备url地址，headers，如下图所示。

定义一个请求函数，获取响应数据函数：

请求到数据后，我们需要把这个数据进行解析：

获取景点名称二级页面链接：使用xpath查找链接路径用谷歌浏览器选择开发者工具或者按F12,选择Elements按数字1、2操作找到旅游景点名称二级页面链接。

根据分析，我们可以撸下代码。

获取二级页面链接后，发送请求获取响应，解析数据。定义一个字典，保存景点名称、开放时间、精彩点评、价格。使用判断语句判断里面内容是否是空的。

最后定义一个main函数，如下图所示。

4、效果展示

点击绿色按钮运行，将结果显示在控制台，如下图所示。输入你要爬取的页数。

5、小结

不建议抓取太多数据，容易对服务器造成负载，浅尝辄止即可。
希望通过这个项目，能够帮助大家更好的了解旅游景点。
欢迎大家积极尝试，有时候看到别人实现起来很简单，但是到自己动手实现的时候，总会有各种各样的问题，切勿眼高手低，勤动手，才可以理解的更加深刻。

看完上述内容，你们对如何利用Python网络爬虫获取旅游景点信息有进一步的了解吗？如果还想了解更多知识或者相关内容，请关注创新互联行业资讯频道，感谢大家的支持。