现学现用:追女朋友必不可少的Python技能

朝十晚八 2018-12-09 16:55:00
编者有言:多喝热水太敷衍,日常坚持不断的嘘寒问暖反而显得温馨。程序员怎么用自己最擅长的事追到女神?本文将给你一些实用建议。

 

一、背景

 

上班的日子总是3点一线——家里,公司和上班的路径,对于我这样一个特别懒的人来说,经常遇到上班路上下雨了,而我却没带伞,多么痛的领悟。

 

最近对Python有一种狂热的学习热情,写了4年多的C++代码,对于Python我不能说简单,但是它做东西确实太快了,现有的第三方资源真的炒鸡多,用的我也是不亦乐乎。

 

除了上班忘记带伞,每天重复性的工作还有很多,比如上下班打卡、每个礼拜的周报,还有如果有关心的女神,也可以做定时发送心里话,或者定时提醒等各种服务。

 

有时候我就会想,如果有一个人能按时提醒我就好了,不过这种想法也就停留了那么几分钟,然后就被自己pass掉了,因为别人也可能忘记啊……

 

那么这件事是不是可以交给程序来做呢?毕竟程序可是会老老实实的做重复性的工作,而且乐此不疲。

 

上述问题的场景大多都是需要程序在指定时间、或者指定场合提醒我们该干什么了,本篇文章就定时天气提醒服务来做开篇,讲述使用Python怎么完成这样一个任务,既然这样,那我们就开始构思我们的程序吧。

 

二、构思

 

看过背景中的需求描述,要实现这个功能,我们需要解决以下这么几个问题:

 

1、爬取天气信息

2、动态获取指定城市天气

3、发送天气信息给指定微信好友

4、定时触发爬取动作

5、怎么关联微信账号

 

下面我们将一步一步解决上述几个问题,并实现我们的需求。

 

三、爬取天气信息

 

我们解决问题的顺序不是简单的按照12345这样,而是会按照思考的顺序来。

 

首先来解决问题1:

 

对于使用过爬虫的同学来说,爬取天气信息并不难,之前也了解过一些爬取web信息的代码,简单的爬虫无非就是那么几步:

 

  • 确定爬取的url,使用浏览器打开

  • F12查看网页布局信息

  • 使用xpath或者bs4进行节点定位

  • 拿到页面信息

  • 自己拼接爬取到的信息

  • 写文件、写数据库、发送网络等等

 

这里贴下我之前写的几个简单爬虫:

 

  • Python-爬取校花网视频(单线程和多线程版本)

    https://www.cnblogs.com/swarmbees/p/10017073.html

  • Python-爬取妹子图(单线程和多线程版本)

    https://www.cnblogs.com/swarmbees/p/10016919.html

  • Python爬虫Scrapy(一)-我爬了boss数据

    https://www.cnblogs.com/swarmbees/p/10011898.html

 

下面是爬取城市天气的python方法,需要注意一点的是getWeath接口的参数city_code,这是一个全国城市编码,每个城市都是唯一的,这个表格我已经整理成了一个txt文档,后续放源码的时候会一并提供。

 

 

上述方法可以获取一个城市的天气信息,并储存在一个字典中,我们要发送给好友,还需要对其进行字符串处理,处理代码如下:

 

 

全国城市编码如下图所示,每个城市的编码都是一个9位的数字组成,获取天气信息时是通过指定该编码进行查询。

 

 

四、发送给指定好友

 

解决问题3:发送消息给好友。

 

解决问题5:怎么关联微信账号,使用wechat_sender库。

 

我们自己爬取到的天气信息怎么和微信能扯上关系呢?

 

可以看看我以前提到的《微信聊天机器人-存储好友分享消息》,简单来说就是登陆一个web版本的微信账号,在我们的电脑上,做这么一个机器人使用了库wxpy,要想和这个机器人勾搭上,那我们就需要请出我们今天的重磅嘉宾wechat_sender。

 

  • 《微信聊天机器人-存储好友分享消息》

    https://www.cnblogs.com/swarmbees/p/9996547.html

  • wxpy

    https://wxpy.readthedocs.io/zh/latest/index.html

    https://github.com/youfou/wxpy

 

wechat_sender是基于wxpy和tornado实现的一个可以将你的网站、爬虫、脚本等其他应用中各种消息(日志、报警、运行结果等)发送到微信的工具包,有了它,我们的消息就可以顺利的发送到我们的微信账户了。

 

  • wechat_sender

    https://wechat-sender.readthedocs.io/zh_CN/latest/index.html

  • tornado

    https://github.com/tornadoweb/tornado

 

交互流程

 

如上图所示,首先使用wxpy登陆微信机器人,当然这个机器人使用的是我们自己的微信账号。

 

这里需要特别注意一点,《微信聊天机器人-存储好友分享消息》中讲述的机器人进入命令状态是使用的embed()方法,在这里我们不能使用该接口了,我们需要换成上述交互流程的很关键的一步,使用listen接口进行监听,这样我们的web工具才能发送消息给机器人,建议仔细阅读一遍wechat_sender说明文档,内容不多。

 

登陆微信机器人

 

爬取到天气信息以后,使用wechat_sender中的Sender类直接发送消息给微信机器人,下属代码中尝试是用了多种发送消息的方式,代码中都有详细注释,可自行阅读。

 

 

登陆微信机器人,下边代码中第12行非常关键,这一行就是用来监听外部程序发送消息的。

 

 

五、城市编码

 

解决问题2:根据配置的城市名称动态获取城市编码,然后请求数据。

 

由于没有接口可以直接获取城市编码,因此这里我们自己封装了一个类来进行管理城市名称和城市编码,拉取城市天气时,只要输入城市名称,那么城市编码即可通过该类获取到,具体代码如下:

 

 

六、定时任务

 

解决问题4:定时发送任务

 

我们的需求是每日定时拉取天气信息,并发送给指定好友,Python有一个APScheduler库,支持定时任务,具体使用比较复杂,我也没有仔细研究。这里我们只是需要使用一个定时任务,其他不做介绍,有兴趣的同学可自行研究。

 

在研究定时任务的过程中,一直没有找到BackgroundScheduler类add_job时,回调函数怎么传递参数,因此这里我封装了一个类,让定时任务和任务回调处于一个域内,这样参数就可以放在类的成员变量未知,不需要传递了,哪位大神如果会操作,可以评论区指出,非常感谢。

 

 

后期出现不同类型任务时,我们就需要再封装新的类。

 

上述MyJob类有2个接口,一个是任务调度器回调接口,不需要我们调用,另一个是加载任务接口,这个任务参数是一个标准的json串,由任务触发时间和具体的任务列表组成,任务触发时间主要是给调度器使用,任务列表就是调度器触发时的回调函数需要执行的任务数量。

 

 

如上述任务json串来说,我们的任务id为my_jobs,在每天的6:30和17:30,我们需要执行items列表所指出的任务,任务列表是一个列表,列表中存储的是具体任务,receivers代表任务执行完毕需要发送的好友,city是爬取的天气名称,测试效果如下图所示:

 

 

 

由于任务调度器不是一个阻塞性的程序,如果我们不在主线程进行阻塞程序,那么程序就会直接退出;如果阻塞了主线程,那么任务调度程序也将会被阻塞。

 

因此这里在添加任务调度后,我们开启了一个子线程,主要就是为了不让主线程退出,这样做其实不合理,但是我们这里仅仅是为了演示,对这些问题的进一步处理我们之后会有文章来详细分析。

 

 

喜欢的同学可以自己尝试完成下这个小程序,或者选择一个类似的场景进行处理,本篇文章中还有几个需要优化的地方,由于篇幅问题,我们之后再进行讲解:

 

1、定时任务做成windows服务,这样更优雅,随开机启动

2、发送消息给微信好友换成发送邮件给指定邮箱

 

七、资源下载

 

需要全部代码的可以到CSDN直接下载:

Python-定时爬取指定城市天气,发送给关心的微信好友

https://download.csdn.net/download/qq_30392343/10809337

最新评论
访客 2019年03月21日

Wow it is really wonderful and awesome. http…

访客 2019年03月19日

牛批,醍醐灌顶

访客 2019年03月18日

似乎很屌 ~

访客 2019年03月08日

两台ECS,windows server 2016 + sql server 20…

访客 2019年03月07日

介绍的devops工具链不完整呀 开源的应该以jenkins为核…

活动预告