大数跨境
0
0

Python 实现一个火车票查询的工具

Python 实现一个火车票查询的工具 CDA数据分析师
2017-04-18
0
导读:如何使用python实现一个查询火车票的小工具?
戳蓝字关注我们!

作者  sexycoder

本文转载自简书,转载需授权

使用 python 实现一个查询火车票的小工具


主要功能:


  1. 输入出发车站,到达车站,时间,然后返回所有的车次信息,和余票信息

  2. 支持输入附加选项查询不同的火车的类型,比如高铁,动车。

#查询上海到北京2017-04-25的高铁和动车的车票,-g -d 是附加选项 表示高铁和动车
python3 trains.py -gd 上海 北京 2017-04-25


运行结果:



1. 对12306网站买票过程抓包分析


点击查询之后,通过抓包发现返回了一个json的文件,查看这个文件,就是保存着具体车次的信息。抓包如下图所示。


请求的url 是:
GET /otn/leftTicket/query?leftTicketDTO.train_date=2017-04-20&leftTicketDTO.from_station=TJP&leftTicketDTO.to_station=TYV&purpose_codes=ADULT HTTP/1.1

发现这个请求使用的是get方法,然后传递了四个参数,一个是出发站,一个是到达车站,一个是成年人or学生,最后一个是时间。如下图:



但是有一个问题是,我输入的是天津到太原,但是这个却转换成了拼音的简称。必须要找到这个转换的字典是什么,这样才能正确的使用这个接口。

在网页的源代码找到这个文件,station_name.js 文件,如下图:



js文件的格式是,如下图,使用的话,必须要想用正则表达式处理一下:



2. 使用正则表达式处理这个js文件


使用正则表达式,将js 文件里面的车站名字和对应的简称提取出来,然后写入到一个station.py 文件里面,作为字典,程序运行的时候,将这个文件以模块的形式包含进去。
关于正则表达式,先占一个坑,以后在详细的写。



正则表达式的代码:




运行的时候:


# 将输出重定向到一个新的文件stations.py里面python3 test3.py > stations.py

3. 使用docopt 优雅的完成命令行的输入


docopt 是一个很优雅的处理输入的一个模块,docopt可以根据你写的文档描述,可以自动为你生成解析器,可以非常容易的为你的python程序创建命令行界面。http://www.jianshu.com/p/d2c7cbf21931


4. 主程序


4.1 处理url



4.2 输出





运行结果:



5. 使用prettytable模块 优雅的输出


详细:http://www.jianshu.com/p/a6172b68810e



推荐阅读

干货 | 携程实时用户行为系统实践

数据分析证明最靠谱的电影评分网站不是 IMDB, 也不是烂番茄,而是...

那些年,写 Python 犯过的错误

我用6.5万条公开数据分析了一下人民眼中的人民的名义

如何获得你的第一份数据科学领域的工作?

北京空气质量数据可视化

几个提高工作效率的Python内置小工具

Python 自然语言处理《釜山行》人物关系

函数 | 这8组Excel函数,帮您解决工作中80%的难题

国外公司是如何挖掘社交媒体数据的?

大数据舆情情感分析,如何提取情感并使用什么样的工具?(贴情感标签)

【干货】Pandas速查手册中文

四步搭建企业服务数据分析体系

【进阶】代码这样写不止于优雅( Python 版)

【干货】找不到适合自己的编程书?我自己动手写了一个热门编程书搜索网站(附PDF书单)

玩转Excel动态图表,必须学会的3个套路

盘点 | 2017 最“热”门的十大数据技术

还留在北京的,都是没有退路的


【声明】内容源于网络
0
0
CDA数据分析师
🌸全国30万数据分析从业人员,有10万在CDA数据分析师 🌺CDA会员俱乐部有1000个数据库,成为持证人即可获得相关数据信息 🌹未来两样东西最有价值:一个是数据,一个是GPU
内容 9451
粉丝 0
CDA数据分析师 🌸全国30万数据分析从业人员,有10万在CDA数据分析师 🌺CDA会员俱乐部有1000个数据库,成为持证人即可获得相关数据信息 🌹未来两样东西最有价值:一个是数据,一个是GPU
总阅读459
粉丝0
内容9.5k