日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時(shí)間:8:30-17:00
你可能遇到了下面的問(wèn)題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營(yíng)銷(xiāo)解決方案
Python3實(shí)現(xiàn)火車(chē)票查詢工具

項(xiàng)目簡(jiǎn)介:使用 Python3 抓取 12306 網(wǎng)站信息提供一個(gè)命令行的火車(chē)票查詢工具。通過(guò)該項(xiàng)目的實(shí)現(xiàn),可以熟悉 Python3 基礎(chǔ)及網(wǎng)絡(luò)編程,以及 docopt,requests,prettytable 等庫(kù)的使用。

公司主營(yíng)業(yè)務(wù):網(wǎng)站設(shè)計(jì)制作、做網(wǎng)站、移動(dòng)網(wǎng)站開(kāi)發(fā)等業(yè)務(wù)。幫助企業(yè)客戶真正實(shí)現(xiàn)互聯(lián)網(wǎng)宣傳,提高企業(yè)的競(jìng)爭(zhēng)能力。創(chuàng)新互聯(lián)是一支青春激揚(yáng)、勤奮敬業(yè)、活力青春激揚(yáng)、勤奮敬業(yè)、活力澎湃、和諧高效的團(tuán)隊(duì)。公司秉承以“開(kāi)放、自由、嚴(yán)謹(jǐn)、自律”為核心的企業(yè)文化,感謝他們對(duì)我們的高要求,感謝他們從不同領(lǐng)域給我們帶來(lái)的挑戰(zhàn),讓我們激情的團(tuán)隊(duì)有機(jī)會(huì)用頭腦與智慧不斷的給客戶帶來(lái)驚喜。創(chuàng)新互聯(lián)推出鼎城免費(fèi)做網(wǎng)站回饋大家。

項(xiàng)目由小蝸牛發(fā)布在實(shí)驗(yàn)樓,項(xiàng)目在線練習(xí)地址:Python3 實(shí)現(xiàn)火車(chē)票查詢工具,可以直接在教程中下載代碼使用demo。

一、實(shí)驗(yàn)簡(jiǎn)介

當(dāng)你想查詢一下火車(chē)票信息的時(shí)候,你還在上 12306 官網(wǎng)嗎?或是打開(kāi)你手機(jī)里的 APP?

下面讓我們來(lái)用 Python 寫(xiě)一個(gè)命令行版的火車(chē)票查看器, 只要在命令行敲一行命令就能獲得你想要的火車(chē)票信息!如果你剛掌握了Python基礎(chǔ),這將是個(gè)不錯(cuò)的小練習(xí)。

1.1 知識(shí)點(diǎn)

  • Python3 基礎(chǔ)知識(shí)的綜合運(yùn)用
  • docopt、requests 及 prettytable 庫(kù)的使用

1.2 效果截圖

二、接口設(shè)計(jì)

一個(gè)應(yīng)用寫(xiě)出來(lái)最終是要給人使用的,哪怕只是給你自己使用。

所以,首先應(yīng)該想想你希望怎么使用它?讓我們先給這個(gè)小應(yīng)用起個(gè)名字吧,既然及查詢票務(wù)信息,那就叫它 tickets 好了。

我們希望用戶只要輸入出發(fā)站,到達(dá)站以及日期就讓就能獲得想要的信息,比如要查看8月25號(hào)上海-北京的火車(chē)余票, 我們只需輸入:

 
 
  1. $ tickets shanghai beijing 2016-08-25 

注意: 由于實(shí)驗(yàn)樓環(huán)境中無(wú)法輸入中文,所以我們的參數(shù)設(shè)計(jì)為拼音的形式,在這里思考下使用拼音是否有什么弊端?

對(duì)這一接口進(jìn)行抽象得到:

 
 
  1. $ tickets from to date 

另外,火車(chē)有各種類(lèi)型,高鐵、動(dòng)車(chē)、特快、快速和直達(dá),我們希望可以提供選項(xiàng)只查詢特定的一種或幾種的火車(chē),所以,我們應(yīng)該有下面這些選項(xiàng):

  • -g 高鐵
  • -d 動(dòng)車(chē)
  • -t 特快
  • -k 快速
  • -z 直達(dá)

這幾個(gè)選項(xiàng)應(yīng)該能被組合使用,所以,最終我們的接口應(yīng)該是這個(gè)樣子的:

 
 
  1. $ tickets [-gdtkz] from to date 

接口已經(jīng)確定好了,剩下的就是實(shí)現(xiàn)它了。

三、代碼實(shí)現(xiàn)

首先安裝一下實(shí)驗(yàn)需要用到的庫(kù):

 
 
  1. $ sodo pip install requests prettytable docopt 
  • requests, 不用不多介紹了吧,使用 Python 訪問(wèn) HTTP 資源的必備庫(kù)。
  • docopt, Python3 命令行參數(shù)解析工具。
  • prettytable, 格式化信息打印工具,能讓你像 MySQL 那樣打印數(shù)據(jù)。

3.1 解析參數(shù)

Python有很多寫(xiě)命令行參數(shù)解析工具,如 argparse, docopt, click,這里我們選用的是 docopt 這個(gè)簡(jiǎn)單易用的工具。docopt 可以按我們?cè)谖臋n字符串中定義的格式來(lái)解析參數(shù),比如我們?cè)?tickets.py:

注意: 實(shí)驗(yàn)樓中無(wú)法輸入中文,參數(shù)后的中文可以使用拼音代替。

 
 
  1. # coding: utf-8 
  2. """Train tickets query via command-line. 
  3.  
  4. Usage: 
  5.     tickets [-gdtkz]    
  6.  
  7. Options: 
  8.     -h,--help   顯示幫助菜單 
  9.     -g          高鐵 
  10.     -d          動(dòng)車(chē) 
  11.     -t          特快 
  12.     -k          快速 
  13.     -z          直達(dá) 
  14.  
  15. Example: 
  16.     tickets beijing shanghai 2016-08-25 
  17. """ 
  18. from docopt import docopt 
  19.  
  20. def cli(): 
  21.     """command-line interface""" 
  22.     arguments = docopt(__doc__) 
  23.     print(arguments) 
  24.  
  25. if __name__ == '__main__': 
  26.     cli()  

下面我們運(yùn)行一下這個(gè)程序:

 
 
  1. $ python3 tickets.py beijing shanghai 2016-08-25 

我們得到下面的結(jié)果:

3.2 獲取數(shù)據(jù)

參數(shù)已經(jīng)解析好了,下面就是如何獲取數(shù)據(jù)了,這也是最主要的部分。首先我們打開(kāi) 12306,進(jìn)入余票查詢頁(yè)面,如果你使用 Chrome,那么按 F12 打開(kāi)開(kāi)發(fā)者工具,選中 Network 一欄,在查詢框鐘我們輸入 上海 到 北京,日期 2016-08-25, 點(diǎn)擊查詢,我們?cè)谡{(diào)試工具發(fā)現(xiàn),查詢系統(tǒng)實(shí)際上請(qǐng)求了這個(gè)URL:

https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate=2016-07-01&from_station=SHH&to_station=BJP

并且返回的是JSON格式的數(shù)據(jù)!

接下來(lái)問(wèn)題就簡(jiǎn)單了,我們只需要構(gòu)建請(qǐng)求URL然后解析返回的Json數(shù)據(jù)就可以了。但是我們發(fā)現(xiàn),URL里面 from_station 和 to_station 并不是漢字或者拼音,而是一個(gè)代號(hào),而我們想要輸入的是漢字或者拼音,我們要如何獲取代號(hào)呢?我們打開(kāi)網(wǎng)頁(yè)源碼看看有沒(méi)有什么發(fā)現(xiàn)。

果然,我們?cè)诰W(wǎng)頁(yè)里面找到了這個(gè)鏈接:https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.8955 這里面貌似是包含了所有車(chē)站的中文名,拼音,簡(jiǎn)寫(xiě)和代號(hào)等信息。但是這些信息擠在一起,而我們只想要車(chē)站的拼音和大寫(xiě)字母的代號(hào)信息,怎么辦呢?

正則表達(dá)式就是答案,我們寫(xiě)個(gè)小腳本來(lái)匹配提取出想要的信息吧, 在parse_station.py中:

 
 
  1. # coding: utf-8 
  2.  
  3. import re 
  4. import requests 
  5. from pprint import pprint 
  6.  
  7.  
  8. url = 'https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.8955' 
  9. text = requests.get(url, verify=False) 
  10. stations = re.findall(r'([A-Z]+)\|([a-z]+)', text) 
  11. stations = dict(stations) 
  12. stations = dict(zip(stations.values(), stations.keys())) 
  13. pprint(stations, indent=4) 

注意,上面的正則表達(dá)式匹配出的結(jié)果轉(zhuǎn)為字典后,字典的鍵是大寫(xiě)字母大號(hào),這顯然不是我們想要的結(jié)果,于是,我們通過(guò)一個(gè)變換將鍵值反過(guò)來(lái)。 我們運(yùn)行這個(gè)腳本,它將以字典的形式返回所有車(chē)站和它的大寫(xiě)字母代號(hào), 我們將結(jié)果重定向到 stations.py 中,

 
 
  1. $ python3 parse_station.py > stations.py 

我們?yōu)檫@個(gè)字典加名字,stations, 最終,stations.py文件是這樣的:

現(xiàn)在,用戶輸入車(chē)站的中文名,我們就可以直接從這個(gè)字典中獲取它的字母代碼了:

 
 
  1. ... 
  2. from stations import stations 
  3.  
  4. def cli(): 
  5.     arguments = docopt(__doc__) 
  6.     from_staion = stations.get(arguments['']) 
  7.     to_station = stations.get(arguments['']) 
  8.     date = arguments[''] 
  9.     # 構(gòu)建URL 
  10.     url = 'https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate={}&from_station={}&to_station={}'.format( 
  11.         date, from_staion, to_station 
  12.     )  

萬(wàn)事俱備,下面我們來(lái)請(qǐng)求這個(gè)URL獲取數(shù)據(jù)吧!這里我們使用 requests 這個(gè)庫(kù), 它提供了非常簡(jiǎn)單易用的接口,

 
 
  1. ... 
  2. import requests 
  3.  
  4. def cli(): 
  5.     ... 
  6.     # 添加verify=False參數(shù)不驗(yàn)證證書(shū) 
  7.     r = requests.get(url, verify=False) 
  8.     print(r.json())  

從結(jié)果中,我們可以觀察到,與車(chē)票有關(guān)的信息需要進(jìn)一步提取:

 
 
  1. def cli(): 
  2.     ... 
  3.     r = requsets.get(url); 
  4.     rows = r.json()['data']['datas']  

3.3 解析數(shù)據(jù)

我們封裝一個(gè)簡(jiǎn)單的類(lèi)來(lái)解析數(shù)據(jù):

 
 
  1. from prettytable import PrettyTable 
  2.  
  3.  
  4. class TrainCollection(object): 
  5.  
  6.     # 顯示車(chē)次、出發(fā)/到達(dá)站、 出發(fā)/到達(dá)時(shí)間、歷時(shí)、一等坐、二等坐、軟臥、硬臥、硬座 
  7.     header = 'train station time duration first second softsleep hardsleep hardsit'.split() 
  8.  
  9.     def __init__(self, rows): 
  10.         self.rows = rows 
  11.  
  12.     def _get_duration(self.row): 
  13.         """ 
  14.         獲取車(chē)次運(yùn)行時(shí)間 
  15.         """ 
  16.         duration = row.get('lishi').replace(':', 'h') + 'm' 
  17.         if duration.startswith('00'): 
  18.             return duration[4:] 
  19.         if duration.startswith('0'): 
  20.             return duration[1:] 
  21.         return duration 
  22.  
  23.     @property 
  24.     def trains(self): 
  25.         for row in self.rows: 
  26.             train = [ 
  27.                 # 車(chē)次 
  28.                 row['station_train_code'], 
  29.                 # 出發(fā)、到達(dá)站 
  30.                 '\n'.join([row['from_staion_name'], row['to_station_name']]), 
  31.                 # 出發(fā)、到達(dá)時(shí)間 
  32.                 '\n'.join([row['start_time'], row['arrive']]), 
  33.                 # 歷時(shí) 
  34.                 self._get_duration(row), 
  35.                 # 一等坐 
  36.                 row['zy_num'], 
  37.                 # 二等坐 
  38.                 row['ze_num'], 
  39.                 # 軟臥 
  40.                 row['rw_num'], 
  41.                 # 軟坐 
  42.                 row['yw_num'], 
  43.                 # 硬坐 
  44.                 row['yz_num'] 
  45.             ] 
  46.             yield train 
  47.  
  48.     def pretty_print(self): 
  49.         """ 
  50.         數(shù)據(jù)已經(jīng)獲取到了,剩下的就是提取我們要的信息并將它顯示出來(lái)。 
  51.         `prettytable`這個(gè)庫(kù)可以讓我們它像MySQL數(shù)據(jù)庫(kù)那樣格式化顯示數(shù)據(jù)。 
  52.         """ 
  53.         pt = PrettyTable() 
  54.         # 設(shè)置每一列的標(biāo)題 
  55.         pt._set_field_names(self.header) 
  56.         for train in self.trains: 
  57.             pt.add_row(train) 
  58.         print(pt)  

3.4 顯示結(jié)果

最后,我們將上述過(guò)程進(jìn)行匯總并將結(jié)果輸出到屏幕上:

 
 
  1. ... 
  2.  
  3. class TrainCollection: 
  4.     ... 
  5.     ... 
  6.  
  7. def cli(): 
  8.     arguments = docopt(__doc__) 
  9.     from_staion = stations.get(arguments['']) 
  10.     to_station = stations.get(arguments['']) 
  11.     date = arguments[''] 
  12.     # 構(gòu)建URL 
  13.     url = 'https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate={}&from_station={}&to_station={}'.format( 
  14.         date, from_staion, to_station 
  15.     ) 
  16.     r = requests.get(url, verify=False) 
  17.     rows = r.json()['data']['datas'] 
  18.     trains = TrainCollection(rows) 
  19.     trains.pretty_print() 
  20.  
  21.  
  22. if __name__ == '__main__': 
  23.     cli()  

3.5 最后一米

至此, 程序的主體已經(jīng)完成了, 但是上面打印出的結(jié)果是黑白的,很是乏味,我們來(lái)給它添加顏色吧:

 
 
  1. def colored(color, text): 
  2.     table = { 
  3.         'red': '\033[91m', 
  4.         'green': '\033[92m', 
  5.         # no color 
  6.         'nc': '\033[0' 
  7.     } 
  8.     cv = table.get(color) 
  9.     nc = table.get('nv') 
  10.     return ''.join([cv, text, nc])  

修改一下程序,將出發(fā)車(chē)站與出發(fā)時(shí)間顯示為紅色, 將到達(dá)車(chē)站與到達(dá)時(shí)間顯示為綠色:

 
 
  1. ... 
  2. '\n'.join([colored('green', row['from_staion_name']) 
  3.            colored('red', row['to_station_name'])]), 
  4. '\n'.join([colored('green', row['start_time']) 
  5.            colored('red', row['arrive_time'])]), 
  6. ...  

四、總結(jié)

本課程使用 Python3 抓取 12306 網(wǎng)站信息提供一個(gè)命令行的火車(chē)票查詢工具。通過(guò)該項(xiàng)目的實(shí)現(xiàn),可以學(xué)習(xí)并實(shí)踐 Python3 基礎(chǔ)及網(wǎng)絡(luò)編程,以及 docopt,requests,prettytable 等庫(kù)的使用。

感興趣的同學(xué)可以實(shí)現(xiàn)更多擴(kuò)展功能:

  • 顯示商務(wù)坐, 無(wú)坐
  • 添加參數(shù)支持,用戶可以指定火車(chē)類(lèi)型
  • 支持更多的時(shí)間格式,如:20161010

本項(xiàng)目的完整代碼及demo,可在實(shí)驗(yàn)樓查看并在線完成,立即【開(kāi)始實(shí)驗(yàn)】

更多Python經(jīng)典項(xiàng)目:Python全部 - 課程


文章標(biāo)題:Python3實(shí)現(xiàn)火車(chē)票查詢工具
網(wǎng)頁(yè)鏈接:http://www.5511xx.com/article/djsdhhh.html