新聞中心
編程本身是跟年齡無(wú)關(guān)的一件事,不論你現(xiàn)在是十四五歲,還是四五十歲,如果你熱愛它,并且愿意持續(xù)投入其中,必定會(huì)有所收獲。

本文就來(lái)自編程教室一位“小”讀者的投稿(互助學(xué)習(xí)1群里的同學(xué)應(yīng)該對(duì)作者的名字很熟悉吧)。我看著他不停地產(chǎn)出新的代碼和技術(shù)文章,不禁感嘆“后生可畏”。
這是一個(gè)爬蟲基礎(chǔ)分析和操作的開發(fā)案例,在此分享給大家。
當(dāng)我在電腦上需要翻譯一個(gè)單詞時(shí),我會(huì)這樣做:
打開瀏覽器 = > 打開百度翻譯 = > 輸入單詞 = > 得到翻譯
不過(guò)有時(shí)候,當(dāng)我在命令行環(huán)境下寫代碼的時(shí)候,懶得再切換到瀏覽器里等待頁(yè)面的加載。
于是我就想,能否用萬(wàn)能的 python 制作一個(gè) 命令行下的翻譯工具 呢?
說(shuō)干就干!
網(wǎng)上搜索了點(diǎn)信息,加上一頓操作,最終被我搗鼓出來(lái)了。來(lái)看下最終的效果:
在這個(gè)工具中,我用了 百度 、 有道 以及 谷歌 (可選)的翻譯。
開發(fā)思路
其中獲取有道翻譯和百度翻譯的原理都差不多,這里我們選取百度翻譯來(lái)玩耍一下啦:
首先打開百度翻譯:http://fanyi.baidu.com
接下來(lái)右鍵點(diǎn)擊 檢查 ,選擇 Network 中的 XHR (向服務(wù)器發(fā)送的數(shù)據(jù)請(qǐng)求)。然后我們?cè)谳斎肟蚶镙斎?save 這個(gè)單詞,我們可以看到一時(shí)間這里面多了幾個(gè) sug 標(biāo)簽,點(diǎn)開一看:
可以看到,這個(gè) sug 請(qǐng)求里面就有我們想要的數(shù)據(jù)。點(diǎn)進(jìn)去, Request URL 就是我們需要請(qǐng)求的網(wǎng)址,另外在 Request Method 看到是 POST 方式,也就是提交表單:
移到最后,我們看見了提交的表單參數(shù):
在 Form Data 中,我們看見表單是一個(gè)字典: {'kw': 'save'} ,這里 save 是我們自己輸入的,也就是我們要查詢的單詞,因此我們使用 requests.post 來(lái)模擬這個(gè)請(qǐng)求:
- # 網(wǎng)址和表單
- url= 'https://fanyi.baidu.com/sug'
- Form_data = {'kw': word}
- # post方式請(qǐng)求網(wǎng)站
- response = requests.post(url, data = Form_data,headersheaders=headers)
我們可以試著打印出返回的東西,你會(huì)發(fā)現(xiàn)是以 JSON 格式返回的,因此需要引入內(nèi)置庫(kù) json 來(lái)解析:
- content = json.loads(response.text) # 加載成字典形式
在打印出的 json 格式的文本中我們發(fā)現(xiàn)翻譯結(jié)果在 'data'['v']( 剛剛的圖片里我們也看見了),接下來(lái)提取并返回:
- result = content['data'][0]['v'] # 獲取翻譯結(jié)果
- return result
這樣就完成了提交表單了,實(shí)現(xiàn)百度翻譯了。
這里用到的就是一些常用的爬蟲分析和操作,有道翻譯也基本類似,不再贅述,具體操作可參加文末給出的完整代碼。
接下來(lái)我們來(lái)看看與眾不同的谷歌翻譯,這個(gè)玩意實(shí)在有些復(fù)雜。谷歌翻譯是有 api 的,但是要錢……我不想付錢……網(wǎng)上有大佬給出了解決方案(這里我們簡(jiǎn)單地看一下原理):
按照近似百度翻譯的方式操作,我們看到這里多出了一個(gè)請(qǐng)求,這里面有我們想要的翻譯結(jié)果:
我們回到之前的 Request URL 看一下,發(fā)現(xiàn)前面的直接復(fù)制就好了, q 是我們需要翻譯的詞,但是這個(gè) tk 參數(shù)卻是個(gè)棘手的參數(shù)。我代碼里用到的解法是網(wǎng)上的,仿照谷歌翻譯頁(yè)面上的提供的函數(shù),用 JavaScript 去計(jì)算出了這個(gè)參數(shù)(我懷疑他就是拿的前端源碼,沒仔細(xì)對(duì)照)。
那么如何在 python 中執(zhí)行 JavaScript 代碼呢,我們可以通過(guò) pyexecjs 這個(gè)庫(kù)(注意這個(gè)庫(kù)導(dǎo)入名是 execjs )。這個(gè)部分的源碼就在 Py4Js 這個(gè)類里邊了。
特別說(shuō)明下,因?yàn)闊o(wú)法直接使用谷歌翻譯,所以我把它做成了可選項(xiàng),默認(rèn)不會(huì)調(diào)用。
使用方法
我已經(jīng)將這個(gè)項(xiàng)目發(fā)布到了 pypi ,你可以通過(guò) pip 命令按如下方式安裝:
- pip install quicktranslate
用起來(lái)也是非常的簡(jiǎn)單(加上 -g 可增加谷歌翻譯結(jié)果):
- trans -t 你要翻譯的東西
示例:
- $ trans -t 你好
- =========================
- youdao translate result:hello
- baidu translate result:[nǐ hǎo] how do you do; how are you; hello;
- =========================
- $ trans -t 你好 -g
- =========================
- youdao translate result:hello
- baidu translate result:[nǐ hǎo] how do you do; how are you; hello;
- google translate result:Hello there
- =========================
本案例完整代碼: https://github.com/pynickle/a... pip安裝命令: pip install quicktranslate
本文題目:用Python做一個(gè)簡(jiǎn)單的翻譯工具
標(biāo)題路徑:http://www.5511xx.com/article/dhgedps.html


咨詢
建站咨詢
