日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時間:8:30-17:00
你可能遇到了下面的問題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
創(chuàng)新互聯(lián)Python教程:python怎么用正則表達式篩選網(wǎng)頁內(nèi)容

一、正則表達式簡述:

創(chuàng)新新互聯(lián),憑借十年的成都網(wǎng)站建設(shè)、成都網(wǎng)站設(shè)計經(jīng)驗,本著真心·誠心服務(wù)的企業(yè)理念服務(wù)于成都中小企業(yè)設(shè)計網(wǎng)站有超過千家案例。做網(wǎng)站建設(shè),選成都創(chuàng)新互聯(lián)公司。

什么是正則表達式?正則表達式就是可以匹配文本片段的模式,最簡單的正則表達式就是一個字符串,用于在文本中匹配到此字符串自身。

二、常用正則表達式:

設(shè)計正則表達式的時候有幾個注意點如下:

a.特殊符號需要加轉(zhuǎn)移符:如要匹配'china.com',則正則表達式格式應(yīng)為'china\\.com';

b.字符集(使用中括號[]來包含字符串組成字符集):如[a-z]表示匹配從a到z之間的字符;此外,還有一個反轉(zhuǎn)字符集,使用^符號開頭:如[^abc]表示匹配除了a、b、c三個字符之外的字符;

c.選擇符:如要匹配'python'和'page',寫出來的模式為'python|page',其中‘|’是管道符號;

d.子模式:如‘p(ython|age)’;

e.可選項:在模式后面加上問好(?),那該模式就變成了可選項,即其可能出現(xiàn)在匹配到的字符串中,但是并非必須的,如r'(http://)?(www.)?shuhe.com'可匹配的結(jié)果有:

http://www.shuhe.com、http://shuhe.com、www.shuhe.com、shuhe.com

f.重復子模式:

(pattern)*:允許模式重復0次或多次

(pattern)+:允許模式重復1次或多次

(pattern){m,n}:允許模式重復m~n次

例如:

r'w*\.python\.org'匹配'www.python.org'、'.python.org'、'wwwwww.python.org'
r'w+\.python\.org'匹配'w.python.org';但不匹配'.python.org'
r'w{3,4}\.python\.org'只能匹配'www.python.org'和'wwww.python.org'

相關(guān)推薦:《Python入門教程》

三、re模板的使用:

在python中封裝了一些常用的正則表達式在re模板中,使用時只需將該模板引入到當前項目中即可:

上述是re中常用的正則表達式,使用步驟為:

1.先將正則表達式的字符串形式編譯為Pattern實例;

2.然后使用Pattern實例處理文本并獲得匹配結(jié)果(一個Match實例);

3.最后使用Match實例獲得信息,進行其他的操作。

例如:

# encoding: UTF-8  
import re  
   
# 將正則表達式編譯成Pattern對象  
pattern = re.compile(r'hello')  
   
# 使用Pattern匹配文本,獲得匹配結(jié)果,無法匹配時將返回None  
match = pattern.match('hello world!')  
   
if match:  
    # 使用Match獲得分組信息  
    print match.group()  
   
### 輸出 ###  
# hello

名稱欄目:創(chuàng)新互聯(lián)Python教程:python怎么用正則表達式篩選網(wǎng)頁內(nèi)容
分享鏈接:http://www.5511xx.com/article/cojcoje.html