日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時(shí)間:8:30-17:00
你可能遇到了下面的問題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
Python抓取網(wǎng)頁內(nèi)容應(yīng)用代碼分析

我們今天將會通過這篇文章,為大家詳細(xì)介紹一下Python抓取網(wǎng)頁內(nèi)容的兩種不同方法。大家可以以此為參考對象,在實(shí)際應(yīng)用中選擇一種適合自己的應(yīng)用方式來幫助我們完成實(shí)際開發(fā)中的需求。

Python抓取網(wǎng)頁內(nèi)容方法一、用urllib2/sgmllib包,將目標(biāo)網(wǎng)頁的所有URL列出。

 
 
 
  1. import urllib2  
  2. from sgmllib import SGMLParser   
  3. class URLLister(SGMLParser):  
  4. def reset(self):   
  5. SGMLParser.reset(self)  
  6. self.urls = []  
  7. def start_a(self, attrs):   
  8. href = [v for k, v in attrs if k=='href']   
  9. if href:  
  10. self.urls.extend(href)  
  11. f = urllib2.urlopen("http://www.donews.com/")  
  12. if f.code == 200:  
  13. parser = URLLister()  
  14. parser.feed(f.read())  
  15. f.close()  
  16. for url in parser.urls: print url 

Python抓取網(wǎng)頁內(nèi)容方法二、用python調(diào)用IE抓取目標(biāo)網(wǎng)頁(Require win32com, pythoncom)的所有圖像的url和大小

 
 
 
  1. import win32com.client, pythoncom  
  2. import time  
  3. ie = win32com.client.DispatchEx('InternetExplorer.Application.1')  
  4. ie.Visible = 1 
  5. ie.Navigate("http://news.sina.com.cn")  
  6. while ie.Busy:  
  7. time.sleep(0.05)  
  8. doc = ie.Document  
  9. for i in doc.images:  
  10. print i.src, i.width, i.height 

這種方法可以利用IE本身的Javascript. DHTML的支持,來做自動提交Form,和處理Javascript。

以上就是我們?yōu)榇蠹医榻B的Python抓取網(wǎng)頁內(nèi)容的兩種不同的方法。

【編輯推薦】

  1. Python編碼規(guī)范基本內(nèi)容簡介
  2. Python調(diào)用MySql存儲過程基本應(yīng)用方式解讀
  3. 第三方Python庫基本概念簡述
  4. Python打包方法基本應(yīng)用方式介紹
  5. Python set類型基本應(yīng)用方式解讀

分享題目:Python抓取網(wǎng)頁內(nèi)容應(yīng)用代碼分析
文章位置:http://www.5511xx.com/article/dhggees.html