新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案

Python3XML解析

Python3 XML 解析

什么是 XML？

XML 指可擴展標記語言（eXtensible Markup Language），標準通用標記語言的子集，是一種用于標記電子文件使其具有結構性的標記語言。你可以通過本站學習

創(chuàng)新互聯(lián)建站-專業(yè)網(wǎng)站定制、快速模板網(wǎng)站建設、高性價比湄潭網(wǎng)站開發(fā)、企業(yè)建站全套包干低至880元,成熟完善的模板庫,直接使用。一站式湄潭網(wǎng)站制作公司更省心,省錢,快速模板網(wǎng)站建設找我們，業(yè)務覆蓋湄潭地區(qū)。費用合理售后完善，10年實體公司更值得信賴。

XML 被設計用來傳輸和存儲數(shù)據(jù)。

XML 是一套定義語義標記的規(guī)則，這些標記將文檔分成許多部件并對這些部件加以標識。

它也是元標記語言，即定義了用于定義其他與特定領域有關的、語義的、結構化的標記語言的句法語言。

Python 對 XML 的解析

常見的 XML 編程接口有 DOM 和 SAX，這兩種接口處理 XML 文件的方式不同，當然使用場合也不同。

Python 有三種方法解析 XML，SAX，DOM，以及 ElementTree:

1.SAX (simple API for XML )

Python 標準庫包含 SAX 解析器，SAX 用事件驅(qū)動模型，通過在解析 XML 的過程中觸發(fā)一個個的事件并調(diào)用用戶定義的回調(diào)函數(shù)來處理 XML 文件。

2.DOM(Document Object Model)

將 XML 數(shù)據(jù)在內(nèi)存中解析成一個樹，通過對樹的操作來操作 XML。

本章節(jié)使用到的 XML 實例文件 movies.xml 內(nèi)容如下：

實例

War, Thriller

DVD

2003

PG

10

Talk about a US-Japan war

Anime, Science Fiction

DVD

1989

R

8

A schientific fiction

Anime, Action

DVD

4

PG

10

Vash the Stampede!

Comedy

VHS

PG

2

Viewable boredom

Python 使用 SAX 解析 xml

SAX 是一種基于事件驅(qū)動的API。

利用 SAX 解析 XML 文檔牽涉到兩個部分: 解析器和事件處理器。

解析器負責讀取 XML 文檔，并向事件處理器發(fā)送事件，如元素開始跟元素結束事件。

而事件處理器則負責對事件作出響應，對傳遞的 XML 數(shù)據(jù)進行處理。

1、對大型文件進行處理；
2、只需要文件的部分內(nèi)容，或者只需從文件中得到特定信息。
3、想建立自己的對象模型的時候。

在 Python 中使用 sax 方式處理 xml 要先引入 xml.sax 中的 parse 函數(shù)，還有 xml.sax.handler 中的 ContentHandler。

ContentHandler 類方法介紹

characters(content) 方法

調(diào)用時機：

從行開始，遇到標簽之前，存在字符，content 的值為這些字符串。

從一個標簽，遇到下一個標簽之前，存在字符，content 的值為這些字符串。

從一個標簽，遇到行結束符之前，存在字符，content 的值為這些字符串。

標簽可以是開始標簽，也可以是結束標簽。

startDocument() 方法

文檔啟動的時候調(diào)用。

endDocument() 方法

解析器到達文檔結尾時調(diào)用。

startElement(name, attrs) 方法

遇到XML開始標簽時調(diào)用，name 是標簽的名字，attrs 是標簽的屬性值字典。

endElement(name) 方法

遇到XML結束標簽時調(diào)用。

make_parser 方法

以下方法創(chuàng)建一個新的解析器對象并返回。

xml.sax.make_parser( [parser_list] )

參數(shù)說明:

parser_list - 可選參數(shù)，解析器列表

parser 方法

以下方法創(chuàng)建一個 SAX 解析器并解析xml文檔：

xml.sax.parse( xmlfile, contenthandler[, errorhandler])

參數(shù)說明:

xmlfile - xml文件名
contenthandler - 必須是一個 ContentHandler 的對象
errorhandler - 如果指定該參數(shù)，errorhandler 必須是一個 SAX ErrorHandler 對象

parseString 方法

parseString 方法創(chuàng)建一個 XML 解析器并解析 xml 字符串：

xml.sax.parseString(xmlstring, contenthandler[, errorhandler])

參數(shù)說明:

xmlstring - xml字符串
contenthandler - 必須是一個 ContentHandler 的對象
errorhandler - 如果指定該參數(shù)，errorhandler 必須是一個 SAX ErrorHandler對象

Python 解析XML實例

實例

#!/usr/bin/python3

import
xml.
sax

class MovieHandler
(
xml.
sax.
ContentHandler
):

def
__init__
(
self
):

self.
CurrentData
=
""

self.
type
=
""

self.
format
=
""

self.
year
=
""

self.
rating
=
""

self.
stars
=
""

self.
description
=
""

# 元素開始調(diào)用

def startElement
(
self
, tag
, attributes
):

self.
CurrentData
= tag

if tag
==
"movie":

print
(
"*****Movie*****"
)

title
= attributes
[
"title"
]

print
(
"Title:"
, title
)

# 元素結束調(diào)用

def endElement
(
self
, tag
):

if
self.
CurrentData
==
"type":

print
(
"Type:"
,
self.
type
)

elif
self.
CurrentData
==
"format":

print
(
"Format:"
,
self.
format
)

elif
self.
CurrentData
==
"year":

print
(
"Year:"
,
self.
year
)

elif
self.
CurrentData
==
"rating":

print
(
"Rating:"
,
self.
rating
)

elif
self.
CurrentData
==
"stars":

print
(
"Stars:"
,
self.
stars
)

elif
self.
CurrentData
==
"description":

print
(
"Description:"
,
self.
description
)

self.
CurrentData
=
""

# 讀取字符時調(diào)用

def characters
(
self
, content
):

if
self.
CurrentData
==
"type":

self.
type
= content

elif
self.
CurrentData
==
"format":

self.
format
= content

elif
self.
CurrentData
==
"year":

self.
year
= content

elif
self.
CurrentData
==
"rating":

self.
rating
= content

elif
self.
CurrentData
==
"stars":

self.
stars
= content

elif
self.
CurrentData
==
"description":

self.
description
= content

if
( __name__
==
"__main__"
):

# 創(chuàng)建一個 XMLReader

parser
=
xml.
sax.
make_parser
(
)

# 關閉命名空間

parser.
setFeature
(
xml.
sax.
handler.
feature_namespaces
,
0
)

# 重寫 ContextHandler

Handler
= MovieHandler
(
)

parser.
setContentHandler
( Handler
)

parser.
parse
(
"movies.xml"
)

以上代碼執(zhí)行結果如下：

*****Movie*****
Title: Enemy Behind
Type: War, Thriller
Format: DVD
Year: 2003
Rating: PG
Stars: 10
Description: Talk about a US-Japan war
*****Movie*****
Title: Transformers
Type: Anime, Science Fiction
Format: DVD
Year: 1989
Rating: R
Stars: 8
Description: A schientific fiction
*****Movie*****
Title: Trigun
Type: Anime, Action
Format: DVD
Rating: PG
Stars: 10
Description: Vash the Stampede!
*****Movie*****
Title: Ishtar
Type: Comedy
Format: VHS
Rating: PG
Stars: 2
Description: Viewable boredom

完整的 SAX API 文檔請查閱

使用xml.dom解析xml

文件對象模型（Document Object Model，簡稱DOM），是W3C組織推薦的處理可擴展置標語言的標準編程接口。

一個 DOM 的解析器在解析一個 XML 文檔時，一次性讀取整個文檔，把文檔中所有元素保存在內(nèi)存中的一個樹結構里，之后你可以利用DOM 提供的不同的函數(shù)來讀取或修改文檔的內(nèi)容和結構，也可以把修改過的內(nèi)容寫入xml文件。

Python 中用 xml.dom.minidom 來解析 xml 文件，實例如下：

實例

#!/usr/bin/python3

from
xml.
dom.
minidom
import parse

import
xml.
dom.
minidom

# 使用minidom解析器打開 XML 文檔

DOMTree
=
xml.
dom.
minidom.
parse
(
"movies.xml"
)

collection
= DOMTree.
documentElement

if collection.
hasAttribute
(
"shelf"
):

print
(
"Root element : %s" % collection.
getAttribute
(
"shelf"
)
)

# 在集合中獲取所有電影

movies
= collection.
getElementsByTagName
(
"movie"
)

# 打印每部電影的詳細信息

for movie
in movies:

print
(
"*****Movie*****"
)

if movie.
hasAttribute
(
"title"
):

print
(
"Title: %s" % movie.
getAttribute
(
"title"
)
)

type
= movie.
getElementsByTagName
(
'type'
)
[
0
]

print
(
"Type: %s" %
type.
childNodes
[
0
].
data
)

format
= movie.
getElementsByTagName
(
'format'
)
[
0
]

print
(
"Format: %s" % format.
childNodes
[
0
].
data
)

rating
= movie.
getElementsByTagName
(
'rating'
)
[
0
]

print
(
"Rating: %s" % rating.
childNodes
[
0
].
data
)

description
= movie.
getElementsByTagName
(
'description'
)
[
0
]

print
(
"Description: %s" % description.
childNodes
[
0
].
data
)

以上程序執(zhí)行結果如下：

Root element : New Arrivals
*****Movie*****
Title: Enemy Behind
Type: War, Thriller
Format: DVD
Rating: PG
Description: Talk about a US-Japan war
*****Movie*****
Title: Transformers
Type: Anime, Science Fiction
Format: DVD
Rating: R
Description: A schientific fiction
*****Movie*****
Title: Trigun
Type: Anime, Action
Format: DVD
Rating: PG
Description: Vash the Stampede!
*****Movie*****
Title: Ishtar
Type: Comedy
Format: VHS
Rating: PG
Description: Viewable boredom

完整的 DOM API 文檔請查閱。

文章名稱：Python3XML解析
網(wǎng)站鏈接：http://www.5511xx.com/article/dpcgpgj.html

日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

新聞中心

Python3 XML 解析

什么是 XML？

Python 對 XML 的解析

1.SAX (simple API for XML )

2.DOM(Document Object Model)

實例

Python 使用 SAX 解析 xml

ContentHandler 類方法介紹

make_parser 方法

parser 方法

parseString 方法

Python 解析XML實例

實例

使用xml.dom解析xml

實例

其他資訊

新聞中心

Python3 XML 解析

什么是 XML？

Python 對 XML 的解析

1.SAX (simple API for XML )

2.DOM(Document Object Model)

實例

Python 使用 SAX 解析 xml

ContentHandler 類方法介紹

make_parser 方法

parser 方法

parseString 方法

Python 解析XML實例

實例

使用xml.dom解析xml

實例

其他資訊

什么是 XML？