10.5. 根据节点类型创建不同的处理器

第三个有用的 XML 处理技巧是将你的代码基于节点类型和元素名称分散到逻辑函数中。解析后的 XML 文档是由各种类型的节点组成的,每一个都是通过 Python 对象表示的。文档本身的根层次通过一个 Document 对象表示。Document 还包含了一个或多个 Element 对象 (表示 XML 标记),其中的每一个可以包含其它的 Element 对象、Text 对象 (表示文本),或者 Comment 对象 (表示内嵌注释)。使用 Python 编写分离各个节点类型逻辑的分发器非常容易。

例 10.17. 已解析 XML 对象的类名

>>> from xml.dom import minidom
>>> xmldoc = minidom.parse('kant.xml') 
>>> xmldoc
<xml.dom.minidom.Document instance at 0x01359DE8>
>>> xmldoc.__class__                   
<class xml.dom.minidom.Document at 0x01105D40>
>>> xmldoc.__class__.__name__          
'Document'
暂时假设 kant.xml 在当前目录中。
正如你在第 9.2 节 “包”中看到的,解析 XML 文档返回的对象是一个 Document 对象,就像在 xml.dom 包的 minidom.py 中定义的一样。又如你在第 5.4 节 “类的实例化”中看到的,__class__ 是每个 Python 对象的一个内置属性。
此外,__name__ 是每个 Python 类的内置属性,是一个字符串。这个字符串并不神秘;它和你在定义类时输入的类名相同。(参见第 5.3 节 “类的定义”。)

好,现在你能够得到任何给定 XML 节点的类名了 (因为每个 XML 节点都是以一个 Python 对象表示的)。你怎样才能利用这点来分离解析每个节点类型的逻辑呢?答案就是 getattr,你第一次见它是在第 4.4 节 “通过 getattr 获取对象引用”中。

例 10.18. parse,通用 XML 节点分发器

    def parse(self, node):          
        parseMethod = getattr(self, "parse_%s" % node.__class__.__name__) 
        parseMethod(node) 
首先,时时彩计划软件公式:注意你正在基于传入节点 (node 参数) 的类名构造一个较大的字符串。所以如果你传入一个 Document 节点,你就构造了字符串 'parse_Document',其它类同于此。
现在你可以把这个字符串当作一个函数名称,然后通过 getattr 得到函数自身的引用。
最后,你可以调用函数并将节点自身作为参数传入。下一个例子将展示每个函数的定义。

例 10.19. parse 分发器调用的函数

    def parse_Document(self, node): 
        self.parse(node.documentElement)

    def parse_Text(self, node):    
        text = node.data
        if self.capitalizeNextWord:
            self.pieces.append(text[0].upper())
            self.pieces.append(text[1:])
            self.capitalizeNextWord = 0
        else:
            self.pieces.append(text)

    def parse_Comment(self, node): 
        pass

    def parse_Element(self, node): 
        handlerMethod = getattr(self, "do_%s" % node.tagName)
        handlerMethod(node)
parse_Document 只会被调用一次,因为在一个 XML 文档中只有一个 Document 节点,并且在已解析 XML 的表示中只有一个 Document 对象。在此它只是起到中转作用,转而解析语法文件的根元素。
parse_Text 在节点表示文本时被调用。这个函数本身做某种特殊处理,自动将句子的第一个单词进行大写处理,而不是简单地将表示的文本追加到一个列表中。
parse_Comment 只有一个 pass,因为你并不关心语法文件中嵌入的注释。但是注意,你还是要定义这个函数并显式地让它不做任何事情。如果这个函数不存在,通用 parse 函数在遇到一个注释的时候会执行失败,因为它试图找到并不存在的 parse_Comment 函数。为每个节点类型定义独立的函数――甚至你不要使用的――将会使通用 parse 函数保持简单和沉默。
parse_Element 方法其实本身就是一个分发器,一个基于元素的标记名称的分发器。这个基本概念是相同的:使用元素的区别 (它们的标记名称) 然后针对每一个分发到一个独立的函数。你构建了一个类似于 'do_xref' 的字符串 (对 <xref> 标记而言),找到这个名称的函数,并调用它。对其它的标记名称 (像<p><choice>) 在解析语法文件的时候都可以找到类似的函数。

在这个例子中,分发函数 parseparse_Element 只是找到相同类中的其它方法。如果你进行的处理过程很复杂 (或者你有很多不同的标记名称),你可以将代码分散到独立的模块中,然后使用动态导入的方式导入每个模块并调用你需要的任何函数。动态导入将在第 16 章 函数编程中介绍。

时时彩实战 功夫时时彩软件视频 时时彩模拟投注软件安卓 时时彩平台出租出售 时时彩四星交集
新时时彩走势图 新疆时时彩开奖现场 时时彩官网平台注册 皇帝时时彩平台qq群 重庆时时彩骗局397
重庆时时彩提胆方法 彩精灵时时彩软件 时时彩充值被骗怎么办 神算时时彩软件破解 旺旺时时彩计划软件
自动投注软件定制开发 时时彩平台棋牌游戏官网 时时彩的走势图怎么看 免费时时彩遗漏报警 第七感时时彩软件网站
云南11选5走势图 博彩广告 真钱和假钱最大的区别 黑龙江11选5走势图任选基本走势 北京快3软件安装☆北京快3和值号码推荐号码推荐☆北京快3走势图预测☆北京快3到几点结束
急速赛车计划软件 10bet在线娱乐百家乐 河南快三直播 江苏体彩11选5开奖直播 玩法规范
新疆时时彩开奖视频直播 陕西十一选五前三直走势图 500彩票幸运赛车技巧 陕西十一选五胆拖 龙8国际娱乐城
内蒙快三开奖结果 贵州11选5前三直选走势图 陕西省快乐十分走势 浙江快乐12开奖走势图结果走势图 江西十一选五软件下载