You are here:  Home » Python » – SAX实用程序 – 结构化标记处理工具(Python教程)(参考资料)

xml.sax.saxutils– SAX Utilities

源代码: Lib / xml / sax / saxutils.py


模块xml.sax.saxutils包含一些常用的类和函数在创建SAX应用程序时非常有用,无论是直接使用还是作为基类.

xml.sax.saxutils.escape (data, entities={})

Escape "&", "<",和">"在一串数据中

您可以通过传递字典作为可选的entities参数来转义其他数据字符串。键和值必须都是字符串;每个密钥都将替换为其相应的值。字符"&", "<"">"总是逃脱,即使提供entities.

xml.sax.saxutils.unescape(data, entities={})

Unescape "&amp;", "&lt;""&gt;"在一串数据中

你可以通过传递字典作为可选的entities参数来取消其他数据串。键和值必须都是字符串;每个密钥都将替换为其相应的值。"&amp", "&lt;""&gt;"总是没有转义,即使提供了entities.

xml.sax.saxutils.quoteattr(data, entities={})

escape(),还准备data用作分析值。返回值是data的引用版本,包含任何其他必需的替换项。quoteattr()将根据data的内容选择一个引号字符,试图避免在字符串中编码任何引号字符。如果单引号和双引号字符都在data中,则双引号字符将被编码,data将用双引号括起来。结果字符串可以直接用作属性值:

>>> print("<element attr=%s>" % quoteattr("ab " cd \" ef"))<element attr="ab " cd &quot; ef">

当使用参考具体语法为HTML或任何SGML生成属性值时,此函数很有用.

class xml.sax.saxutils.XMLGenerator (out=None, encoding=”iso-8859-1″, short_empty_elements=False)

这个类通过将SAXevents写回XML文档来实现ContentHandler接口。换句话说,使用XMLGenerator作为内容处理程序将重现正在解析的原始文档。out应该是一个类似文件的对象,默认sys.stdout. encoding是输出流的编码,默认为"iso-8859-1".short_empty_elements控制包含nocontent的元素的格式:if False(默认值)它们作为一对开始/结束标记发出,如果设置为True它们作为单个自闭标签发出.

新版本3.2: short_empty_elements参数.

class xml.sax.saxutils.XMLFilterBase (base )

这个课程设计在XMLReader和客户端应用程序的事件处理程序。默认情况下,它只会将请求传递给读取器并将事件传递给未经修改的处理程序,但子类可以覆盖特定的方法来修改事件流或配置请求,因为它们通过.

xml.sax.saxutils.prepare_input_sourcesource, base=””

这个函数接受一个输入源和一个可选的基本URL并返回一个解析的InputSource对象准备好了。输入源可以是一个字符串,一个类文件对象,oran InputSource object;解析器将使用此函数来实现source的多态parse()方法。

评论被关闭。