XPath是一种用来从文档树中选择节点和节点集的语言。从XPath的角度来看,共有七种节点:
根节点
元素节点
属性节点
文本节点
注释节点
处理指令节点
名称空间节点
CDATA部份,实体引用和文档类型声明不包括在内,XPath在所有这些项都并入文档之后才起作用。根节点和根元素是不同的两个概念,根节点包含整篇文档,包括根元素。
匹配模板的通用模式
Table 6.1.
模式 | 描述 |
---|---|
match="E" | 匹配元素E |
match="*" | 匹配任意元素 |
match="E|F" | 匹配元素E和F |
match="E/F" | 匹配以E为父元素的元素F |
match="E//F" | 匹配以E为根元素的元素F |
match="/" | 匹配根节点 |
match="text()" | 匹配文本节点 |
match="comment()" | 匹配注释节点 |
match="processing-instruction()" | 匹配处理指令 |
match="node()" | 匹配除属性节点和根节点外的节点 |
match="id(test)" | 匹配具有唯一ID test的元素 |
match="E[@CLASS="foo"] | 匹配元素E,其类属性为foo |
match="E[F]" | 匹配元素包含有F元素的E元素 |
XPath提供了选择节点的机制,两个较有用的是轴选择和谓语选择,轴指定上下文节点和要选择的节点的关系。共有十三种轴,最常用的有四种,分别是子轴(child)、属性轴(attribute)、自已(self)、双亲(parent)。
Table 6.2. XPath轴描述
轴 | 描述 |
---|---|
child | 包含当前节点的儿子 |
descendent | 包含当前节点的后代,后代不包含属性(attribute)或名称域(namespace)节点 |
parent | 包含当前节点的父亲 |
ancestor | 包含当前节点的祖先,祖先总是包含根节点 |
following-sibling | 包含当前节点随后的所有节点树,但不包含attribute或namespace节点 |
preceding-sibling | 包含当前节点之前的所有节点树,但不包含attribute或namespace节点 |
following | 包含当前节点随后的所有节点,following轴排除了当前节点的后代和attribute或namespace节点 |
preceding | 包含当前节点之前的所有节点,following轴排除了当前节点的后代和attribute或namespace节点 |
attribute | 包含当前节点的所有属性 |
namespace | 包含当前节点的所有namespace节点 |
self | 只包含当前节点 |
descendent-or-self | 包含当前节点和当前节点的后代 |
ancestor-or-self | 包含当前节点和当前节点的祖先 |
XPath表达式可以匹配多个节点,如需对匹配的节点进行进一步的筛选,可以使用谓词。
Table 6.3. 选择节点常用谓词
谓词 | 描述 |
---|---|
select="E" | 选择是当前节点的孩子的E元素 |
select="" | 选择当前节点的孩子的所有元素 |
select="text()" | 选择当前节点的文本节点孩子 |
select="@name" | 选择当前节点的name属性 |
select="@*" | 选择当前节点的所有属性 |
select="E[1]" | 选择当前节点的孩子的第一个E元素 |
select="E[last()]" | 选择当前节点的孩子的最后一个E元素 |
select="*/E" | 选择当前节点的孙了的所有E元素 |
select="E//F" | 选择从当前节点的孩子的E元素派生而来的元素F |
select="//" | 选择根元素 |
select="//E" | 选择从根节点派生而来的E元素 |
select="//E/F" | 选择所有是从根节点派生而来的E元素的孩子的F元素 |
select="." | 选择当前节点 |
select=".//E" | 选择从当前节点派生而来的所有E元素 |
select=".." | 选择当前节点的父节点 |
select="../@name" | 选择当前节点的父节点的name属性 |
select="E[@name='foo']" | 选择所有是当前节点的孩子,并且其name属性具有foo值的E属性,除等号外,还可用<,>,<=,>=和!= |
select="E[@foo and @bar]" | 选择所有包含foo和bar属性的E元素 |
home/person/@id这种定位路径的写法叫简写定位路径,该写法简洁,容易理解,是XSLT匹配模式中最常用的写法。还有一种称为非简写定位路径的写法,它把节点测试和轴结合在一起,如child::home/child::person/attribute::id。该写法在实际使用中不常用,但它具有非常重要的性能因此有必要了解。