XPath 语法
XPath 语法
选取节点
/   如果是在最前面,代表从根节点选取,否则选择某节点下的某个节点.只查询子一辈的节点
/html   查询到一个结果
/div    查询到0个结果,因为根节点以下只有一个html子节点
/html/body  查询到1个结果
//  查询所有子孙节点
//head/script
//div
./   选取当前节点
../  选取当前节点的父节点
@   选取属性
//div[@id]  选择所有带有id属性的div元素
    <div id="s" class="left">
| 运算符/特殊字符 | 说明 | 
|---|---|
| / | 此路径运算符出现在模式开头时,表示应从根节点选择。 | 
| // | 从当前节点开始递归下降,此路径运算符出现在模式开头时,表示应从根节点递归下降。 | 
| . | 当前上下文。 | 
| .. | 当前上下文节点父级。 | 
| * | 通配符;选择所有元素节点与元素名无关。(不包括文本,注释,指令等节点,如果也要包含这些节点请用node()函数) | 
| @ | 属性名的前缀。 | 
| @* | 选择所有属性,与名称无关。 | 
| : | 命名空间分隔符;将命名空间前缀与元素名或属性名分隔。 | 
| ( ) | 括号运算符(优先级最高),强制运算优先级。 | 
| [ ] | 应用筛选模式(即谓词,包括"过滤表达式"和"轴(向前/向后)")。 | 
| [1] | 下标运算符;用于在集合中编制索引。1 表示数字 | 
| | | 两个节点集合的联合,如://messages/message/to | 
| - | 减法。 | 
| div, | 浮点除法。 | 
| and, or | 逻辑运算。 | 
| mod | 求余。 | 
| not() | 逻辑非 | 
| = | 等于 | 
| != | 不等于 | 
| 特殊比较运算符 | < 或者 <<= 或者 <=> 或者 >>= 或者 >=需要转义的时候必须使用转义的形式,如在XSLT中,而在XMLDOM的scripting中不需要转义。 | 
谓语
谓语是用来查找某个特定的节点或者包含某个指定的值的节点,被嵌在方括号中。
//body/div[1] body下的第一个div元素
//body/div[last()] body下的最后一个div元素
//body/div[position()<3] body下的位置小于3的元素
//div[@id] div下带id属性的元素
    <div id="s" class="left">
//input[@id="serverTime"] input下id="serverTime"的元素
||| |---|----| ancestor|选取当前节点的所有先辈(父、祖父等) ancestor-or-self|选取当前节点的所有先辈(父、祖父等)以及当前节点本身 attribute|选取当前节点的所有属性 child|选取当前节点的所有子元素。 descendant|选取当前节点的所有后代元素(子、孙等)。 descendant-or-self|选取当前节点的所有后代元素(子、孙等)以及当前节点本身。 following|选取文档中当前节点的结束标签之后的所有节点。 namespace|选取当前节点的所有命名空间节点 parent|选取当前节点的父节点。 preceding|直到所有这个节点的父辈节点,顺序选择每个父辈节点前的所有同级节点 preceding-sibling|选取当前节点之前的所有同级节点。 self|选取当前节点。
模糊匹配
//div[contains(@class,'f1')] div的class属性带有f1的
通配符 *
//body/* body下面所有的元素
//div[@*] 只要有用属性的div元素
//div[@id='footer'] //div 带有id='footer'属性的div下的所有div元素
//div[@class='job_bt'] //dd[@class='job-advantage']
运算符
//div[@class='job_detail'] and @id='job_tent'
//book/title | //book/price 选取 book 元素的所有 title 和 price 元素。
.//a/text() 当前标签下所有a标签的文字内容
//tr[position()>1 and position()<11] 位置大于1小于11
需要注意的知识点
1./和//的区别:/代表子节点,//代表子孙节点,//用的比较多
2.contains有时候某个属性中包含了多个值,那么使用contains函数 //div[contains(@class,'lg')]
3.谓语中的下标是从1开始的,不是从0开始的
常用表达式实例:
||| |----|----| /|Document Root文档根. /|选择文档根下面的所有元素节点,即根节点(XML文档只有一个根节点) /node()|根元素下所有的节点(包括文本节点,注释节点等) /text()|查找文档根节点下的所有文本节点 /messages/message|messages节点下的所有message节点 /messages/message[1]|messages节点下的第一个message节点 /messages/message[1]/self::node()|第一个message节点(self轴表示自身,node()表示选择所有节点) /messages/message[1]/node()|第一个message节点下的所有子节点 /messages/message[1]/[last()]|第一个message节点的最后一个子节点 /messages/message[1]/[last()]|Error,谓词前必须是节点或节点集 /messages/message[1]/node()[last()]|第一个message节点的最后一个子节点 /messages/message[1]/text()|第一个message节点的所有子节点 /messages/message[1]//text()|第一个message节点下递归下降查找所有的文本节点(无限深度) |/messages/message[1] /child::node()| /messages/message[1] /node()| /messages/message[position()=1]/node()| //message[@id=1] /node()|第一个message节点下的所有子节点 //message[@id=1] //child::node()|递归所有子节点(无限深度) //message[position()=1]/node()|选择id=1的message节点以及id=0的message节点 /messages/message[1] /parent::|Messages节点 /messages/message[1]/body/attachments/parent::node()| /messages/message[1]/body/attachments/parent:: | /messages/message[1]/body/attachments/..|attachments节点的父节点。父节点只有一个,所以node()和 返回结果一样。(..也表示父节点. 表示自身节点) //message[@id=0]/ancestor::|Ancestor轴表示所有的祖辈,父,祖父等。向上递归 //message[@id=0]/ancestor-or-self::|向上递归,包含自身 //message[@id=0]/ancestor::node()|对比使用,多一个文档根元素(Document root) /messages/message[1]/descendant::node()| //messages/message[1]//node()|递归下降查找message节点的所有节点 /messages/message[1]/sender/following::|查找第一个message节点的sender节点后的所有同级节点,并对每一个同级节点递归向下查找。 //message[@id=1]/sender/following-sibling::|查找id=1的message节点的sender节点的所有后续的同级节点。 //message[@id=1]/datetime/@date|查找id=1的message节点的datetime节点的date属性...
剩余内容已隐藏