使用dom4j和XPath路径表达式解析XML文件
发布于:2021-12-07 22:51:00
标签:/
Java笔记
/
访问:
使用dom4j和XPath路径表达式解析XML文件
用到的jar包
XPath路径表达式
XPath
路径表达式是XML
文档中查找数据的语言。
- 掌握
XPath
可以极大的提高在提取数据时的开发效率。
- 学习
XPath
本质就是掌握各种形式表达式的使用技巧。
XPath基本表达式
最常用的基本表达式
表达式 |
描述 |
nodename |
选取此节点的所有子节点 |
/ |
从根节点选取。 |
// |
从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。 |
. |
选取当前节点。 |
.. |
选取当前节点的父节点。 |
@ |
选取属性。 |
XPath基本表达式案例
路径表达式 |
结果 |
bookstore |
选取bookstore元素的所有子节点 |
/bookstore |
选取根元素bookstore。注释:假如路径起始于正斜杠(/),则此路径始终代表到某元素的绝对路径。 |
bookstore/book |
选取属于bookstore的子元素的所有book元素 |
//book |
选取所有book子元素,而不管它们在文档中的位置 |
bookstore//book |
选择属于bookstore元素的后代的所有book元素,而不管它们位于bookstore之下的什么位置 |
//@lang |
选取名为lang的所有属性。 |
XPath谓语表达式
路径表达式 |
结果 |
/bookstore/book[1] |
选取属于bookstore子元素的第一个book元素 |
/bookstore/book[last()] |
选取属于bookstore子元素的最后一个book元素 |
/bookstore/book[last()-1] |
选取属于bookstore子元素的倒数第二个book元素 |
/bookstore/book[position()<3] |
选取最前面的两个属于bookstore元素的子元素的book元素 |
//title[@lang] |
选取所有拥有名为lang的属性的title元素 |
//title[@lang=’eng’] |
选取所有title元素,且这些元素拥有值为eng的lang属性 |
/bookstore/book[price>35.00] |
选取bookstore元素的所有book元素,且其中的price元素的值须大于35.00 |
/bookstore/book[price>35.00]/title |
选取bookstore元素中的book元素的所有title元素,且其中的price元素的值须大于35.00 |
XPath示例
读取如下的XML文件
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
| <?xml version="1.0" encoding="UTF-8"?> <teach-plan> <course id="3301"> <course-name>大学英语</course-name> <class-hour>36</class-hour> <exam-form>考试</exam-form> </course> <course id="3303"> <course-name>高等数学</course-name> <class-hour>70</class-hour> <exam-form>考试</exam-form> </course> <course id="3305"> <course-name>计算机应用基础</course-name> <class-hour>108</class-hour> <exam-form>上机考试</exam-form> </course> </teach-plan>
|
1)选取class-hour
大于50的课
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
| public static void main(String[] args) { SAXReader reader = new SAXReader(); Document document; try { document = reader.read(XML_PATH); List<Node> nodes = document.selectNodes("//course[class-hour>50]"); for (Node node : nodes) { Element element = (Element)node; System.out.println(element.elementText("course-name")); } } catch (DocumentException e) { e.printStackTrace(); } }
|
输出
2)选择course
中id为3301
的课程,并打印课程名称
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
| public static void main(String[] args) { SAXReader reader = new SAXReader(); Document document; try { document = reader.read(XML_PATH); List<Node> nodes = document.selectNodes("//course[@id=3301]"); for (Node node : nodes) { Element element = (Element)node; System.out.println(element.elementText("course-name")); }
} catch (DocumentException e) { e.printStackTrace(); } }
|