在使用 DOM 解析 XML 文档时,需要读取整个 XML 文档,在内存中构架代表整个 DOM 树的 Doucment 对象,从而再对 XML 文档进行操作。此种情况下,如果 XML 文档特别大,就会消耗计算机的大量内存,并且容易导致内存溢出。
SAX 解析允许在读取文档的时候,即对文档进行处理,而不必等到整个文档装载完才会文档进行操作。
SAX采用事件处理的方式解析XML文件,利用 SAX 解析 XML 文档,涉及两个部分:解析器和事件处理器:
•解析器可以使用JAXP的API创建,创建出SAX解析器后,就可以指定解析器去解析某个XML文档。
•解析器采用SAX方式在解析某个XML文档时,它只要解析到XML文档的一个组成部分,都会去调用事件处理器的一个方法,解析器在调用事件处理器的方法时,会把当前解析到的xml文件内 容作为方法的参数传递给事件处理器。
•事件处理器由程序员编写,程序员通过事件处理器中方法的参数,就可以很轻松地得到sax解析器解析到的数据,从而可以决定如何对数据进行处理。
book.xml
<书架> <书> <书名> java web就业 书名> <作者> 张孝祥 作者> <售价> 40 售价> 书> <书> <书名> C++教程 书名> <作者> 自己 作者> <售价> 50 售价> 书> 书架>
package com.xmlsax;import java.io.IOException;import java.util.ArrayList;import java.util.List;import javax.xml.parsers.ParserConfigurationException;import javax.xml.parsers.SAXParser;import javax.xml.parsers.SAXParserFactory;import org.xml.sax.Attributes;import org.xml.sax.SAXException;import org.xml.sax.XMLReader;import org.xml.sax.helpers.DefaultHandler;//自定义事件处理器, 封装xml中的配置bean到list中class BeanListHandler extends DefaultHandler{ private Listbooks = new ArrayList (); private Book book = null; private String currentTag = null; @Override public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException { currentTag = qName; if ("书".equals(currentTag)) { book = new Book(); } } @Override public void characters(char[] ch, int start, int length) throws SAXException { //System.out.println(currentTag); if ("书名".equals(currentTag)) { String name = new String(ch, start, length); book.setName(name); } if ("作者".equals(currentTag)) { String author = new String(ch, start, length); book.setAuthor(author); } if ("售价".equals(currentTag)) { String price = new String(ch, start, length); book.setPrice(Double.parseDouble(price)); } } @Override public void endElement(String uri, String localName, String qName) throws SAXException { if ("书".equals(qName)) { books.add(book); book = null; } currentTag = null; //必须置空,否则我们会得到标签之间的空值 } public List getBooks() { return books; }}public class SaxTest { public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException { //1:得到sax解析器工厂 SAXParserFactory factory = SAXParserFactory.newInstance(); //2:获得sax解析器 SAXParser parser = factory.newSAXParser(); //3:获得XMLReader读取器 XMLReader reader = parser.getXMLReader(); //4: 配置事件处理器 BeanListHandler beanListHandler = new BeanListHandler(); reader.setContentHandler(beanListHandler); //5:读取XML文件 reader.parse("src/book.xml"); List list = beanListHandler.getBooks(); for (Book b : list) { System.out.println(b.getName() + ": " + b.getAuthor() + " : " + b.getPrice()); } } }