XML 文档定义有几种形式?它们之间有何本质区别?解析 XML 文档有哪几种方式

答:

  • 1)两种形式:dtd 以及 schema;
  • 2)本质区别:schema 本身是 xml 的,可以被 XML 解析器解析(这也是从 DTD上发展 schema 的根本目的);
  • 3)解析方式:有 DOM,SAX,STAX 等:
    • DOM:处理大型文件时其性能下降的非常厉害。这个问题是由 DOM 的树结构所造成的,这种结构占用的内存较多,而且 DOM 必须在解析文件之前把整个文档装入内存,适合对 XML 的随机访问;
    • SAX:不同于 DOM,SAX 是事件驱动型的 XML 解析方式。它顺序读取 XML 文件,不需要一次全部装载整个文件。当遇到像文件开头,文档结束,或者标签开头与标签结束时,它会触发一个事件,用户通过在其回调事件中写入处理代码来处理 XML 文件,适合对 XML 的顺序访问;
    • STAX:Streaming API for XML (StAX)。