3.3 Java 語言的 XML 驗證 API
檢查文檔是否遵循了模式中規(guī)定的規(guī)則。不同的解析器和工具支持不同的模式語言如 DTD、W3C XML Schema 語言、RELAX NG 和 Schematron。Java 5™ 增加了統(tǒng)一的驗證應(yīng)用程序編程接口(API),可以把文檔和用這種或那種語言編寫的模式作比較。了解這種 XML 驗證 API。
驗證是一種強大的工具。它可以快速檢查輸入是否大體上符合預期的形式,立刻拒絕與處理目標相距甚遠的文檔。如果數(shù)據(jù)中存在問題,早發(fā)現(xiàn)要比晚發(fā)現(xiàn)好。
對于可擴展標記語言(XML)來說,驗證一般意味著用各種模式語言為文檔內(nèi)容編寫詳細的規(guī)范,這些語言包括萬維網(wǎng)聯(lián)盟(W3C)的 XML Schema Language (XSD)、RELAX NG、文檔類型定義(DTD)和 Schematron 等。有時候驗證在解析的同時進行,有時候在解析完成后立刻進行。但一般在對輸入的其他處理之前完成。(這一段描述只是粗略來說,因為存在例外。)
直到最近,程序請求驗證的具體應(yīng)用程序編程接口(API)還隨著模式語言和解析器的不同而不同。DTD 和 XSD 是 Simple API for XML (SAX)、文檔對象模型(DOM)和 Java™ API for XML Processing (JAXP) 常見的配置選項。RELAX NG 需要自定義的庫和 API。Schematron 可以使用 Transformations API for XML(TrAX),還有其他模式也要求程序員學習更多的 API,盡管執(zhí)行的操作基本相同。
Java 5 引入了 javax.xml.validation 包,提供了獨立于模式語言的驗證服務(wù)接口。這個包也可用于 Java 1.3 及更高版本,不過要單獨安裝 JAXP 1.3。其他產(chǎn)品中,Xerces 2.8 包含了這個庫的實現(xiàn)。
驗證
javax.xml.validation API 使用三個類來驗證文檔:SchemaFactory、Schema 和 Validator。還大量使用了 TrAX 的 javax.xml.transform.Source 接口來表示 XML 文檔。簡言之,SchemaFactory 讀取模式文檔(通常是 XML 文件)并創(chuàng)建 Schema 對象。Schema 創(chuàng)建一個 Validator 對象。最后,Validator 對象驗證表示為 Source 的 XML 文檔。
清單 1 顯示了一個簡單的程序,用 DocBook XSD 模式驗證在命令行中輸入的 URL。
清單 1. 驗證可擴展超文本標記語言(XHTML)文檔
import java.io.*;
import javax.xml.transform.Source;
import javax.xml.transform.stream.StreamSource;
import javax.xml.validation.*;
import org.xml.sax.SAXException;
public class DocbookXSDCheck {
public static void main(String[] args) throws SAXException, IOException {
// 1. Lookup a factory for the W3C XML Schema language
SchemaFactory factory =
SchemaFactory.newInstance("http://www.w3.org/2001/XMLSchema");
// 2. Compile the schema.
// Here the schema is loaded from a java.io.File, but you could use
// a java.net.URL or a javax.xml.transform.Source instead.
File schemaLocation = new File("/opt/xml/docbook/xsd/docbook.xsd");
Schema schema = factory.newSchema(schemaLocation);
// 3. Get a validator from the schema.
Validator validator = schema.newValidator();
// 4. Parse the document you want to check.
Source source = new StreamSource(args[0]);
// 5. Check the document
try {
validator.validate(source);
相關(guān)推薦:北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |