Delphi 7支持對XML文檔的操作,可以通過 TXMLDocument類來實現對XML文檔的讀寫。可以利用TXMLDocument把XML文檔讀到內存中,從而可以進行編輯、保存操作。TXMLDocument類是通過DOM(文檔對象模型)接口來訪問XML文檔中的各個元素的。對於DOM接口的實現有多種方式,Delphi 支持的方式有
1)微軟的MSXML SDK,這種方式是通過COM對象來實現
2)Apache的Xerces的實現方式
3)另外就是開源的OpenXML的實現方式。
對於不同的接口實現方式可以通過設定TXMLDocument的DOMVender來進行控制。
支持XML的Delphi 單元主要存在與 ...\Borland\Delphi\Source\Xml目錄下,主要包括:XMLIntf、XMLDoc、xmldom、msxmldom、xercesxmldom、xdom、oxmldom等單元
1)XMLIntf-----包括了Borland自己定義的XML文檔接口
2)XMLDoc-----是對XMLIntf中所定義接口的Borland實現
3)Xmldom-----定義了DOM(文檔對象模型)接口,這裏對DOM接口進行了Borland的實現
4)Msxmldom-----實現微軟對Xmldom中定義的接口的實現,主要調用微軟的COM對象來實現,對Xmldom中定義接口的封裝
5)Xercesxmldom-----Borland通過Xerces XML DOM 方式來實現對Xmldom 中定義接口的封裝
6)Oxmldom-----Borland通過使用OpenXML來實現對Xmldom中定義接口的封裝
TXMLDocument類的屬性,請參考Borland的幫助文檔
讀寫XML文檔
1)讀取XML文檔
通常情況下不通過直接使用TXMLDocument對象來進行XML文件的讀取,而是使用XMLDoc單元中提供的幾個游泳的函數來讀取XML文檔,這些函數包括
1.function LoadXMLDocument(const FileName :DOMString): IXMLDocument
2.function LoadXMLData(const XLData :DOMString): IXMLDocument; overload;
3.function LoadXMLData(const XMLData: string):IXMLDocument; overload;
4.function NewXMLDocument(Version:DOMString='1.0'): IXMLDocument;
可以看出這些函數全部返回的是IXMLDocument接口,得到了IXMLDocument接口再進行文檔的操作;
這些函數都是通過創建TXMLDocument 對象來實現對XML文檔的讀取的;其中NewXMLDocument僅僅創建一個IXMLDocument的接口
可以這樣利用NewXMLDocument來讀取XML文檔
XMLDoc := NewXMLDocument;
XMLDoc.LoadFormFile(FileName);
2)保存XML文檔
可以通過下面的方式來保存XML文檔
XMLDoc := NewXMLDocument;
iRoot := IXMLDoc.CreateNode('TestXMLDocument');
XMLDoc.DocumentElement := iRoot;
...
XMLDoc.SaveToFile(FileName);
可以看出通過接口來操作XML文檔是非常方便的。
選用不同類型的XML解析方式
上面已經提到有三種方式實現DOM,也就是可以用Borland提供的3種不同的XML解析器來對XML文檔進行解析
三種解析器
1)微軟的解析器(MSXML SDK)
微軟解析器主要應用在Windows中,在按炸ungMSXML SDK的時候安裝解析器,同時IE瀏覽器也提供瞭解析器,這個解析器就是一個COM
2)Apache的Xerces解析器
Borland自己實現了一個Xerces解析器,這個可以通過調用xercesxmldom.dll模塊來實現;如果使用這個解析器可能需要同應用程序一起進行分發xercesxmldom.dll,XercesLib.dll,CC3260MT.DLL這三個DLL文件
3)OpenXML解析器
使用不同解析器的分析
1)微軟的解析器
微軟的解析器當然好了,但也不能排除存在的意外情況,在我個人的經驗中,至少我們公司對於XML解析的方式,只有在IE6.0以上的版本才能夠正常的工作;
至於Borland同樣是通過引入MSXML.DLL的接口實現的,所以可以推理出,同樣存在同樣的問題;這個通過研究TMSDOMImplementation(msxmldom單元中)的實現方式可以得到證明,實現的過程中通過調用CoCreateInstance函數接口來實現解析的;
在發佈解析XML的代碼的時候可能就會存在由於IE的本版的不同,需要把IE6.0一同發佈,比較麻煩;
2)Borland的Xerces解析器
這種方式的解析器是通過 LoadLibrary(PChar(LibName));函數,LibName 的內容是 xercesxmldom.dll(Windows 平台),libxercesxmldom.so.1(Linux平台)。那麼就需要隨時同應用程序一起發佈的DLL,就包括了xercesxmldom.dll,XercesLib.dll,CC3260MT.DLL
這個發佈相對與發佈不同版本的IE6.0來説簡單些
3)OpenXML解析器
由於存在xdom.pas單元,這個單元中包含了完全的XML解析的源碼,那麼應用這種方式,可以避免軟件發佈的種種問題,這是由於解析器的代碼被靜態編譯在應用程序中,唯一的不好的地方就是應用程序的體積可能會大一些
如何使用不同的解析器
我們可以寫一個函數來使用不同的解析器:
function NewDiffXmlDocument(DOMVendor: string; Version : DOMString = '1.0'): IXMLDocument;
var
XMLDoc : TXMLDocument;
begin
XMLDoc := TXMLDocument.Create(nil);
XMLDoc.DOMVendor := GetDOMVender(DOMVendor);
Result := XMLDoc;
Result.Active := True;
if Version <> '' then
Result.Version := Version;
end;
其中DOMVendor如果用Borland提供的三種方式進行解析的話,分別取值是
1)MicroSoft-----存在於msxmldom.pas單元中的SMSXML常量
2)Xerces-----存在於xercesxmldom.pas單元中的SXercesXML常量
3)OpenXML-----存在yuoxmldom.pas單元中的SOpenXml常量
這是由於在msxmldom、xercesxmldom、oxmldom三個單元的 initialization部分,都通過調用RegisterDOMVendor 函數,註冊了不同的解析器接口
當然,Borland同樣提供了一種可以靈活進行擴展的機制來擴展用户自己的解析器,這個需要繼承,TDOMVendor類(存在於xmldom單元中)。實際上,Borland自己就是通過這種方式來實現不同方式解析器的;具體的實現過程可以參看oxmldom單元中對xdom的封裝。
結論
Delphi作為一個成功的開發工具,他自身實現的對XML的支持,肯定比網絡上某些實現要穩定、高效的多,我們沒有必要在進行另外的封裝什麼MSXML.DLL的COM接口。當然可以自己實現不同的XML解析器,也可以應用已經存在的解析器。同時,可以看出Delphi 對於XML的支持也是非常完善的