圖1:Your Data,Any Where、Any Time、Any Device. But not on your finger.
1.2 主要檢索技術的區別
& F$ m0 C. B% @7 h
有了數據但是沒有被使用,那么這些數據不應該被稱為信息。它們無非是不斷充斥設備和網絡的比特而已,但是如何把數據提供給必要的人員,檢索技術是其中非常有效的途徑之一。本文筆者主要基于微軟平臺,針對SQL Server 2005提供的全文檢索技術進行介紹。與關系數據查詢、多維數據庫查詢和基于XML的XQuery、XPath不同,全文檢索技術主要處理對象是基于超大數據量的文本數據和結構化的二進制數據上類似LIKE的模糊查詢。主要區別見下表。
關系數據庫查詢 | 多維數據查詢 | XML查詢 | 全文檢索 | |
檢索技術 | SQL | MDX | XQuery、XPath | SQL (extension) |
主要處理對象 | 關系二維數據 | 結構化多維數據 | 層次型數據 | 大容量二維和層次型數據的模糊檢索 |
主要應用領域 | 一般的OLTP類應用 | 一般的OLAP類分析型應用 | 面向Internet、Intranet的松散耦合SOA應用 | 企業內部知識管理類應用 |
索引 | 大量使用非聚簇索引,一般保存在數據庫中。 | 通過層次型、保存中間結果的方式,通過不同的軸向快速定位信息剖面。 | 基于XPath的索引,索引一般保存在數據庫中。 | 基于關鍵字的索引,保存在文件系統中。每個表僅支持一個索引。 |
表1:全文檢索與關系數據庫查詢、多維數據查詢、XML查詢的對比