數據庫技術的發展趨勢


數據庫技術的發展趨勢

​ 隨着計算機技術特別是計算機網絡技術的發展,傳統的數據庫技術面臨挑戰。主要表現在以下幾個方面:

  • 環境的變化 數據庫的應用環境由可控制的環境變成多變的異構信息集成環境和Internet環境。
  • 數據類型的變化 數據庫中的數據類型由結構化擴大至半結構化、非結構化和多媒體數據類型。
  • 數據來源的變化 大量數據將來源於實時和動態的傳感器或監測設備,需要處理的數據量劇增。
  • 數據管理要求的變化 許多新型應用需要支持協同設計和工作流管理。

面向對象數據庫

​ 把面向對象的技術與數據庫技術相結合,便產生了面向對象數據庫。目前,面向對象數據庫是數據庫技術的一個重要發展方向,國外已經推出一些面向對象數據庫產品,如美國Itasca System 公司的Itascs、Object Design公司的ObjectStore。這些面向對象數據庫一般采用的是“純”的面向對象模型。另外,還有一類面向對象數據庫基於原有的關系數據庫擴展而來的,即在關系數據庫上引進封裝、繼承、隨機數據類型等概念。一些著名的數據庫廠商及第三方廠商在關系數據庫上開發了大量的面向對象開發工具及環境。

分布式數據庫

  • 分布式數據庫系統由多台計算機組成,每台計算機上配有各自的本地數據庫,各計算機之間通過通信網絡連接。在這種系統中,大多數處理任務由本地計算機訪問本地數據庫來完成,對於少量本地計算機不能單獨勝任的處理任務,則通過通信網絡與其他計算機相聯系,並獲得其他數據庫中的數據。
  • 分布式數據庫的數據在地理上分散、邏輯上集中,數據由系統統一管理,使用戶感覺不到數據的分散,用戶看到的似乎是一個集中式數據庫。與集中式數據庫比較,分布式數據庫具有體系結構靈活性大、可靠性高、可用性好、可擴充性好等優點。同時,也存在一些不足:分布式數據庫雖然有利於改善性能,但如果數據庫設計不好,數據分布不合理,使遠距離訪問過多,特別是當分布連接操作過多時,會降低系統的性能。

聯邦數據庫

​ 人類在其文明形成和發展過程中已經積累了浩瀚的數據,並且采用已有的各種DBMS分別進行着管理。即使以后數據庫技術大大進步了,人類不可能也不應該放棄這筆巨大的財富。相反,應充分地發揮其作用。顯然,完全用一種統一的數據庫來改造它們幾乎是不可能的。因此必須承認現實,在已有的數據庫基礎上實現一定程度的聯合(或綜合)使用。 我們把數據庫的聯合或綜合稱為聯邦數據庫。聯邦數據庫主要是在分布的環境下實現數據的集成。由於各個數據庫的數據模型、DBMS和計算機機型有很大的差別,因此聯邦數據庫實際上是結點異構型分布數據庫的推廣。聯邦數據庫不但要解決分布環境下的並發控制和數據一致性等問題,而且要解決由於數據模型、語言和語義解釋的不同以及操作系統的異構帶來的各種困難。另外,在數據共享時,還需處理各個數據庫原始數據的不完全性和不一致性等問題。雖然聯邦數據庫的實現較困難,但人們還是在向這方面作努力。

數據倉庫

​ 數據倉庫是指這樣一種數據的存儲地,來自於異地、異構的數據源或數據庫的數據,經加工后在數據倉庫中進行存儲、存取和維護。數據倉庫提供來自種類不同的應用系統集成的和反映歷史變化的數據,使用戶擁有任意存取數據的自由,而不干擾業務數據的正常運行。數據倉庫不是單一的產品,而是由軟、硬件技術組成的環境。它把各種數據源(源數據庫)集成為一個統一的數據倉庫,便於用戶訪問並能從歷史的角度進行分析,最后做出決策。目前,數據挖掘已和數據倉庫結合起來,研究重點放在數據倉庫的有效應用上。

實時數據庫

​ 在現實世界中,不少應用活動有很強的時間性,即要求在規定的時間內完成事務處理。例如,電話交換、工廠生產過程控制、導彈飛行控制。實時數據庫就是數據和事務都有時間限制的數據庫。在實時數據庫中,系統的正確性不僅依賴於事務的邏輯結果,而且依賴於該邏輯結果所產生的時間

時態數據庫

​ 我們知道,時間是自然界的客觀屬性,所有信息都具有相應的時態屬性。常規數據庫描述系統的當前狀態。隨着時間的推移,系統的狀態不斷地變化,數據庫也不斷地更新。數據庫更新就是以新的狀態取代舊的狀態,舊的狀態一般不再保留。實質上,常規數據庫僅僅在時間維上保留當前的一個快照。在相當多的應用中,不但要查詢事物的當前狀態,有時還要查詢過去的情況,甚至未來的預測或計划的情況。這種能夠表示和處理時態數據的數據庫稱為時態數據庫

​ 按表示時態信息的方式,可以將數據庫分成基本的4個類型:快照數據庫、回滾數據庫、歷史數據庫和雙時態數據庫。通常將后三種都稱為時態數據庫。但是,從廣義的角度,這4種數據庫都可以稱作時態數據庫。

空間數據庫

​ 在許多應用中,事物的空間關系往往成為其主要查詢或處理的內容。例如,天文、地理、城市規划、管道網絡、交通圖、大規模集成電路、分子結構圖、醫學圖片。面向這類應用的數據庫必須在常規數據庫的基礎上,增加空間數據類型及其相關的操作,提供空間索引以及面向空間應用的交互式圖形用戶界面。經過這樣擴充的數據庫稱為空間數據庫。

​ 此外,一些數據庫的數據盡管不屬於空間數據類型,但也可以被當作多維空間問題處理。例如,在關系數據庫中,隨着普遍使用多屬性查詢,如果將每個被查詢的屬性看作查詢空間的一個維度,則多屬性查詢便可歸結為多維空間的搜索

多媒體數據庫

​ 通常,把能夠管理數值、文字、表格、圖形、圖像、聲音等多種媒體的數據庫稱為多媒體數據庫。由於不同媒體上的信息具有不同的性質與特性,如何組織不同媒體上的信息,將不同媒體上的數據一體化, 是多媒體數據庫要解決的問題。與傳統DBMS一樣,多媒體DBMS也要進行數據處理、查詢和事務處理。

​ 在多媒體DBMS中特別強調“媒體獨立性”。所謂媒體獨立性是指不論管理的多媒體數據庫的媒體如何變化,都不需改變DBMS。因此多媒體應能支持:①媒體的混合。在DBMS中,當遇到各種混合在一起的媒體,需對它們進行統一管理;②媒體的擴充。DBMS能處理圖形、圖像、聲音等信息,此外,它應該能根據要求處理新的媒體;③媒體的轉換。DBMS能對所遇到的各種媒體進行相互轉換,以保障媒體的互換性。

工作流數據庫

​ 雖然信息技術的發展推動了社會的迅速前進,但是許多企業的生產效率由於受到傳統組織結構的阻礙而未能大幅度地提高。許多研究人員提出了很多解決思想和方法。例如,業務流程重組(Business Process Reengineering,BPR)就是這樣一種要求對傳統管理思想進行重新思考,重新設計業務流程以便極大地提高企業生產效率的理論。工作流DBMS就是為了適應這類業務處理需求而產生的。這類業務處理需求注重提高企業中員工的工作協調性,它包括處理工作請求、何人何時做何工作,以及匯報工作完成情況、評價工作的滿意程度。工作流DBMS是在數據庫的基礎上完成的,它對傳統的數據庫技術提出了一些特殊的要求。例如,長事務支持、協調多個活動對共享數據庫的訪問、對事件的支持等。

嵌入式數據庫

​ 運行在嵌入式系統的數據庫稱為嵌入式數據庫,比如IBM DB2的衛星版及漫游版可用於Palm OS或Windows CE等。隨着嵌入式系統廣泛應用,嵌入式數據庫具有廣闊的應用前景。

移動數據庫

​ 移動計算的興起引發了數據庫技術的又一次突破,數據庫的移動計算版本即移動數據庫也應運而生。移動數據庫是指支持移動計算環境的分布式數據庫。目前的移動數據庫一般利用掌上設備,通過有線或無線通信手段下載主機數據,再由自身的數據管理和處理系統來實現特定的應用,以適應移動辦公、人員流動及特殊環境的需求。由於移動數據庫通常應用在諸如掌上電腦、PDA、車載設備、移動電話等嵌入式設備中,因此它又被稱為嵌入式移動數據庫。移動數據庫在實際應用中必須解決好數據的一致性(復制性)、高效的事務處理、數據的安全性等問題。

演繹數據庫

演繹數據庫是一種基於邏輯推理的數據庫,它將數據庫看成一個演繹系統,即一個數據庫可與一個演繹理論相一致,由一些公理組成,通過公理中的演繹規則導出定理,或者說演繹數據庫是一種具有演繹推理能力的數據庫。

主動數據庫

​ 我們常常稱傳統數據庫是“被動的”,僅當用戶或應用程序“要它動時,它才動”,它所能提供的信息都是“過去”或“當前”的。主動數據庫能主動監視當前尚不存在的、所希望的“未來”狀態(關於數據庫或非數據庫的條件)的出現。一旦這種狀態出現則啟動相應的活動(程序)。因而,主動數據庫不僅存儲了數據,還存儲了控制知識。不但能接受關於“過去”和“當前”的查詢,還能處理關於“未來”的查詢。不僅程序可驅動數據庫,還能進行程序與數據庫之間的雙向驅動。

模糊數據庫

​ 數據庫是對客觀世界一部分的抽象描述。建立數據模型的主要目的在於建立一種抽象模型,以便把客觀世界描述得更加貼切逼真。現實世界中大部分事物是表露不全、不確定和模糊不清的,一般很難采用一種基於二值邏輯和精確數學理論的數據模型來描述。因此有必要把不完全性、不確定性和模糊性數據引入數據庫,開展模糊數據庫的研究。模糊數據庫能夠更加貼切地描述客觀世界,它已經在模糊查詢、模式識別、決策咨詢和知識處理等方面獲得了成功的應用。

大數據

​ 大數據(Big Data)是指體量大、類型多、價值密度低的數據集合。大數據的特征可以用4個V(來自於4個英語單詞Volume、Variety、Value、Velocity 的首字母)來概括:

  • 體量(Volume)大 大數據需要處理的數據量往往高達TB(1TB = 1024GB,1 MB = 1024 KB)、PB(1PB = 1024TB),乃至EB(1 EB = 1024 PB)級。
  • 類型多(Variety) 相對於以往以字符、數值、日期、邏輯、備注型為主的結構化數據,大數據主要關心非結構化數據,包括音頻、視頻、圖像數據。
  • 價值高(Value) 大數據往往潛在價值較高,但是價值密度低,例如高空偵察、視頻監控中絕大多數數據幾乎是沒有任何價值的。
  • 處理快(Velocity) 大數據的快速獲取、處理與分析是大數據獲得有效應用的重要保證。
  • 大數據關鍵技術包括大數據的獲取、處理、存儲、檢索、管理、保護、展現和應用。
  • 大數據應用十分廣泛,涉及到人類工作、學習和生活的各個領域,如產品優化設計、水果優化種植、商業分析、金融分析、投資分析、情報分析、交通分析、天氣預報、醫療診斷、治安監控。

雲計算

​ 雲計算(Cloud Computing)是一種新興的商業計算模型,它將計算任務分布在大量計算機構成的資源池上,使各種應用系統能夠根據需要獲取計算力、存儲空間和各種軟件服務。雲計算的核心思想是將大量用網絡連接的硬件、軟件與數據等構成一個計算資源池,進行統一管理和調度,通過網絡向用戶按需提供可動態伸縮的廉價計算服務。雲計算具有如下特點:

  • 能力強:雲計算一般擁有大量的計算資源,一個雲計算系統可以擁有100萬台服務器、EB級的數據。
  • 虛擬化:雲計算是一個虛擬的資源池,它將硬件、軟件與數據等資源全部虛擬化,用戶通過網絡使用資源池內的計算資源。
  • 高可靠性:雲計算系統管理方式可靠,即使出現部分節點出錯、失效也不會影響系統的正常運行。
  • 廉價性:雲計算系統對資源實施智能化、自動化、集中式管理,用戶無需關心設備更新、系統維護等工作,大量的用戶使用提高了資源利用率、降低了使用成本。
  • 大數據一般采用雲計算技術進行數據采集、處理、管理與挖掘。
  • 雲計算提供基礎設施即服務(Infrastructure as a Service,IaaS)、平台即服務(Platform as a Service,PaaS)和軟件即服務(Software as a Service,SaaS)等三種服務模式。
    • IaaS是指用戶通過網絡獲得計算基礎設施服務,如租用服務器。
    • PaaS是指將軟件開發平台作為一種服務提供給用戶,如Google App Engine、百度應用引擎。
    • SaaS是一種通過互聯網提供軟件服務的模式,用戶通過租用並利用客戶端程序(如瀏覽器)使用軟件,實現生產經營活動的管理,如在線進銷存、企業電子郵局。

v為了迎接這些挑戰,許多數據庫技術研究和實踐人員提出新的數據庫概念,並開始在實際中使用。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM