1. 現實世界
現實世界是存在於人們頭腦之外的客觀世界,是客觀事物及其互相的聯系。例如學校教學管理中涉及的學生管理、教師管理、課程管理。管理者要求:每個學期開學時制作學生選修課程情況表,內容包括學號、姓名、課程名、選修課類別(類別分為必修、選修);每個學期結束時制作學生選修課程成績表,內容包括學號、姓名、課程名、選修課的類別、總評成績;制作教師授課安排表,內容包括教師號、教師名,課程名,授課類別(授課類別分為主講、輔導、實驗)、學時數、班級數等。這就是現實世界,是數據庫設計者接觸到的最原始的數據,數據庫設計者對這些原始數據進行綜合、抽象成為數據庫技術所能處理的數據。對現實世界的數據描述,就成為信息世界。
2. 信息世界
信息世界是現實世界的符號描述,即將客觀世界用數據來描述。例如,學生是客觀世界的個體,可以用一組數據(學號、姓名、性別、年齡、班級、成績)來描述,有這樣一組數據不見其人便可以了解該學生的基本情況。因此可以說信息世界就是我們所說的數據世界。信息世界中的術語包括:
(1) 實體。客觀世界存在的、可以區別的事物稱為實體。實體可以是具體的事物,例如學生李,教師張、數學課,也可以是抽象的事件,例如:本學期學生李選修了哪些課程,教師張教授了哪門課程,讀者的一次借閱活動等。
(2) 屬性。實體有很多特性,每個特性稱為實體的一個屬性,每個屬性有一個類型。例如學生實體的屬性有:學號、姓名、性別、年齡、班級、成績,其中學號、姓名、班級的類型為字符型,性別的類型為邏輯型,年齡的類型為整型。
(3) 實體集。性質相同的實體的集合。例如全體學生的集合,全體教師集合等。
(4) 實體標識符。能夠唯一標識實體的屬性或屬性的集合。如學生實體的屬性:學號,能夠唯一確定一個學生,因此可以作為學生實體集的標識符。
3. 機器世界
信息世界中的數據在機器世界中的存儲,成為計算機的數據。機器世界中對數據的描述采用數據庫技術的專業術語,對應於信息世界的術語有以下四個專業術語:
(1) 記錄。對應於信息世界中的每一個實體的數據。例如學生這一實體的一組數據(20100301001,孤傲蒼狼,男,20,計算機0901,87)就是一條記錄
(2) 字段,對應於信息世界中的屬性,在數據庫技術中稱為字段,學生實體中學號、姓名、性別、班級、成績都是字段,每個字段都有它的類型、取值范圍,字段的取值范圍稱為字段的域。
(3) 數據文件。對應於信息世界的實體集。由若干個相同類型記錄組成的數據集合,在數據庫系統中以文件(二維表)的形式存放。
(4) 關鍵字。能夠唯一標識記錄的字段或字段表達式,與信息世界中的實體標識符相對應,例如學生實體中的學號可以作為學生的關鍵字。
從客觀世界到信息世界不是簡單的數據描述,而是從客觀世界中抽象出適合數據庫技術研究的數據。同時要求這些數據能夠很好地反映客觀世界的事物;從信息世界到機器世界也不再是簡單的數據對應存儲,而是要設計數據的邏輯結構和物理存儲結構。所謂數據的邏輯結構是指程序員或用戶用以操作的數據形式,數據的邏輯結構是數據本身所具有的特性,是現實世界的抽象;所謂數據的物理結構是實際存儲在存儲設備上的數據。
在數據庫系統中,數據的邏輯結構於數據的物理結構之間可以差別很大,數據的邏輯結構面向程序員,數據的物理結構面向機器。數據庫管理軟件的功能之一,就是要能夠把數據的邏輯結構映像為數據的物理結構,把數據的物理結構映像為數據的邏輯結構。
