認識數據庫—MySQL
楔子
假設現在你已經是某大型互聯網公司的高級程序員,讓你寫一個火車票購票系統,來hold住十一期間全國的購票需求,你怎么寫?
由於在同一時段搶票的人數太多,所以你的程序不可能寫在一台機器上,應該是多台機器一起分擔用戶的購票請求。
那么問題就來了,票務信息的數據存在哪里?存在文件里么?
如果存儲在文件里,那么存儲在哪一台機器上呢?是每台機器上都存儲一份么?
首先,如果其中一台機器上賣出的票另外兩台機器是感知不到的,
其次,是如果我們將數據和程序放在同一個機器上,如果程序和數據有一個出了問題都會導致整個服務不可用
最后,是操作文件,修改文件對python代碼來說是一件很麻煩的事
基於上面這些問題,單純的將數據存儲在和程序同一台機器上的文件中是非常不明智的。

初始數據庫
為什么要使用數據庫?
根據上面的例子,我們已經知道:
第一,將文件和程序存在一台機器上是很不合理的。 第二,操作文件是一件很麻煩的事
所以就出現了一個新的概念 —— 數據庫
你可以理解為 數據庫 是一個可以在一台機器上獨立工作的,並且可以給我們提供高效、便捷的方式對數據進行增刪改查的一種工具。
如此就幫助我們解決了上面出現的問題,如果將所有的數據都存儲在一個獨立的機器上,而對用戶提供服務的機器只是存放你寫的代碼。

數據庫的優勢
1.程序穩定性 :這樣任意一台服務所在的機器崩潰了都不會影響數據和另外的服務。 2.數據一致性 :所有的數據都存儲在一起,所有的程序操作的數據都是統一的,就不會出現數據不一致的現象 3.並發 :數據庫可以良好的支持並發,所有的程序操作數據庫都是通過網絡,而數據庫本身支持並發的網絡操作,不需要我們自己寫socket 4.效率 :使用數據庫對數據進行增刪改查的效率要高出我們自己處理文件很多
認識數據庫
1 什么是數據(Data)
描述事物的符號記錄稱為數據,描述事物的符號既可以是數字,也可以是文字、圖片,圖像、聲音、語言等,數據由多種表現形式,它們都可以經過數字化后存入計算機
在計算機中描述一個事物,就需要抽取這一事物的典型特征,組成一條記錄,就相當於文件里的一行內容,如:
1 xiaobai,不詳,83,1935,山東,beijing
單純的一條記錄並沒有任何意義,如果我們按逗號作為分隔,依次定義各個字段的意思,相當於定義表的標題
id,name,sex,age,birth,born_addr,company # 字段/列名
1,xiaobai,不詳,83,1935,山東,beijing # 數據
這樣我們就可以了解小白,性別不詳,年齡83歲,出生於1935年,住的北京
2 什么是數據庫(DataBase,簡稱DB)
數據庫即存放數據的倉庫,只不過這個倉庫是在計算機存儲設備上,而且數據是按一定的格式存放的
過去人們將數據存放在文件櫃里,現在數據量龐大,已經不再適用
數據庫是長期存放在計算機內、有組織、可共享的數據集合。
數據庫中的數據按一定的數據模型組織、描述和儲存,具有較小的冗余度、較高的數據獨立性和易擴展性,並可為各種 用戶共享
3 什么是數據庫管理系統
DataBase Management System 簡稱DBMS
在了解了Data與DB的概念后,如何科學地組織和存儲數據,如何高效獲取和維護數據成了關鍵
這就用到了一個系統軟件---數據庫管理系統
如MySQL、Oracle、SQLite、Access、MS SQL Server
mysql主要用於大型門戶,例如搜狗、新浪等,它主要的優勢就是開放源代碼,因為開放源代碼這個數據庫是免費的,他現在是甲骨文公司的產品。
oracle主要用於銀行、鐵路、飛機場等。該數據庫功能強大,軟件費用高。也是甲骨文公司的產品。
sql server是微軟公司的產品,主要應用於大中型企業,如聯想、方正等。
4 數據庫服務器、數據管理系統、數據庫、表與記錄的關系
記錄:1 朱葛 13234567890 22(多個字段的信息組成一條記錄,即文件中的一行內容)
表:userinfo,studentinfo,courseinfo(即文件)
數據庫:db(即文件夾)
數據庫管理系統:如mysql(是一個軟件)
數據庫服務器:一台計算機(對內存要求比較高)
總結:
數據庫服務器-:運行數據庫管理軟件
數據庫管理軟件:管理-數據庫
數據庫:即文件夾,用來組織文件/表
表:即文件,用來存放多行內容/多條記錄
5 數據庫管理技術的發展歷程(了解)
一 人工管理階段
20世紀50年代中期以前,計算機主要用於科學計算。
當時的硬件水平:外存只有紙帶、卡片、磁帶,沒有磁盤等直接存取的存儲設備
當時的軟件狀況:沒有操作系統,沒有管理數據的軟件,數據的處理方式是批處理。
人工管理數據具有以下特點:
1 數據不保存:計算機主要用於科學計算,數據臨時用,臨時輸入,不保存
2 應用程序管理數據:數據要有應用程序自己管理,應用程序需要處理數據的邏輯+物理結構,開發負擔很重
3 數據不共享:一組數據只對應一個程序,多個程序之間涉及相同數據時,必須各自定義,造成數據大量冗余
4 數據不具有獨立性:數據的邏輯結構或物理結構發生變化后,必須對應用程序做出相應的修改,開發負擔進一步加大

二 文件系統階段
20世紀50年代后期到60年代中期
硬件水平:有了磁盤、磁鼓等可直接存取的存儲設備
軟件水平:有了操作系統,並且操作系統中已經有了專門的數據管理軟件,即文件系統;處理方式上不僅有了批處理,而且能夠聯機實時處理
文件系統管理數據具有以下優點:
1 數據可以長期保存:計算機大量用於數據處理,因而數據需要長期保存,進行增刪改查操作
2 由文件系統管理數據:文件系統這個軟件,把數據組織成相對獨立的數據文件,利用按文件名,按記錄進行存取。實現了記錄內的結構性,但整體無結構。並且程序與數據之間由文件系統提供存取方法進行轉換,是應用程序與數據之間有了一定的獨立性,程序員可以不必過多考慮物理細節。
文件系統管理數據具有以下缺點:
1 數據共享性差,冗余度大:一個文件對應一個應用程序,不同應用有相同數據時,也必須建立各自的文件,不能共享相同的數據,造成數據冗余,浪費空間,且相同的數據重復存儲,各自管理,容易造成數據不一致性
2 數據獨立性差:一旦數據的邏輯結構改變,必須修改應用程序,修改文件結構的定義。應用程序的改變,也將引起文件的數據結構的改變。因此數據與程序之間缺乏獨立性。可見,文件系統仍然是一個不具有彈性的無結構的數據集合,即文件之間是孤立的,不能反映現實世界事物之間的內存聯系。

三 數據系統階段
20世紀60年代后期以來,計算機用於管理的規模越來越大,應用越來越廣泛,數據量急劇增長,同時多種應用,多種語言互相覆蓋地共享數據結合要求越來越強烈
硬件水平:有了大容量磁盤,硬件架構下降
軟件水平:軟件價格上升(開發效率必須提升,必須將程序員從數據管理中解放出來),分布式的概念盛行。
數據庫系統的特點:
1 數據結構化(如上圖odboy_stu)
2 數據共享,冗余度低,易擴充
3 數據獨立性高
4 數據由DBMS統一管理和控制
a:數據的安全性保護
b:數據的完整性檢查
c:並發控制
d:數據庫恢復
初始MySQL
RDBMS 術語
在我們開始學習MySQL 數據庫前,讓我們先了解下RDBMS的一些術語:
- 數據庫: 數據庫是一些關聯表的集合。.
- 數據表: 表是數據的矩陣。在一個數據庫中的表看起來像一個簡單的電子表格。
- 列: 一列(數據元素) 包含了相同的數據, 例如郵政編碼的數據。
- 行:一行(=元組,或記錄)是一組相關的數據,例如一條用戶訂閱的數據。
- 冗余:存儲兩倍數據,冗余可以使系統速度更快。(表的規范化程度越高,表與表之間的關系就越多;查詢時可能經常需要在多個表之間進行連接查詢;而進行連接操作會降低查詢速度。例如,學生的信息存儲在student表中,院系信息存儲在department表中。通過student表中的dept_id字段與department表建立關聯關系。如果要查詢一個學生所在系的名稱,必須從student表中查找學生所在院系的編號(dept_id),然后根據這個編號去department查找系的名稱。如果經常需要進行這個操作時,連接查詢會浪費很多的時間。因此可以在student表中增加一個冗余字段dept_name,該字段用來存儲學生所在院系的名稱。這樣就不用每次都進行連接操作了。)
- 主鍵:主鍵是唯一的。一個數據表中只能包含一個主鍵。你可以使用主鍵來查詢數據。
- 外鍵:外鍵用於關聯兩個表。
- 復合鍵:復合鍵(組合鍵)將多個列作為一個索引鍵,一般用於復合索引。
- 索引:使用索引可快速訪問數據庫表中的特定信息。索引是對數據庫表中一列或多列的值進行排序的一種結構。類似於書籍的目錄。
- 參照完整性: 參照的完整性要求關系中不允許引用不存在的實體。與實體完整性是關系模型必須滿足的完整性約束條件,目的是保證數據的一致性。
mysql了解
數據庫管理軟件分類
管理數據的工具有很多種,不止mysql一個。關於分類其實可以從各個緯度來進行划分,但是我們最常使用的分類還是根據他們存取數據的特點來划分的,主要分為關系型和非關系型。
可以簡單的理解為,關系型數據庫需要有表結構,非關系型數據庫是key-value存儲的,沒有表結構
關系型:如sqllite,db2,oracle,access,sql server,MySQL,注意:sql語句通用 非關系型:mongodb,redis,memcache
關系型數據庫(RDBMS):RDBMS(relational database management system)指的是關系型數據庫管理系統 例如: 學生的信息(學號、姓名、性別、年齡、籍貫|學號、專業、班級、課程....) ——>是以表的形式存在於數據庫中(成千上萬張表,並且表與表之間有相應的關系),那么這樣的數據庫就是所謂的關系型數據庫 主流的關系型數據庫:oracle、mysql、DB2(IBM)、Sybase、SQL server(Microsoft微軟)、IBM Informix 關系型數據庫,是指采用了關系模型來組織數據的數據庫。簡單來說,關系模型指的就是二維表格模型。 優點:容易理解、方便使用、數據一致、讀寫實時等 事務: 一組dml語句 inster update delete... commit rollback 特點: 1、原子性 -10000 +10000 2、一致性 3、隔離性 A=x B=y x=x1 y=y1 4、持久性 關系型數據庫的最大特點就是事務的一致性:所以也在對事物一致性的維護中有很大的開銷 1. 登陸ATM機,輸入密碼; 2. 連接數據庫,驗證密碼; 3. 驗證成功,獲得用戶信息,比如余額等; 4. 用戶輸入需要轉賬的金額,按下確認鍵; 5. 從后台數據庫中減掉用戶賬戶上的對應金額; 6. 從后台數據庫中給對方賬戶增加相應的金額; 7. 確認,退卡,走人; 對於上面的轉賬這個事情,如果有一步出現了錯誤,那么就取消整個轉賬的動作; 簡單來說,就是轉賬這6步,要么都完成,要么就啥也不做。在數據庫中,事務也是這個道理。 事務:事務由一條或者多條sql語句組成,在事務中的操作,這些sql語句要么都執行,要么都不執行,這就是一個事務。 在關系型數據庫中,導致性能欠佳的最主要原因是多表的關聯查詢,以及復雜的數據分析類型的復雜SQL報表查詢。 應用場景:1、對數據的一致性要求較高;2、對讀寫的實時性要求較高;3、典型的銀行及支付系統類;
非關系型數據庫:【nosql數據庫】 分布式系統 大數據特點:海量、高速、多樣、價值 多樣:數據類型(結構化 半結構化 非結構化) | | | RDBMS XML-BLOG 圖片、音頻 常見的非關系型數據庫:MangoDB、Redis、Membase等 應用場景:1、對數據庫性能要求較高;2、需要靈活性更強的IT系統;3、不需要高度的數據一致性;
http://db-engines.com/en/ranking 查看數據庫排名
mysql
Oracle 對MySQL版本重新進行了划分,分成了社區版和企業版,企業版是需要收費的,當然收費的就會提供更多的功能。
社區版:MySQL Community Edition (GPL) --社區版 1、可以看做是企業版的“廣泛體驗版(小白鼠版)”,未經各個專有系統平台的壓力測試和性能測試 2、基於GPL協議發布,可以隨意下載使用 3、沒有任何官方技術支持服務 企業版:MySQL Enterprise Edition --企業版 MySQL Cluster CGE -- 集群版 1、提供了比較全面的高級功能、管理工具及技術支持 2、安全性、穩定性、可擴展性比較好
mysql優點
- Mysql是開源的,所以你不需要支付額外的費用。
- Mysql支持大型的數據庫。可以處理擁有上千萬條記錄的大型數據庫。
- MySQL使用標准的SQL數據語言形式
- Mysql可以允許於多個系統上,並且支持多種語言。這些編程語言包括C、C++、Python、Java、Perl、PHP、Eiffel、Ruby和Tcl等。
- Mysql對PHP有很好的支持,PHP是目前最流行的Web開發語言。
- MySQL支持大型數據庫,支持5000萬條記錄的數據倉庫,32位系統表文件最大可支持4GB,64位系統支持最大的表文件為8TB。
- Mysql是可以定制的,采用了GPL協議,你可以修改源碼來開發自己的Mysql系統。
Mysql的獲取:
www.mysql.com
