(大數據工程師學習路徑)第四步 SQL基礎課程----select詳解


准備

在正式開始本內容之前,需要先從github下載相關代碼,搭建好一個名為mysql_shiyan的數據庫(有三張表:department,employee,project),並向其中插入數據。

具體操作如下,首先輸入命令進入Desktop:

cd Desktop 

然后再輸入命令,下載代碼:

git clone http://git.shiyanlou.com/shiyanlou/SQL4 

下載完成后,輸入“cd ~”(注意有空格)退回到原先目錄,然后輸入命令開啟MySQL服務並使用root用戶登錄:

sudo service mysql start #打開MySQL服務 mysql -u root #使用root用戶登錄 

剛才從github下載的SQL4目錄下,有個兩文件“MySQL-04-01.sql”和“MySQL-04-02.sql”,其中第一個文件用於創建數據庫,第二個文件向數據庫中插入數據。

SQL4目錄在桌面上,你可以用Gedit查看里面兩個的文件。

輸入命令運行第一個文件,搭建數據庫:

source /home/shiyanlou/Desktop/SQL4/MySQL-04-01.sql 

運行第二個文件,向數據庫中插入數據:

source /home/shiyanlou/Desktop/SQL4/MySQL-04-02.sql 

一、內容

在數據庫操作語句中,使用最頻繁,也被認為最重要的是SELECT查詢語句。之前的實驗中,我們已經在不少地方用到了 SELECT * FROM table_name; 這條語句用於查看一張表中的所有內容。 而SELECT與各種限制條件關鍵詞搭配使用,具有各種豐富的功能,這次實驗就進行詳細介紹。

1、基本的SELECT語句

SELECT語句的基本格式為:

SELECT 要查詢的列名 FROM 表名字 WHERE 限制條件; 

如果要查詢表的所有內容,則把要查詢的列名用一個 * 號表示(實驗2、3中都已經使用過),代表要查詢表中所有的列。 而大多數情況,我們只需要查看某個表的指定的列,比如要查看employee表的name和age:

SELECT name,age FROM employee; 

01

2、數學符號條件

SELECT語句常常會有WHERE限制條件,用於達到更加精確的查詢。WHERE限制條件可以有數學符號 (=,<,>,>=,<=) ,剛才我們查詢了name和age,現在稍作修改:

SELECT name,age FROM employee WHERE age>25; 

篩選出age大於25的結果:

02

或者查找一個名字為Mary的員工:

SELECT name,age,phone FROM employee WHERE name='Mary'; 

結果當然是:

03

3、“AND”與“OR”

從這兩個單詞就能夠理解它們的作用。WHERE后面可以有不止一條限制,而根據條件之間的邏輯關系,可以用OR(或)AND(且)連接:

SELECT name,age FROM employee WHERE age<25 OR age>30; #篩選出age小於25,或age大於30 

04

SELECT name,age FROM employee WHERE age>25 AND age<30; #篩選出age大於25,且age小於30 

05

而剛才的限制條件 age>25 AND age<30 ,如果需要包含25和30的話,可以替換為 age BETWEEN 25 AND 30 :

06

4、IN和NOT IN

關鍵詞INNOT IN的作用和它們的名字一樣明顯,用於篩選“在”“不在”某個范圍內的結果,比如說我們要查詢在dpt3dpt4的人:

SELECT name,age,phone,in_dpt FROM employee WHERE in_dpt IN ('dpt3','dpt4'); 

07

NOT IN的效果則是,如下面這條命令,查詢出了不在dpt1也不在dpt3的人:

SELECT name,age,phone,in_dpt FROM employee WHERE in_dpt NOT IN ('dpt1','dpt3'); 

08

5、通配符

關鍵字 LIKE 在SQL語句中和通配符一起使用,通配符代表未知字符。SQL中的通配符是 _ 和 % 。其中 _ 代表一個未指定字符,% 代表不定個未指定字符。

比如,要只記得電話號碼前四位數為1101,而后兩位忘記了,則可以用兩個 _ 通配符代替:

SELECT name,age,phone FROM employee WHERE phone LIKE '1101__'; 

這樣就查找出了1101開頭的6位數電話號碼

09

另一種情況,比如只記名字的首字母,又不知道名字長度,則用 % 通配符代替不定個字符:

SELECT name,age,phone FROM employee WHERE name LIKE 'J%'; 

這樣就查找出了首字母為 J 的人:

10

6、對結果排序

為了使查詢結果看起來更順眼,我們可能需要對結果按某一列來排序,這就要用到 ORDER BY 排序關鍵詞。默認情況下,ORDER BY的結果是升序排列,而使用關鍵詞ASCDESC可指定升序降序排序。 比如,我們按salary降序排列,SQL語句為:

SELECT name,age,salary,phone FROM employee ORDER BY salary DESC; 

11

7、SQL內置函數和計算

SQL允許對表中的數據進行計算。對此,SQL有5個內置函數,這些函數都對SELECT的結果做操作:

函數名: COUNT SUM AVG MAX MIN
作用: 計數 求和 求平均值 最大值 最小值

其中COUNT函數可用於任何數據類型(因為它只是計數),而另4個函數都只能對數字類數據類型做計算。

具體舉例,比如計算出salary的最大、最小值,用這樣的一條語句:

SELECT MAX(salary) AS max_salary,MIN(salary) FROM employee; 

有一個細節你或許注意到了,使用AS關鍵詞可以給值重命名,比如最大值被命名為了max_salary:

12

8、子查詢

上面討論的SELECT語句都僅涉及一個表中的數據,然而有時必須處理多個表才能獲得所需的信息。例如:想要知道名為"Tom"的員工所在部門做了幾個工程。員工信息儲存在employee表中,但工程信息儲存在project表中。 對於這樣的情況,我們可以用子查詢:

SELECT of_dpt,COUNT(proj_name) AS count_project FROM project WHERE of_dpt IN (SELECT in_dpt FROM employee WHERE name='Tom'); 

13

子查詢還可以擴展到3層、4層或更多層。

9、連接查詢

在處理多個表時,子查詢只有在結果來自一個表時才有用。但如果需要顯示兩個表或多個表中的數據,這時就必須使用連接(join)操作。 連接的基本思想是把兩個或多個表當作一個新的表來操作,如下:

SELECT id,name,people_num FROM employee,department WHERE employee.in_dpt = department.dpt_name ORDER BY id; 

這條語句查詢出的是,各員工所在部門的人數,其中員工的id和name來自employee表,people_num來自department表:

14

另一個連接語句格式是使用JOIN ON語法,剛才的語句等同於:

SELECT id,name,people_num FROM employee JOIN department ON employee.in_dpt = department.dpt_name ORDER BY id; 

結果也與剛才的語句相同。

二、練習

1、使用連接查詢的方式,查詢出各員工所在部門的人數與工程數,工程數命名為count_project。(連接3個表,並使用COUNT內置函數)

代碼如下:(SQL基礎不好,研究了好大會兒呢,可能有些繁瑣的地方,歡迎指正!):

 

結果:


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM