8.3 列聯表與獨立性檢驗


\(\mathbf{{\large {\color{Red} {歡迎到學科網下載資料學習}} } }\)【高分突破系列】 高二數學下學期同步知識點剖析精品講義
\(\mathbf{{\large {{\color{Red} {跟貴哥學數學,so \quad easy!}} }}}\)

選擇性必修第三冊同步提高,難度2顆星!

模塊導圖

知識剖析

\(2×2\)列聯表

\(A ,B\)為兩個變量,每一個變量各有兩種等級\(A_1\)\(A_2\)\(B_1\)\(B_2\),將同時符合\((A_1,B_1)\),\((A_2,B_1)\),\((A_1,B_2)\),\((A_2,B_2)\)的個體數量排列成一個表格,這是列聯表,如下表.
\(\begin{array}{|c|c|c|c|} \hline \text { 分類變量 } & A_1 & A_2 & \text { 合計 } \\ \hline B_1 & a & b & a+b \\ \hline B_2 & c & d & c+d \\ \hline \text { 合計 } & a+c & b+d & n=a+b+c+d \\ \hline \end{array}\)
 

獨立性檢驗

根據\(2×2\)列聯表中的數據判斷兩個變量\(A ,B\)是否獨立的問題叫\(2×2\)列聯表的獨立性檢驗.

 

\(χ^2\)的計算公式

\[\chi^{2}=\dfrac{n(a d-b c)^{2}}{(a+b)(c+d)(a+c)(b+d)} \]

若要推斷的論述為“\(A\)\(B\)有關系”,則\(χ^2\)的值越大,說明“\(A\)\(B\)有關系”成立的可能性越大.
如下表,
\(\begin{array}{|c|c|c|c|c|c|} \hline p\left(\chi^{2} \geq x_{\alpha}\right) & 0.1 & 0.05 & 0.010 & 0.005 & 0.001 \\ \hline x_{\alpha} & 2.706 & 3.841 & 6.635 & 7.879 & 10.828 \\ \hline \end{array}\)
\(\chi^{2}=8\)時,
因為\(8>7.879\),所以有\(1-0.005=99.5\%\)的把握認為\(A\)\(B\)之間有關;
\(8<10.828\),所以沒有\(1-0.001=99.9\%\)的把握認為\(A\)\(B\)之間有關.

 

實際應用

應用獨立性檢驗解決實際問題大致應包括以下幾個主要環節
\((1)\)提出零假設\(H_{0}: X\)\(Y\)相互獨立,並給出在問題中的解釋;
\((2)\)根據抽樣數據整理出\(2×2\)列聯表,計算\(χ^2\)的值,並與臨界值\(x_{\alpha}\)比較;
\((3)\)根據檢驗規則得出推斷結論;
\((4)\)\(X\)\(Y\)不獨立的情況下,根據需要,通過比較相應的頻率,分析\(X\)\(Y\)間的影響規律.
 

經典例題

【典題1】 為了考察某種病毒疫苗的效果,現隨機抽取\(100\)只小白鼠進行試驗,得到如下\(2×2\)列聯表:
\(\begin{array}{|c|c|c|c|} \hline & \text { 感染 } & \text { 末感染 } & \text { 總計 } \\ \hline \text { 服用 } & 10 & 40 & 50 \\ \hline \text { 末服用 } & 20 & 30 & 50 \\ \hline \text { 總計 } & 30 & 70 & 100 \\ \hline \end{array}\)
附:\(K^{2}=\dfrac{n(a d-b c)^{2}}{(a+b)(c+d)(a+c)(b+d)}\),其中\(n=a+b+c+d\)
\(\begin{array}{|c|c|c|c|c|c|c|} \hline P\left(K^{2} \geq k_{0}\right) & 0.10 & 0.05 & 0.025 & 0.010 & 0.005 & 0.001 \\ \hline k_{0} & 2.706 & 3.841 & 5.024 & 6.635 & 7.879 & 10.828 \\ \hline \end{array}\)
根據以上數據,得到的結論正確的是(  )
A.在犯錯誤的概率不超過\(2.5\%\)的前提下,認為“小白鼠是否被感染與有沒有服用疫苗有關”
B.在犯錯誤的概率不超過\(2.5\%\)的前提下,認為“小白鼠是否被感染與有沒有服用疫苗無關”
C.有\(95\%\)的把握認為“小白鼠是否被感染與有沒有服用疫苗有關”
D.有\(95\%\)的把握認為“小白鼠是否被感染與有沒有服用疫苗無關”
【解析】 由列聯表中數據,計算\(K^{2}=\dfrac{100 \times(10 \times 30-20 \times 40)^{2}}{30 \times 70 \times 50 \times 50}=\dfrac{100}{21} \approx 4.762\),且\(3.841<4.762<5.024\)
所以有\(95\%\)的把握認為“小白鼠是否被感染與有沒有服用疫苗有關”.
故選:\(C\)
 

【典題2】 近年來我國電子商務行業迎來篷布發張的新機遇,\(2015\)年雙\(11\)期間,某購物平台的銷售業績高達\(918\)億人民幣,與此同時,相關管理部門推出了針對電商的商品和服務的評價體系,現從評價系統中選出200次成功交易,並對其評價進行統計,對商品的好評率為\(0.6\),對服務的好評率為\(0.75\),其中對商品和服務都做出好評的交易為\(80\)次.
(Ⅰ)完成商品和服務評價的\(2×2\)列聯表,並說明是否可以在犯錯誤概率不超過\(0.1\%\)的前提下,認為商品好評與服務好評有關?
(Ⅱ)若將頻率視為概率,某人在該購物平台上進行的5次購物中,設對商品和服務全好評的次數為隨機變量.
①求對商品和服務全好評的次數的分布列(概率用組合數算式表示);
②求的數學期望和方差.
參考數據及公式如下:
\(\begin{array}{|c|c|c|c|c|c|c|c|} \hline P\left(K^{2} \geq k\right) & 0.15 & 0.10 & 0.05 & 0.025 & 0.010 & 0.005 & 0.001 \\ \hline k & 2.072 & 2.706 & 3.841 & 5.024 & 6.635 & 7.879 & 10.828 \\ \hline \end{array}\)
(\(K^{2}=\dfrac{n(a d-b c)^{2}}{(a+b)(c+d)(a+c)(b+d)}\),其中\(n=a+b+c+d\))
【解析】 (Ⅰ)由題意可得關於商品和服務評價的\(2×2\)列聯表:
\(\begin{array}{|c|c|c|c|} \hline & \text { 對服務好評 } & \text { 對服務不滿意 } & \text { 合計 } \\ \hline \text { 對商品好評 } & 80 & 40 & 120 \\ \hline \text { 對商品不滿意 } & 70 & 10 & 80 \\ \hline \text { 合計 } & 150 & 50 & 200 \\ \hline \end{array}\)
\(K^{2}=\dfrac{200 \times(80 \times 10-40 \times 70)^{2}}{150 \times 50 \times 120 \times 80} \approx 11.111>10.828\)
可以在犯錯誤概率不超過\(0.1\%\)的前提下,認為商品好評與服務好評有關;
①每次購物時,對商品和服務全好評的概率為\(0.4\)
\(X\)的取值可以是\(0,1,2,3,4,5\)\(X~B(5,0.4)\)
\(P(X=0)=0.6^{5}\)\(P(X=1)=C_{5}^{1} \cdot 0.4 \cdot 0.6^{4}\)\(P(X=2)=C_{5}^{2} \cdot 0.4^{2} \cdot 0.6^{3}\)\(P(X=3)=C_{5}^{3} \cdot 0.4^{3} \cdot 0.6^{2}\)\(P(X=4)=C_{5}^{4} \cdot 0.4^{4} \cdot 0.6\)\(P(X=5)=0.4^{5}\)
\(X\)的分布列
\(\begin{array}{|c|c|c|c|c|c|c|} \hline X & 0 & 1 & 2 & 3 & 4 & 5 \\ \hline P & 0.6^{5} & C_{5} 1 \cdot 0.4 \cdot 0.6^{4} & C_{5}^{2} \cdot 0.4^{2} \cdot 0.6^{3} & C_{5}^{3} \cdot 0.4^{3} \cdot 0.6^{2} & C_{5}^{4} \cdot 0.4^{4} \cdot 0.6 & 0.4^{5} \\ \hline \end{array}\)
\(E X=5 \times 0.4=2, \quad D X=5 \times 0.4 \times 0.6=1.2\)
 

【典題3】近期,湖北省武漢市等多個地區發生新型冠狀病毒感染的肺炎疫情.為了盡快遏制住疫情,我國科研工作者堅守在科研一線,加班加點、爭分奪秒與病毒抗爭,夜以繼日地進行研究.新型冠狀病毒的潛伏期檢測是疫情控制的關鍵環節之一.在傳染病學中,通常把從致病刺激物侵入機體或對機體發生作用起,到機體出現反應或開始呈現該疾病對應的相關症狀時止的這一階段稱為潛伏期.鍾南山院士帶領的研究團隊統計了武漢市某地區\(10000\)名醫學觀察者的相關信息,並通過咽拭子核酸檢測得到1000名確診患者的信息如表格:
\(\begin{array}{|c|c|c|c|c|} \hline \text { 潛伏期(單位:天) } & {[0,7]} & (7,14] & (14,21] & (21,28] \\ \hline \text { 人數 } & 800 & 190 & 8 & 2 \\ \hline \end{array}\)
(1)求這\(1000\)名確診患者的潛伏期樣本數據的平均數\(\bar{x}\)(同一組數據用該組數據區間的中點值代表).
(2)新型冠狀病毒的潛伏期受諸多因素影響,為了研究潛伏期與患者性別的關系,以潛伏期是否超過天為標准進行分層抽樣,從上述\(1000\)名患者中抽取\(100\)名,得到如下列聯表.請將列聯表補充完整,並根據列聯表判斷是否有\(90\%\)的把握認為潛伏期與患者性別有關.
\(\begin{array}{|c|c|c|c|} \hline & \text { 潛伏期} \leq 7\text { 天 } & \text { 潛伏期 }>7 \text { 天 } & \text { 總計 } \\ \hline \text { 男性患者 } & & 12 & \\ \hline \text { 務性患者 } & & & 50 \\ \hline \text { 總計 } & & & 100 \\ \hline \end{array}\)
(3)由於采樣不當、標本保存不當、采用不同類型的標本以及使用不同廠家試劑都可能造成核酸檢測結果“假陰性”而出現漏診.當核酸檢測呈陰性時,需要進一步進行血清學\(IgM/IgG\)抗體檢測,以彌補核酸檢測漏診的缺點.現對\(10\)名核酸檢測結果呈陰性的人員逐一地進行血清檢測,記每個人檢測出\(IgM\)(\(IgM\)是近期感染的標志)呈陽性的概率為\(p(0<p<1)\)且相互獨立,設至少檢測了\(9\)個人才檢測出\(IgM\)呈陽性的概率為\(f(p)\),求\(f(p)\)取得最大值時相應的概率\(p\)
附:\(K^{2}=\dfrac{n(a d-b c)^{2}}{(a+b)(c+d)(a+c)(b+d)}\),其中\(n=a+b+c+d\)
\(\begin{array}{|c|c|c|c|c|c|c|} \hline P\left(K^{2} \geq k_{0}\right) & 0.100 & 0.050 & 0.025 & 0.010 & 0.005 & 0.001 \\ \hline k_{0} & 2.706 & 3.841 & 5.024 & 6.635 & 7.879 & 10.828 \\ \hline \end{array}\)
【解析】 (1) \(\bar{x}=3.5 \times \dfrac{800}{1000}+10.5 \times \dfrac{190}{1000}+17.5 \times \dfrac{8}{1000}+24.5 \times \dfrac{2}{1000}=4.984\)
\({\color{Red}{(相當於求頻率直方圖中的平均數,其等於每組組中值每組概率) }}\)
(2)補充完整的\(2×2\)列聯表如下所示,
\(\begin{array}{|c|c|c|c|} \hline & \text { 潛伏期 }\leq 7 \text { 天 } & \text { 潛伏期 }>7 \text { 天 } & \text { 總計 } \\ \hline \text { 男性患者 } & 38 & 12 & 50 \\ \hline \text { 務性患者 } & 42 & 8 & 50 \\ \hline \text { 總計 } & 80 & 20 & 100 \\ \hline \end{array}\)
\(\therefore K^{2}=\dfrac{100 \times(38 \times 8-12 \times 42)^{2}}{50 \times 50 \times 80 \times 20}=1<2.706\)
\(∴\)不能有\(90\%\)的把握認為潛伏期與患者性別有關.
\({\color{Red}{(套用公式求出值,再查表確認分類變量是否有關) }}\)
(3)由\(f(p)=p(1-p)^{8}+p(1-p)^{9}\),化簡得\(f(p)=p(1-p)^{8}(2-p)\)
\(1-p=x \in(0,1)\),則\(p=1-x\)\(f(p)=(1-x) x^{8}(1+x)=\left(1-x^{2}\right) x^{8}\)
\(g(x)=\left(1-x^{2}\right) x^{8}\)\(x∈(0 ,1)\),則\(g^{\prime}(x)=2 x^{7}\left(4-5 x^{2}\right)\)
\(g^{\prime}(x)>0\),則\(0<x<\dfrac{2 \sqrt{5}}{5}\);令\(g^{\prime}(x)<0\),則\(\dfrac{2 \sqrt{5}}{5}<x<1\)
\(\therefore g(x)\)\(\left(0, \dfrac{2 \sqrt{5}}{5}\right)\)上單調遞增,在\(\left(\dfrac{2 \sqrt{5}}{5}, 1\right)\)上單調遞減,
\(∴g(x)\)有唯一的極大值為\(g\left(\dfrac{2 \sqrt{5}}{5}\right)\),也是最大值.
\(∴\)\(x=\dfrac{2 \sqrt{5}}{5}\),即\(p=1-\dfrac{2 \sqrt{5}}{5}\)時,\(f(p)\)取得最大值.
【點撥】注意理解\(K^{2}=\dfrac{n(a d-b c)^{2}}{(a+b)(c+d)(a+c)(b+d)}\)值與小概率值和對應臨界值的表格之間的關系.
 

鞏固練習

1(★) 在研究肥胖與高血壓的關系時,通過收集數據、整理分析數據得到“高血壓與肥胖有關”的結論,並且在犯錯誤的概率不超過\(0.01\)的前提下認為這個結論是成立的,下列說法中正確的是(  )
A.在\(100\)個肥胖的人中至少有\(99\)人患有高血壓
B.肥胖的人至少有\(99\%\)的概率患有高血壓
C.在\(100\)個高血壓患者中一定有肥胖的人
D.在\(100\)個高血壓患者中可能沒有肥胖的人
 

2(★) 某校為了解學生“玩手機游戲”和“學習成績”是否有關,隨機抽取了\(100\)名學生,運用\(2×2\)列聯表進行獨立性檢驗,經計算得到\(K^{2}=3.936\),所以判定玩手機游戲與學習成績有關系,那么這種判斷出錯的可能性為(  )
\(\begin{array}{|c|c|c|c|c|c|c|c|c|c|c|} \hline P\left(K^{2} \geq k_{0}\right) & 0.50 & 0.40 & 0.25 & 0.15 & 0.10 & 0.05 & 0.025 & 0.01 & 0.005 & 0.001 \\ \hline k_{0} & 0.455 & 0.708 & 1.323 & 2.072 & 2.706 & 3.841 & 5.024 & 6.635 & 7.879 & 10.83 \\ \hline \end{array}\)
A. \(1 \%\) \(\qquad \qquad \qquad \qquad\)B. \(5 \%\) \(\qquad \qquad \qquad \qquad\)C. \(95 \%\) \(\qquad \qquad \qquad \qquad\)D. \(99 \%\)
 

3(★) 為了研究高中學生對鄉村音樂的態度(喜歡和不喜歡兩種態度)與性別的關系,運用列聯表進行獨立性檢驗,經計算\(K^{2}=8.01\),附表如表:
\(\begin{array}{|c|c|c|c|c|c|} \hline P\left(K^{2} \geq k_{0}\right) & 0.100 & 0.050 & 0.025 & 0.010 & 0.001 \\ \hline k_{0} & 2.706 & 3.841 & 5.024 & 6.635 & 10.828 \\ \hline \end{array}\)
參照附表,得到的正確的結論是(  )
A.有\(99\%\)以上的把握認為“喜歡鄉村音樂與性別有關”
B.有\(99\%\)以上的把握認為“喜歡鄉村音樂與性別無關”
C.在犯錯誤的概率不超過\(0.1\%\)的前提下,認為“喜歡鄉村音樂與性別有關”
D.在犯錯誤的概率不超過\(0.1\%\)的前提下,認為“喜歡鄉村音樂與性別無關”
 

4(★) 【多選題】“一粥一飯,當思來之不易”,道理雖簡單,但每年我國還是有2000多億元的餐桌浪費,被倒掉的食物相當於2億多人一年的口糧.為營造“節約光榮,浪費可恥”的氛圍,某市發起了“光盤行動”.某機構為調研民眾對“光盤行動”的認可情況,在某大型餐廳中隨機調查了90位來店就餐的客人,制成如表所示的列聯表,通過計算得到\(K^2\)的觀測值為\(9\).已知\(P\left(K^{2} \geq 6.635\right)=0.010\)\(P\left(K^{2} \geq 10.828\right)=0.001\),則下列判斷正確的是(  )
\(\begin{array}{|c|c|c|} \hline & \text { 認可 } & \text { 不認可 } \\ \hline 40 \text { 歲以下 } & 20 & 20 \\ \hline 40 \text { 歲以上(含40歲) } & 40 & 10 \\ \hline \end{array}\)
A.在該餐廳用餐的客人中大約有\(66.7\%\)的客人認可“光盤行動”
B.在該餐廳用餐的客人中大約有\(99\%\)的客人認可“光盤行動”
C.有\(99\%\)的把握認為“光盤行動”的認可情況與年齡有關
D.在犯錯誤的概率不超過\(0.001\)的前提下,認為“光盤行動”的認可情況與年齡有關
 

5(★) 某網絡平台從購買該平台某課程的客戶中,隨機抽取了\(100\)位客戶的數據,並將這\(100\)個數據按學時數,客戶性別等進行統計,整理得到如表;
\(\begin{array}{|c|c|c|c|c|c|c|c|} \hline \text { 學時數 } & {[5,10)} & {[10,15)} & {[15,20)} & {[20,25)} & {[25,30)} & {[30,35)} & {[35,40)} \\ \hline \text { 男性 } & 18 & 12 & 9 & 9 & 6 & 4 & 2 \\ \hline \text { 女性 } & 2 & 4 & 8 & 2 & 7 & 13 & 4 \\ \hline \end{array}\)
(1)根據上表估計男性客戶購買該課程學時數的平均值(同一組中的數據用該組區間的中點值作代表,結果保留小數點后兩位);
(2)從這\(100\)位客戶中,對購買該課程學時數在以下的女性客戶按照分層抽樣的方式隨機抽取\(7\)人,再從這\(7\)人中隨機抽取\(2\)人,求這\(2\)人購買的學時數都不低於\(15\)的概率.
(3)將購買該課程達到\(25\)學時及以上者視為“十分愛好該課程者”,\(25\)學時以下者視,為“非十分愛好該課程者”.請根據已知條件完成以下\(2×2\)列聯表,並判斷是否有\(99.9\%\)的把握認為“十分愛好該課程者”與性別有關?
\(\begin{array}{|c|l|l|l|} \hline & \text { 非十分愛好該課程者 } & \text { 十分愛好該課程者 } & \text { 合計 } \\ \hline \text { 男性 } & & & \\ \hline \text { 女性 } & & & \\ \hline \text { 合計 } & & & 100 \\ \hline \end{array}\)
附:\(K^{2}=\dfrac{n(a d-b c)^{2}}{(a+b)(c+d)(a+c)(b+d)}\),其中\(n=a+b+c+d\)
\(\begin{array}{|c|c|c|c|c|c|} \hline P\left(K^{2} \geq k_{0}\right) & 0.100 & 0.050 & 0.025 & 0.010 & 0.001 \\ \hline k 0 & 2.706 & 3.841 & 5.024 & 6.635 & 10.828 \\ \hline \end{array}\)
 
 
 

6(★★) “低碳出行”,一種降低“碳”的出行,以低能耗、低污染為基礎,是環保的深層次體現,在眾多發達國家被廣大民眾接受並執行,\(S\)市即將投放一批公共自行車以方便市民出行,減少污染,緩解交通擁堵,現先對\(100\)人做了是否會考慮選擇自行車出行的調查,結果如表.
(1)如果把45周歲以下人群定義為“青年”,完成下列\(2×2\)列聯表,並問你有多少把握認為該地區市民是否考慮單車與他(她)是不是“青年人”有關?
\(\begin{array}{|c|c|c|} \hline \text { 年齡 } & \text { 考慮騎車 } & \text { 不考慮騎車 } \\ \hline 15 \text { 以下 } & 6 & 3 \\ \hline[15,30) & 16 & 6 \\ \hline[30,45) & 13 & 6 \\ \hline[45,60) & 14 & 16 \\ \hline[60,75) & 5 & 9 \\ \hline 75 \text { 以上 } & 1 & 5 \\ \hline \text { 合計 } & 55 & 45 \\ \hline \end{array}\)
\(\begin{array}{|c|c|c|c|} \hline & \text { 騎車 } & \text { 不騎車 } & \text { 合計 } \\ \hline 45 \text { 歲以下 } & & & \\ \hline 45 \text { 歲以上 } & & & 100 \\ \hline \text { 合計 } & & & \\ \hline \end{array}\)
\(\begin{array}{|c|c|c|c|c|c|c|c|} \hline p\left(K^{2} \geq k\right) & 0.15 & 0.10 & 0.05 & 0.025 & 0.010 & 0.005 & 0.001 \\ \hline k & 2.07 & 2.70 & 3.84 & 5.02 & 6.63 & 7.87 & 10.82 \\ \hline \end{array}\)
參考:\(K^{2}=\dfrac{n(a d-b c)^{2}}{(a+b)(c+d)(a+c)(b+d)}\),其中\(n=a+b+c+d\)
(2)\(S\)市為了鼓勵大家騎自行車上班,為此還專門在幾條平時比較擁堵的城市主道建有無障礙自行車道,該市市民小明家離上班地點\(10km\),現有兩種.上班方案給他選擇;
方案一:選擇自行車,走無障礙自行車道以\(19km/h\)的速度直達上班地點.
方案二:開車以\(30km/h\)的速度上班,但要經過\(A、B、C\)三個易堵路段,三個路段堵車的概率分別是\(\dfrac{1}{2}\)\(\dfrac{1}{2}\)\(\dfrac{1}{3}\),且是相互獨立的,並且每次堵車的時間都是\(10\)分鍾(假設除了堵車時間其他時間都是勻速行駛)
若僅從時間的角度考慮,請你給小明作一個選擇,並說明理由.
 
 
 

7(★★) 2020年初,新型冠狀病毒\((2019-nCoV)\)肆虐,全民開啟防疫防控.新型冠狀病毒的傳染主要是人與人之間進行傳播,感染人群年齡大多數是\(40\)歲以上人群.該病毒進入人體后有潛伏期,潛伏期是指病原體侵入人體至最早出現臨床症狀的這段時間.潛伏期越長,感染到他人的可能性越高,現對\(200\)個病例的潛伏期(單位:天)進行調查,統計發現潛伏期平均數為\(7.1\),方差為\(2.25^2\).如果認為超過8天的潛伏期屬於“長潛伏期”,按照年齡統計樣本,得到下面的列聯表:
\(\begin{array}{|c|c|c|} \hline \text { 年齡/人數 } & \text { 長期潛伏 } & \text { 非長期潛伏 } \\ \hline 40 \text { 歲以上 } & 30 & 110 \\ \hline 40 \text { 歲及40歲以下 } & 20 & 40 \\ \hline \end{array}\)
(1)是否有\(95\%\)的把握認為“長期潛伏”與年齡有關;
(2)假設潛伏期\(X\)服從正態分布\(N\left(\mu, \sigma^{2}\right)\),其中\(μ\)近似為樣本平均數\(\bar{x}\)\(\sigma^{2}\)近似為樣本方差\(S^{2}\)
\((i)\)現在很多省份對入境旅客一律要求隔離天,請用概率的知識解釋其合理性;
\((ii)\)以題目中的樣本頻率估計概率,設\(1000\)個病例中恰有\(k(k∈N^*)\)個屬於“長期潛伏”的概率是\(g(k)\),當\(k\)為何值時,\(g(k)\)取得最大值.
附:\(K^{2}=\dfrac{n(a d-b c)^{2}}{(a+b)(c+d)(a+c)(b+d)}\),其中\(n=a+b+c+d\)
\(\begin{array}{|c|c|c|c|} \hline P\left(X^{2} \geq x_{0}\right) & 0.1 & 0.05 & 0.010 \\ \hline x_{0} & 2.706 & 3.841 & 6.635 \\ \hline \end{array}\)
\(\xi \sim N\left(\mu, \sigma^{2}\right)\),則\(P(μ-σ<ξ<μ+σ)=0.6862\)\(P(μ-2σ<ξ<μ+2σ)=0.9544\)\(P(μ-3σ<ξ<μ+3σ)=0.9974\)
 
 
 

參考答案

  1. 【答案】 \(D\)
    【解析】 “高血壓與肥胖有關”,並且在犯錯誤的概率不超過\(0.01\)的前提下認為這個結論是成立的,
    表示有\(99\%\)的把握認為這個結論成立,與多少個人患高血壓沒有關系,
    也不是說“肥胖的人就是至少有\(99\%\)的概率患有高血壓”,
    只有選項\(D\)正確.
    故選:\(D\)
  2. 【答案】 \(B\)
    【解析】 根據題意知,\(K^{2}=3.936>3.841\)
    所以判定玩手機游戲與學習成績有關系,這種判斷出錯的可能性為\(5\%\)
    故選:\(B\)
  3. 【答案】 \(A\)
    【解析】 \(\because K^{2}=8.01>6.635\)
    \(∴\)在犯錯誤概率不超過\(0.01\)的前提下認為“喜歡鄉村音樂與性別有關”,
    即有\(99\%\)以上的把握認為“喜歡鄉村音樂與性別有關”.
    故選:\(A\)
  4. 【答案】 \(AC\)
    【解析】 \(\because K^{2}\)的觀測值為\(9\),且\(P\left(K^{2} \geq 6.635\right)=0.010\)\(P\left(K^{2} \geq 10.828\right)=0.001\)
    \(∵9>6.635\),但\(9<10.828\)
    \(∴\)\(99\%\)的把握認為“光盤行動”的認可情況與年齡有關,
    或者說,在犯錯誤的概率不超過\(0.010\)的前提下,認為“光盤行動”的認可情況與年齡有關,
    所以選項\(C\)正確,選項\(D\)錯誤,
    由表可知認可“光盤行動”的人數為\(60\)人,
    所以在該餐廳用餐的客人中認可“光盤行動”的比例為\(\dfrac{60}{90} \times 100 \% \approx 66.7 \%\)
    故選項\(A\)正確,選項\(B\)錯誤,
    故選:\(AC\)
  5. 【答案】 \((1)16.92 \quad (2) \dfrac{2}{7} \quad(3)有99.9\%\)的把握認為“十分愛好該課程者”與性別有關
    【解析】 (1)由題意知,在\(100\)位購買該課程的客戶中,男性客戶購買該課程學時數的平均值為\(\bar{x}=\dfrac{1}{60}(7.5 \times 18+12.5 \times 12+17.5 \times 9+\)\(22.5 \times 9+27.5 \times 6+32.5 \times 4+37.5 \times 2) \approx 16.92\)
    所以估計男性客戶購買該課程學時數的平均值為\(16.92\)
    ( 2)設“所抽取的\(2\)人購買的學時數都不低於\(15\)為事件\(A\)
    依題意按照分層抽樣的方式分別在學時數為\([5,10)\)\([10,15)\)\([15,20)\)的女性客戶中抽取\(1\)人(設為\(a\)),\(2\)人(設為\(A\)\(B\)),\(4\)人(設為\(C_{1}, C_{2}, C_{3}, C_{4}\)),從7人中隨機抽取\(2\)人所包含的基木事件為:
    \(a A, a B, a c_{1}, a c_{2}, a c_{3}, a c_{4}, A B, A c_{1}, A c_{2}, A c_{3}, A c_{4}, B c_{1}, B c_{2},\)\(B c_{3}, B c_{4}, c_{1} c_{2}, c_{1} c_{3}, c_{1} c_{4}, c_{2} c_{3}, c_{2} c_{4},c_{3} c_{4}\)\(21\)種,其中事件\(A\)所包含的基本事件為:\(c_{1} c_{2}, c_{1} c_{3}, c_{1} c_{4}, c_{2} c_{3}, c_{2} c_{4}, c_{3} c_{4}\),共\(6\)個,
    則事件\(A\)發生的概率\(P=\dfrac{6}{21}=\dfrac{2}{7}\)
    (3)依題意得\(2×2\)列聯表如下
    \(\begin{array}{|c|c|c|c|} \hline & \text { 非十分愛好該課程者 } & \text { 十分愛好該課程者 } & \text { 合計 } \\ \hline \text { 男性 } & 48 & 12 & 60 \\ \hline \text { 女性 } & 16 & 24 & 40 \\ \hline \text { 合計 } & 64 & 36 & 100 \\ \hline \end{array}\)
    \(16.667>10.828\)
    故有\(99.9\%\)的把握認為“十分愛好該課程者”與性別有關.
  6. 【答案】 (1)\(99.5\%\)把握認為該地區市民是否考慮單車與他(她)是不是“青年人”有關(2)方案二
    【解析】 (1)根據題目所給的數據填寫\(2×2\)列聯表如下:
    \(\begin{array}{|c|c|c|c|} \hline & \text { 騎車 } & \text { 不騎車 } & \text { 合計 } \\ \hline 45 \text { 歲以下 } & 35 & 15 & 50 \\ \hline 45 \text { 歲以上 } & 20 & 30 & 50 \\ \hline \text { 合計 } & 55 & 45 & 100 \\ \hline \end{array}\)
    \(K^{2}=\dfrac{n(a d-b c)^{2}}{(a+b)(a+c)(c+d)(b+d)}=\dfrac{100 \times(35 \times 30-15 \times 20)^{2}}{55 \times 45 \times 50 \times 50} \approx9.09>7.87\)
    故有\(99.5\%\)把握認為該地區市民是否考慮單車與他(她)是不是“青年人”有關;
    (2)方案一:選擇自行車,走無障礙自行車道以\(19km/h\)的速度直達上班地點.
    則所需時間為:\(t_{1}=\dfrac{10}{19} h\)
    方案二:開車以\(30km/h\)的速度上班,但要經過\(A、B、C\)三個易堵路段,分別令三個路段堵車的事件為\(A、B、C\)
    因為三個路段堵車的概率分別是\(\dfrac{1}{2}\)\(\dfrac{1}{2}\)\(\dfrac{1}{3}\),且是相互獨立的,並且每次堵車的時間都是\(10\)分鍾(假設除了堵車時間其他時間都是勻速行駛)
    則在路上遇上堵車的概率為:
    \(P=1-P(\bar{A} \cdot \bar{B} \cdot \bar{B})=1-P(\bar{A}) \cdot P(\bar{B})\cdot P( \bar{B}))\)\(=1-[1-P(A)][1-P(B)][1-P(C)]=1-\dfrac{1}{2} \times \dfrac{1}{2} \times \dfrac{2}{3}=\dfrac{5}{6}\)
    故選擇方案二上班所需時間為\(t_{2}=\dfrac{10}{30}+\dfrac{5}{6} \times \dfrac{1}{6}=\dfrac{17}{36} h\)
    因為\(t_{1}>t_{2}\)
    若僅從時間的角度考慮,應選方案二省時間.
  7. 【答案】 \((1)\)沒有的把握認為“長期潛伏”與年齡有關 \((2)250\)
    【解析】 (1)\(X^{2}=\dfrac{200 \times(30 \times 40-110 \times 20)^{2}}{50 \times 150 \times 140 \times 60}=\dfrac{200}{63} \approx 3.175<3.841\)
    故沒有\(95\%\)的把握認為“長期潛伏”與年齡有關.
    (2)由題可知,潛伏期\(X \sim N\left(7.1,2.25^{2}\right)\)
    \(P(X \geq 13.85)=\dfrac{1-0.9974}{2}=0.0013\)
    由於\(P\)的值很小,故對入境旅客要求隔離\(14\)天合理.
    以樣本頻率估計概率,則任意抽取一個病例,屬於“長期潛伏”的概率為\(\dfrac{50}{200}=\dfrac{1}{4}\)\(g(k)=C_{1000}^{k} \cdot\left(\dfrac{1}{4}\right)^{k} \cdot\left(\dfrac{3}{4}\right)^{1000-k}\)
    \(g(k)\)最大,則\(\left\{\begin{array}{l} g(k) \geq g(k-1) \\ g(k) \geq g(k+1) \end{array}\right.\),即\(\left\{\begin{array}{l} C_{1000}^{k} \cdot\left(\dfrac{1}{4}\right)^{k} \cdot\left(\dfrac{3}{4}\right)^{1000-k} \geq C_{1000}^{k-1} \cdot\left(\dfrac{1}{4}\right)^{k-1} \cdot\left(\dfrac{3}{4}\right)^{1001-k} \\ C_{1000}^{k} \cdot\left(\dfrac{1}{4}\right)^{k} \cdot\left(\dfrac{3}{4}\right)^{1000-k} \geq C_{1000}^{k+1} \cdot\left(\dfrac{1}{4}\right)^{k+1} \cdot\left(\dfrac{3}{4}\right)^{999-k} \end{array}\right.\)
    解得\(\dfrac{997}{4} \leq k \leq \dfrac{1001}{4}\)
    因為\(k∈N^*\),所以\(k=250\)
    故當\(k=250\)時,\(g(k)\)取得最大值.


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM