《人工智能導論》期末復習知識點
選擇題知識點
1.人工智能、人工神經網絡、機器學習等人工智能中常用詞的英文及其英文縮寫。
人工智能Artificial Intelligence,AI
人工神經網絡Artificial Neural Network,ANN
機器學習Machine Learning,ML
深度學習Deep Learning,DL
2.什么是強人工智能?
強人工智能觀點認為有可能制造出真正能推理(Reasoning)和解決問題(Problem_solving)的智能機器,並且,這樣的機器將被認為是有知覺的,有自我意識的。可以獨立思考問題並制定解決問題的最優方案,有自己的價值觀和世界觀體系。有和生物一樣的各種本能,比如生存和安全需求。在某種意義上可以看作一種新的文明。
3.回溯算法的基本思想是什么?
能進則進。從一條路往前走,能進則進,不能進則退回來,換一條路再試。
4.面向對象、產生式系統、搜索樹的定義?
面向對象:(Object Oriented)是軟件開發方法,一種編程范式,它可以直觀、自然地反映人類經驗,它基於繼承、多態性和封裝的概念。
面向對象(Object Oriented)是軟件開發方法,一種編程范式。面向對象的概念和應用已超越了程序設計和軟件開發,擴展到如數據庫系統、交互式界面、應用結構、應用平台、分布式系統、網絡管理結構、CAD技術、人工智能等領域。面向對象是一種對現實世界理解和抽象的方法,是計算機編程技術發展到一定階段后的產物。面向對象是相對於面向過程來講的,面向對象方法,把相關的數據和方法組織為一個整體來看待,從更高的層次來進行系統建模,更貼近事物的自然運行模式。
把一組產生式放在一起,讓它們相互配合,協同工作,一個產生式生成的結論可以供另一個產生式作為前提使用,以這種方式求得問題的解決的系統就叫作產生式系統。
對於需要分析方法,諸如深度優先搜索和廣度優先搜索(窮盡的方法)以及啟發式搜索(例如最佳優先搜索和A*算法),這樣的問題使用搜索樹表示最合適。
決策樹(decision tree)是一種特殊類型的搜索樹(見圖5-12),可以從根節點開始,在一些可供選擇的節點中選擇,找到問題的解。
5.機器學習的基本定義是什么?P124
機器學習是一門研究及其獲取新知識和新技能,並識別現有知識的學問。
6.智慧地球的概念,智慧地球提出的背景是怎樣的?
借助新一代信息技術(如傳感技術、物聯網技術、移動通信技術、大數據分析、3D打印等)的強力支持,讓地球上所有東西實現被感知化、互聯化和智能化。
背景為金融危機影響全球。
7.相關關系是怎么回事?
相關關系是客觀現象存在的一種非確定的相互依存關系,即自變量的每一個取值,因變量由於受隨機因素影響,與其所對應的數值是非確定性的。相關分析中的自變量和因變量沒有嚴格的區別,可以互換。
8.盲目搜索是什么意思?
盲目搜索方法又叫非啟發式搜索,是一種無信息搜索,一般只適用於求解比較簡單的問題,盲目搜索通常是按預定的搜索策略進行搜索,而不會考慮到問題本身的特性。常用的盲目搜索有寬度優先搜索和深度優先搜索兩種。
填空題知識點
1. Wiener 在智能活動領域的理論貢獻?
創立控制論,開創了一個全新的學科“控制科學”(Control Science),也開創了人工智能中的行為主義學派。
2.常見的盲目搜素算法有哪些?
常用的盲目搜索有寬度優先搜索和深度優先搜索兩種。
3.最佳有限搜索算法?
題目可能是優先
最佳優先搜索(Best First Search),是一種啟發式搜索算法(Heuristic Algorithm),我們也可以將它看做廣度優先搜索算法的一種改進;最佳優先搜索算法在廣度優先搜索的基礎上,用啟發估價函數對將要被遍歷到的點進行估價,然后選擇代價小的進行遍歷,直到找到目標節點或者遍歷完所有點,算法結束。
4.大類來分,主要有哪三類機器學習算法?
監督學習、無監督學習、強化學習
5.監督學習的主要類型?
分類和回歸,詳見書上127頁
6.人工智能之父是指?圖靈測試的含義?
圖靈。它的意義在於推動了計算機科學和人工智能的發展。
7.大數據時代,相關性和因果性的異同?
異:因果關系很難被輕易證明,但證明相關關系實驗耗資少,費時也少。
同:相關關系為研究因果關系奠定了基礎。
8.產生式系統的形式規則集怎樣表示的?
IF[條件]THEN[動作]
9.機器學習算法都是基於什么理論的?
機器學習(Machine Learning, ML)是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法復雜度理論等多門學科。
簡答題知識點
1.大數據時代的思維轉變?
1.樣本=總體
大數據時代的第一個轉變,是要分析與某事物相關的所有數據,而不是依靠分析少量的數據樣本。
2.接受數據的混雜性
大數據時代的第二個轉變,是我們樂於接受數據的紛繁復雜,而不再一味追求其精確性。
3.數據的相關關系
第三個變革,我們嘗試着不再探求難以捉摸的因果關系,轉而關注事物的相關關系。
2.人工智能領域的主要應用有哪些?
深度學習、自然語言處理、計算機視覺、智能機器人、自動程序設計、數據挖掘
3.最小假幣問題的狀態空間圖表示。P69

4.知識表示法有哪些?
敘述式表示法
把知識表示為一個靜態的事實集合,並附有處理它們的一些通用程序,即敘述式表示描述事實性知識,給出客觀事物所涉及的對象是什么。對於敘述式的知識表示,它的表示與知識運用(推理)是分開處理的。
過程式表示法
將知識用使用它的過程來表示,即過程式表示描述規則和控制結構知識,給出一些客觀規律,告訴怎么做,一般可用一段計算機程序來描述。
5.線性回歸與邏輯回歸的比較
參考一:在線性回歸模型中,輸出一般是連續的, 對於每一個輸入的x,都有一個對應的輸出y。因此模型的定義域和值域都可以是無窮。
但是對於邏輯回歸,輸入可以是連續的[-∞, +∞],但輸出一般是離散的,通常只有兩個值{0, 1}。
參考二:邏輯回歸的模型 是一個非線性模型,sigmoid函數,又稱邏輯回歸函數。但是它本質上又是一個線性回歸模型,因為除去sigmoid映射函數關系,其他的步驟,算法都是線性回歸的。可以說,邏輯回歸,都是以線性回歸為理論支持的。
只不過,線性模型,無法做到sigmoid的非線性形式,sigmoid可以輕松處理0/1分類問題。
6.人工智能時代的重要工作崗位。
數據科學家、機器學習工程師、數據標簽專業人員、AI硬件專家、數據保護專家
7.為什么在大數據時代更關注相關關系?
實驗耗資少、費時也少。為我們提供新的視角,而且提供的視角都很清晰;
相關關系分析本身意義重大,同時它也為研究因果關系奠定了基礎
8.深度優先搜索的算法實現。P71
顧名思義,就是試圖盡可能快地深入樹中。每當搜索方法可以做出選擇時,它選擇最左(或最右)的分支(通常選擇最左分支)。沿着樹的深度遍歷數的節點,盡可能遍歷搜索數的分支。也就是說,從根節點開始,它會首先遍歷根節點的第一個子節點,接着遍歷子節點的第一個子節點,並沿着樹的深度一直遍歷下去
9.語義網絡如何理解?
語義網絡是知識表示中最重要的通用形式之一,是一種表達能力強而且靈活的知識表示方法。它通過概念及其語義關系來表達知識的一種網絡圖。
10.神經元與神經網絡的關系?神經元的工作原理。
關系:神經網絡是以人腦和神經系統為模型的機器學習算法,人工神經網絡是生物神經網絡在某種簡化意義下的技術復現,是研究人腦神經元組成而設計的。
原理:神經元由一個細胞體和突兩部分組成。突分兩類,軸突和樹突。
樹突和軸突共同作用,實現神經元之間的信息傳遞。
軸突的末端與樹突進行進行信號傳遞的界面成為突觸,通過突觸向其他神經元發送信息。學習發生在突觸附近,而且突觸把經過一個神經元軸突的脈沖轉化為下一個神經元的興奮信號或抑制信號。
對某些突觸的刺激促使神經元觸發,只有神經元所有輸入的總效應達到閾值電平,它才開始工作。
綜合應用題的知識點
1.旅行商問題的貪婪算法實現步驟。P70
1.從某一個城市開始,每次選擇一個城市,直到所有的城市被走完。
2.每次在選擇下一個城市的時候,只考慮當前情況,保證迄今為止經過的路徑總距離最小。
2.常用的機器學習算法有哪些?各自的特點和適用領域是怎樣的?
書上129-131頁
回歸算法:是最快速的機器算法之一,分類,預測離散值。
KNN算法:最基礎和簡單的算法之一,用於分類,比較數據點的距離,並將每個點分配給它最接近的組。
決策樹算法:將一組“弱”學習器集合在一起,形成一種強算法。主要用來分類,也有做回歸,但更多的是作為弱分類器,用在model
貝葉斯算法:通過找到樣本所屬於的聯合分步,然后通過貝葉斯公式,計算樣本的后驗概率。用於文本分析、分類
聚類算法:發現元素之間的共性並對它們進行相應的分組。
神經網絡算法:通過找到某種非線性模型擬合數據,主要用在圖像處理等
3.專家系統的概念、結構、各模塊的作用怎樣?。P115-116
概念:專家系統是一種模擬人類專家解決領域問題的計算機程序系統
結構:專家系統通常由人機交互界面、知識庫、推理機、解釋器、綜合數據庫、知識獲取等6個部分構成
綜合數據庫:專門用於存儲推理過程中所需的原始數據、中間結果和最終結論,往往是作為暫時的存儲區
知識庫 用來存放專家提供的知識
推理機:針對當前問題的條件或已知信息,反復匹配知識庫中的規則,獲得新的結論,以得到問題求解結果。
人機界面:是系統與用戶進行交流時的界面
解釋器:能夠根據用戶的提問,對結論、求解過程做出說明
通過知識獲取,可以擴充和修改知識庫中的內容,也可以實現自動學習功能
4.線性回歸算法解決問題的步驟和 Python 實現方法。
步驟:
- 根據預測目標,確定自變量和因變量
- 繪制散點圖,確定回歸模型類型
- 估計模型參數,建立回歸模型
- 對回歸模型進行檢驗
- 利用回歸模型進行預測
import numpy
from pandas import read_csv
from matplotlib import pyplot as plt
from sklearn.linear_model import LinearRegression
data = read_csv(
'file:///Users/apple/Desktop/jacky_1.csv',encoding='GBK'
)
#畫出散點圖,求x和y的相關系數
plt.scatter(data.活動推廣費,data.銷售額)
data.corr()
#估計模型參數,建立回歸模型
'''
(1) 首先導入簡單線性回歸的求解類LinearRegression
(2) 然后使用該類進行建模,得到lrModel的模型變量
'''
lrModel = LinearRegression()
#(3) 接着,我們把自變量和因變量選擇出來
x = data[['活動推廣費']]
y = data[['銷售額']]
#模型訓練
'''
調用模型的fit方法,對模型進行訓練
這個訓練過程就是參數求解的過程
並對模型進行擬合
'''
lrModel.fit(x,y)
#對回歸模型進行檢驗
lrModel.score(x,y)
#利用回歸模型進行預測
lrModel.predict([[60],[70]])
#查看截距
alpha = lrModel.intercept_[0]
#查看參數
beta = lrModel.coef_[0][0]
alpha + beta*numpy.array([60,70])