人工智能導論

人工智能(Artifical Intelligence,簡稱AI)

人工智能的本質:人工智能是一門研究如何製造出人造的智能機器或智能系統,來模擬人類智能活動的能力,以延伸人們智能的科學。

一、如何判定人工智能的存在(人工智能系統的智能存在性判別)

1、圖靈測試

(1) 概述:

圖靈測試是哲學領域,思想實驗,從形式上判別人工智能(從行為上對智能檢測)

(2) 基本思想:

通過模擬對話來判斷一個機器是否能夠表現得像一個有智能的人一樣

(3) 實驗概述:

在圖靈測試中,有一個評判者(通常是人類)與一個機器和一個真實的人進行對話,評判者不能直接看到對話的參與者。如果評判者無法區分哪個是機器哪個是真人,即無法通過對話內容來判斷出機器的存在,那麼這台機器就通過了圖靈測試,被認為具備了智能。

(4) 實驗方案:

提問者、被提問者(一台機器,一個人);

提問的方式沒有額外的信息泄露;

如果提問者區分兩者的正確率小於50%,則可以認為機器具有智能。

(5) 三個重點

一個測試者,一個受測者,一台機器;

所有交流信息無泄漏;

如果提問者區分兩者的正確率小於50%,則可以認為機器具有智能。

2、希爾勒的中文屋子實驗

(1) 實驗描述

一個對中文一竅不通的,以英語為母語的人被關閉在一個只有兩個通口的封閉房間中。房間裏有一本中英翻譯手冊。房間外的人不斷向房間內遞進用中文寫成的問題。房內的人便按照手冊的説明,用中文回答出問題,並將答案遞出房間。

(希爾勒中文屋子實驗表明,用圖靈測試來定義智慧是遠遠不夠的。)

(2) 實驗要旨:

提問者使用中文講故事並提出問題,被提問者(只懂得英文)使用規則(用英語表示)產生問題的答案,即使被提問者完全不懂中文,仍然能夠產生正確的答案。(也是一個思想實驗)

(3)實驗目的一>通過了圖靈測試就具有了智能嗎?

即使計算機給出了正確的答案,即使一台機器已經實際通過了簡化的圖靈檢驗的電腦,這台電腦仍然完全不具備和理解相關的”精神屬性”。

(4)如何理解希爾勒的中文屋子?

這個實驗挑戰了計算機的智能和意識是否與人類的智能和意識相似或等價的觀點。西爾認為,即使機器能夠通過模仿人類的行為和回答通過圖靈測試,也不能證明機器具有真正的智能和意識。通過中文屋子實驗,西爾試圖闡述了“強人工智能”觀點的問題,即機器是否能夠真正具備與人類相似或等價的智能和意識。

“強人工智能”:某種形式的人工智能能夠真正地推理和解決問題。

人工智能的定義是未知的,判定方法是哲學的。

3、莫拉維克悖論一>人的智能與機器的智能是同一個智能嗎?

從現象上看,計算機和人類似乎具有不同的智能。為什麼具有不同的智能?計算機強於計算和邏輯推理(具有非常強悍的邏輯推理能力),人強於(例如:)圖形識別。所以人的智能和機器的智能是不同的智能。計算機的智能更注重執行邏輯推理和高速計算,人類的智能更注重感知、理解和適應複雜環境。

4、應用:

圖靈測試+莫拉維克悖論可用於做驗證碼(圖形識別對人來説非常快,但對計算機而言非常困難)

二、人工智能的四個流派

1、符號主義(基於符號處理的符號主義)Symbolism

人類思維的基本單元是符號,思維過程是對符號的處理過程,自然語言也是用符號表示的。

(1)理論基礎:

理論基礎:物理符號系統假設和有限合理性原理。

  1. 物理符號系統假設:物理符號系統是表現智能行為必要和充分的條件;
  2. 有限合理性原理:人類行為表現出有限的合理性。

(2)理解:

符號主義是從計算機的角度來講的,計算機本質上是一個邏輯機器即符號機器(計算機能完成人類的第一語言符號系統、第二語言符號系統.....]

符號主義做了一個物理符號假設,它認為人類和機器都具有等價的智能。

(3) 深入討論:

符號主義認為人類和機器是一樣的。從機械的角度闡述智能的產生。

建立在機器的基礎上,完成人工領域的探索,做成計算機最早的模型為圖靈機,圖靈機是一個理想的機器。

圖靈機<一>RAM(馮•諾依曼機)<一>入程序(編程語言)

1) 機器中分為兩部分:

a. 數據段(DS):知識表示

知識表示,即如何把一個二進制串轉換為人類理解的模式?或把人類理解的模式轉變為二進制比特?

知識表示有很多項:

b. 代碼段(CS):算法和搜索一>我們表示的數據怎麼拿出?怎麼樣進行變化?怎麼樣讀、寫和增刪查?

2、聯接主義(以人工神經網絡為代表的連接主義)Connectionism

人工神經網絡是典型代表,其理論基礎是腦模型,人工神經網絡具有良好的自學習、自適應和自組織能力,以及大規模並行,分佈式信息存儲和處理的特點。可以處理不確定性問題。

(1) 理論基礎:

連接主義的理論基礎是腦模型。

(2)典型代表:

人工神經網絡是連接主義的典型代表。

(3)核心:

智能的本質是聯接機制。

(4)補充:

人工神經網絡具有良好的自學習,自適應和自組織能力,以及大規模並行,分佈式信息存儲和處理的特點,可以處理不確定性問題。

3、演化主義(以演化計算為代表的演化主義)Evolutionism

模擬自然界的生物演化過程入手,以解決智能系統如何從環境中進行學習的問題。理論基礎為達爾文的進化論。

(1) 理論基礎:

演化理論的理論基礎是達爾文的進化論。

(2) 理解:

智能是進化產生的。

4、行為主義(以多智能體系為代表的行為主義)Actionism

在沒有對簡單的智能系統有清楚的瞭解和大量的實踐以前,不可能準確的地理解構造更為複雜的人類智能的方法。從簡單的系統開始,逐步構造出更為複雜的系統理論基礎為控制論Cybernetics。

(1 )理解:

從自動化的角度去研究智能的產生。

(2)補充:

從簡單的系統開始,逐步構造出更為複雜的系統。

理論基礎為控制論Cybernetics。

三、知識表示及其對應搜索

1、知識表示的分類:

(1)狀態空間表示:線性代數

狀態空間表示法即線性代數。

(2)邏輯表示:命題的表示、一階謂詞的表示

邏輯表示分為命題的表示和一階謂詞表示法。

邏輯表示法和其他的方法都是等價的。

(3) 產生式表示:^

理解:邏輯表示的“與或非”改成產生式“推導”和“入”,此時會構成一個個規則(規則1,規則2, …,規則n),得到產生式X(每一個答案即是一個產生式),那麼我們的系統就會變成一個產生次數的系統。

實質:邏輯表示的“與或非”改成“推導”和“A”

在產生式系統下研究它,可發現他們之間都是一致、等價的。

(4) 語義網絡表示

語義網絡表示實際是一個圖形化表示方法,其最終可變成二元謂詞表示。X—>yf(x,y)。

語義網絡表示實際是一個二元謂詞的表示。

!!!多元謂詞如何處理?將其轉換成多個二元謂詞,通過加入一個虛元,把每一個謂詞的元素都連接上它,即可將多元謂詞轉換成多個二元謂詞。!!

(5) 框架表示

框架表示,本質上就是語義網絡表示,就是一個謂詞表示。

等價於一階謂詞表示、面向對象程序設計、數據庫,是一致的。所以數據庫也是一階謂詞。

集合是一階謂詞。理解:一個謂詞x等於1,構造一個集合,將x放入該集合,所以集合與一階謂詞之間構成了一一等價的關係,也就是一一映射、對應關係,所以,一個集合就是一個謂詞。

集合與集合之間的關係:集合的運算一>子交井補差

四、算法與搜索

1. 算法(不講)

2. 搜索(實驗編程)

(1) 廣度優先!!!

人工智能導論——人工智能學科研究的基本內容及主要研究領域_理論基礎

(2) 深度優先!!!

人工智能導論——人工智能學科研究的基本內容及主要研究領域_#人工智能_02

(3) 廣度優先和深度優先統稱為盲目搜索

人工智能導論——人工智能學科研究的基本內容及主要研究領域_#人工智能_03

(4)邏輯性搜索算法

剛才表示裏對應的搜索,它們全部是邏輯的,因此可以通過邏輯的方式來進行搜索,這個就叫機器證明。

機器證明:在邏輯上的搜索,在一階謂詞上的搜索。

合併性歸結:…(書上不同的搜索之間的區別等等)

(5) 啓發搜索

五、不確定性推理方法

1、模糊數學!!!

(1) 計算(交井補差)

人工智能導論——人工智能學科研究的基本內容及主要研究領域_#人工智能_04

(2) 公理

一般的公理,如交換律、結合律、分配律、德摩根律等等都是存在的。

但排中律不是絕對的,對模糊集合來説排中律失效。

排中律指的是任何命題要麼為真,要麼為假,不存在中間的狀態。

(3) 模糊集合和明確集合之間的關係

例如:C=趙/0.3+錢/0.5+孫/0.9+李/1

權重:元素對整個集合有貢獻

CO+={趙,錢,孫,李} 權重大於0元素

C0.4={錢,孫,李}權重大於0.4的元素

(4) 數據庫等價於一階謂詞,等價於函數

人工智能導論——人工智能學科研究的基本內容及主要研究領域_理論基礎_05

x與y之間存在一個映射關係,Y=×2,此時是一個函數,也可以寫成:

if x=1, then y=1; if x=2, then y=4; if x=3,

then y=9 >記憶法

記憶法:任意給定一個數據,都能大致得出它在做什麼(結果是什麼)記憶法等價於人工智能的神經網絡。

Kamogror壓縮:將該程序壓縮(根據x,求y的程序),轉換成另一個更簡單的程序,得到加速程序。

六、機器學習

1、本質

機器學習本質上:根據數據得到一個記憶法(函數),對這個記憶法進行kdmogror壓縮。

神經網絡可解釋性:神經網絡是不是可以得到這樣一個函數,是不是可以得到一種非常簡單的情形。

本質上即記憶法能不能壓縮到這樣一個情形,顯然存在着一個數據是不可被壓縮的,即存在不可壓縮的神經網絡。

存在不可壓縮的數據(神經網絡),存在着不可解釋的神經網絡。

七、神經網路

1、BP神經網絡

(1 )感知機

感知機不能做線性劃分。不能解決不可線性劃分問題,只能解決線性可分問題。

異或不可劃分問題:在二元形式上,共有16個函數,其中“同或”和“異或”這兩個函數不可線性劃分。

如何證明異或不可劃分問題?

基本思想:逐步地將樣本集中的樣本輸入到網絡中,根據輸出結果和理想輸出之間的差別來調整網絡中的權矩陣

(2)BP算法

原理:多層感知器的輸入輸出關係與單層感知器完全相同。前一層的輸出是下一層的輸入。也被稱為BP網絡。

人工智能導論——人工智能學科研究的基本內容及主要研究領域_人工智能_06

八、演化計算

演化計算的本質上是一種迭代算法,是一種生成測試法,生成新個體的規則是統一的。

人工智能導論——人工智能學科研究的基本內容及主要研究領域_理論基礎_07

人工智能導論——人工智能學科研究的基本內容及主要研究領域_人工智能_08

1. 分類

(1) GA

(2)EA

(3) GP:函數規約

給一串數據,提供其表達式。

(4) EP:博弈論

策略是最好的

2、NFt定理

重要定理:Nft定理,不存在超級算法能解決優化問題。

NFt定理的核心思想是:在所有可能的問題上,平均而言,任何兩個優化算法的性能是相等的。換句話説,沒有一種通用的優化算法可以在所有問題上都表現最好。

九、重要概念

1、哥德爾不完備性定理

哥德爾不完備性定理表明,對於足夠強大的形式系統(如數學中的公理系統),必然存在一些無法在該系統內被證明或推導出的命題。(只要是不那麼簡單的系統,一定存在着一些為真的命題不能被證明。

兩個性質:相容性、完備性

2、莫拉維克悖論

從現象上看,計算機和人類似乎具有不同的智能。為什麼具有不同的智能?計算機強於計算和邏輯推理(具有非常強悍的邏輯推理能力),人強於(例如:)圖形識別。所以人的智能和機器的智能是不同的智能。計算機的智能更注重執行邏輯推理和高速計算,人類的智能更注重感知、理解和適應複雜環境。

3、補充

(1) 圖靈完備性 (Turing Completeness)

圖靈完備性是指某個計算系統能夠模擬圖靈機的計算能力。這意味着只要一個系統具有圖靈完備性,它就可以進行任何可計算的計算。這個定理對於理解計算機的能力和限制非常重要。

(2) NFt定理(No Free Lunch Theorem)

NFt定理表明,在所有可能的問題上,平均而言,任何兩個優化算法的性能是相等的。這個定理強調了沒有通用的優化算法適用於所有問題,需要根據問題的特點選擇合適的算法。

(3) 貝葉斯定理(Bayes' Theorem)

貝葉斯定理是概率論中的一個基本定理,用於計算在已知一些先驗條件下,事件的後驗概率。在機器學習和統計推斷中,貝葉斯定理被廣泛應用於概率模型的更新和參數估計。

(4)維度災難(Curse of Dimensionality)

維度災難是指在高維空間中,數據稀疏性增加、計算複雜度增加的現象。隨着維度的增加,數據點之間的距離變得越來越遠,導致難以有效地處理和分析高維數據。

(5) VC維理論(Vapnik-Chervonenkis Theory)

VC維理論是統計學習理論中的一個重要定理,用於衡量一個分類算法的能力和複雜度。VC維描述了一個分類器能夠擬合的樣本集的最大數量,在模型選擇和泛化能力評估中具有重要意義。

十、題型

選擇 2*10

簡答題 4*6

證明:1*8

表示與計算(3*4)+(8+6)

編程題 2*11