A- A+

【迎戰AI時代】越來越趨近於人類、人工智慧的各種「學習」模式

2017/06/16 19:12:18 聯合新聞網 udn讀.書.人

文/三宅陽一郎,森川幸人

深度學習deep learning

深度學習是運用類神經網路的技術之一。它最大的變革點是,只要有充分的學習資料,類神經網路自己就可以自動抽出資料群的特徵。至今的圖像分析和資料分析,是利用抽出演算法來處理資料和問題。然而,深度學習不需要人為的幫助,就能自動抽出特徵。概略地說,深度學習是「只要將資料輸入類神經網路,它就能自行抽出特徵」的人工智慧。

類神經網路是模擬稱為神經元的腦神經單位,將之連結形成的網路狀模型。它會將輸入的符號不停在這個網路上傳遞下去。在類神經網路領域,一九八○年代的「誤差倒傳遞」(error backpropagation,誤差反向傳播)以來,重大的變革是二○○六年辛頓(Geoffrey Hinton)提出的新學習法,稱為自動編碼器(autoencoder)。這個手法的特徵之一是,讓類神經網路的各層都能階段式學習。例如,第一層將輸入的資訊原封不動輸出,並加以學習。第二層是在已經學習過的第一層上面,同樣再現輸入的資訊,並加以學習。第三層以降也一樣。像這樣每個階段都進行學習的類神經網路,就算階層再多,也具有很強的學習功能。

圖/臉譜提供
圖/臉譜提供

深度學習最擅長的是,它能辨識圖像資料或波形資料這類無法符號化的資料中的模式。從輸入層輸入圖像之後,就能進行階段式學習。一般常用的類神經網路結構,是各層一個個各自全部連結起來的感知器型態,但我們已經知道辨識圖像時,用特殊的方式連結更能有效運作。這稱之為卷積神經網路(convolutional neural network)。進一步參考人類大腦視覺區所發展而成的,就是當時任職於NHK放送技術研究所的福島邦彥提出的新認知機(頁89)。這成為深度學習的原型。它的特性是,將輸入的資料切成各種大小的片段,抽出特徵,使其成為多層次架構的中間層。例如輸入車子的圖像,它會抽出細部的模式,乃至大的構造和整體輪廓等。

利用這個特性,深度學習也能運用於圍棋人工智慧。二○一六年,戰勝職業棋士的Google 的AlphaGo,就是輸入所有棋盤資料,在各層抽出特徵。有些則是可以學習大師畫作的筆觸,或是抽取出動畫角色的特徵來研究。

書名:《從人到人工智慧,破解AI革命的68個核心概念:實戰專家全圖解 × 人腦不...
書名:《從人到人工智慧,破解AI革命的68個核心概念:實戰專家全圖解 × 人腦不被電腦淘汰的關鍵思考》
作者: 三宅陽一郎, 森川幸人
譯者:鄭佩嵐
出版社:臉譜
出版日期:2017年5月6日
深度學習如此飛躍發展,不可忽略的背景因素是硬體設備的性能提升。特別是,類神經網路是反覆進行的定型演算,很多部分可以進行並列式計算也是特徵之一。支持遊戲產業或電腦繪圖業發展、搭載圖形處理器(graphics processing unit, GPU) 的圖形卡(graphicsboard),也可以用於深度學習的發展。現在的圖形處理器有數百個運算核心所組成的並列演算裝置,適合深度學習的高速計算。圖形卡大廠輝達(NVIDIA)用該公司的圖形卡來提升深度學習的性能,提供程式庫(library)和框架(framework)產品,積極開設研討課程。另外,Google 也公開了框架「TensorFlow」,可以將深度學習善用於資料分析。

深度學習是人工智慧整體領域中的一個分支,但二○○○年左右,並不認為深度學習會形成這麼大的熱潮。或者應該說,從傳統的角度來看,這個領域的發展難以預期。然而,由於具先見之明的研究者的努力,促進了極大的變革,進而一躍成為時代的中心。但對於這樣的躍進,研究者與社會大眾的認知有一些落差。研究者的評價是,深度學習與過去的類神經網路相比有了飛躍性的進展,社會認知則認為深度學習讓人工智慧突然間更近似人類。另外,要真正實際運用於社會中,還需要更多時間及階段性發展,現在世界各地正加緊腳步開發深度學習,希望應用於更多領域。

機器學習machine learning

機器學習是指讓人工智慧能夠進行學習,以機器學習為手段來解決人工智慧中的問題。機器學習一詞,幾乎與人工智慧一詞同時出現。換言之,能夠做到超出程式設計師所設定的程式之外的事,是機器學習的一項基準。

機器學習還隱含「不只是規劃好的事」之意,表示機器自己可以學習。這裡所說的機器,當時是指從大型計算機展開的自動機器。

相較於獲取思考方式或最新的知識,機器學習更應該說是能調整被建置的思考方式,以預先設定好的知識型態儲存知識,進行學習。優化(optimization)和儲存是機器最擅長的部分。然而,不像人類可以從混亂的狀況中產生新的想法,人工智慧現在還無法做到這點。自己產生出想法,是人類才具有的創造性。

圖/臉譜提供
圖/臉譜提供

機器學習分為監督式學習(supervised learning)和非監督式學習(unsupervised learning)。兩者的明確區別是,監督式學習是準備好「訓練資料」(training data),讓人工智慧往單一個方向學習;非監督式學習則是沒有訓練資料,讓人工智慧自行透過自己的活動收集資料,從中自我學習。兩者迥然有別。

在監督式學習的情況下,如果輸入某個指令,訓練資料會教導做出相對應的行動。舉個具體的例子。在假想空間中設一隻虛擬犬(代理人)。對這隻狗發出「握手」、「坐下」、「跑步」的命令。從麥克風用聲音發出各種命令時,這隻虛擬犬一開始不知道應該做出什麼行動,所以隨機選擇反應。剛好做出正確的反應時,我們就誇獎它;做出錯誤的反應,就叱責它。這樣一來,它就能慢慢學會應該將哪種命令的聲音與哪種行動對應起來。

至於非監督式學習,則可以舉二○一六年戰勝職業棋士的AlphaGo為範例。AlphaGo 有兩個學習階段,第一階段是從人類過去的棋譜學習,學完之後進入自我對奕的學習階段。前者是從棋譜進行監督式學習的學習階段,後者是自我對奕來進行非監督式學習的學習階段。

一般而言,監督式學習需要大量資料,非監督式學習則需要提供適合學習的環境。例如,想讓人工智慧用非監督式學習的方式,學習現實世界的紙飛機設計,這是可行的。因為實際上的確有可供紙飛機飛行的環境。然而,若想讓人工智慧在遊戲中同樣設計紙飛機,因為遊戲中無法模擬空氣的流動等,沒辦法從實際的飛行經驗中學習。非監督式學習的前提是,必須提供整合性的環境。

圖/臉譜提供
圖/臉譜提供

非監督式學習的重要性the importance of unsupervised learning

人工智慧的模型,包括需要有例題和標準答案(稱為指令信號〔 instructional signal 〕)的模型,以及不需要例題和標準答案的模型。使用指令信號學習的是監督式學習,不使用指令信號學習的是非監督式學習。

監督式學習會遇到一些問題。舉例來說,假設要將人工智慧送到火星等未知的世界。無法預測在那個未知的世界會發生什麼現象,所以無法針對那些現象設定正確的答案。換言之,無法制定指令信號。再者,由人來設定標準答案,人工智慧無法超越那個人的聰明程度,因而受到限制。

因此,不需要指令或說標準答案的非監督式學習,特別受重視。

強化學習reinforcement learning

人工智慧在所屬的環境中,自己嘗試錯誤,從中找出最佳行動,這種學習稱為強化學習。強化學習是自己辨識行動的結果,也可視為非監督式學習。

強化學習的重點是,首先必須將自己的行動和狀況明確表現出來。接著,了解在什麼狀況下採取什麼行動,基於那個環境,會出現什麼樣的結果。這麼一來,就能學習如何採取最佳行動。指引學習方向是稱為獎勵(reward)的概念,獎勵是對結果的估計值。如何定義獎勵,決定了學習的方向。讓我們舉個例子。

賭場裡有三台吃角子老虎機A、B、C。預算是三千美元。在這種情況下,立刻把三千美元下注在同一台機器上,或是三台機器各下注一千美元,這樣的人應該沒看過吧。通常會在三台機器各下注小金額。假設先在每台機器各下注五十美元,看看出現什麼樣的結果。假設吐出的錢是一百美元、二十美元和七十美元。那麼,獲利機器的排序是A、C、B。接下來,在A、B、C三台機器下注兩百美元、四十美元和一百四十美元。依據結果,決定如何修改下一次的賭注金額。反覆依序進行,就能決定三台機器的下注方式。這就是從行為和結果來學習的強化學習。

圖/臉譜提供
圖/臉譜提供

再以對戰格鬥遊戲為例來思考。人類操作的角色與人工智慧操作的角色對戰。一開始,人工智慧會隨機做出踢、拳、射線。獎勵就是人類操作的角色體力減少的程度。狀態則是與人類操作角色的距離,以及自己與對方角色的速度。剛開始只是隨機出招,對方幾乎沒有任何損失,但幾次對戰的過程中,偶爾出現讓對方受到損失的情況。人工智慧把那些狀況記憶起來。在無數對戰的過程中,人工智慧能夠學習在什麼狀態下,採取什麼行動,可以削減對方的體力。這就是強化學習。

強化學習是從環境中找出適當行為的方式,是學習中最實用的方法之一。它的應用範圍非常廣泛,特別是想要學習的對象無法模型化時,能夠有效進行學習。

●本文摘自臉譜出版《從人到人工智慧,破解AI革命的68個核心概念:實戰專家全圖解×人腦不被電腦淘汰的關鍵思考》

延伸閱讀:看更多【決戰AI世代】主題選書

作者簡介:三宅陽一郎Youichiro Miyake

京都大學數學專攻,大阪大學物理學碩士,東京大學工學系研究科博士課程(學分取得滿期退學)。

從事數位遊戲的人工智慧開發及研究。設立國際遊戲開發者協會(IGDA)日本遊戲AI專門部會(主席),日本數位遊戲學會(DiGRA JAPAN)理事、藝術科學會理事、人工智慧學會(人工知能学会)編輯委員、日本計算機娛樂開發者大會(CEDEC)委員。

讀.書.人


我們每個人都閱讀自身及周遭的世界,俾以稍得瞭解自我與所處。我們閱讀以求理解或啟迪。我們不得不閱讀。

《閱讀地圖——人為書癡狂的歷史》

追蹤閱讀 快加入讀書吧粉絲團!


分享給好友 加入udn

相關新聞

【迎戰AI時代】模仿人腦的人工智慧 兩者有何差異?

2017/06/28

【迎戰AI時代】機器人取代了你,你就被開除了!

2017/06/28

蘭心慧質美韶容:台灣近代「女學生」/「新女性」的誕生

2017/06/26

【迎戰AI時代】如果今日知識已經客體化、又何必集中在一個空間聽取?

2017/06/21

【迎戰AI時代】當數位給社會帶來第三次革命、「拇指世代」成為一種新人類

2017/06/19

【迎戰AI時代】世界的根本存在是什麼?萬物源於「訊息」

2017/06/16

【迎戰AI時代】越來越趨近於人類、人工智慧的各種「學習」模式

2017/06/16

【迎戰AI時代】機器學習的終極演算法 將如何改變我們的未來

2017/06/16

【迎戰AI時代】無所不在的演算法支配著你的生活、取代記憶

2017/06/16

【迎戰AI時代】AlphaGo打敗頂尖棋手,為何google選擇圍棋作為AI最前線?

2017/06/15

【迎戰AI時代】人工智慧的可怕,在於預測的精確度

2017/06/15

【迎戰AI時代】「人工智慧」征服人類,只是瘋狂科學家的劇本嗎?

2017/06/15

【迎戰AI時代】世紀初的經典人機大戰——會思考的電腦「華生」

2017/06/15

【迎戰AI時代】科幻成真,科學家預言機器人將具有自己的意識

2017/06/15

聖經譴責的是雞姦儀式,並非同性之間的愛情

2017/06/07

用「毛皮交易」撐起新興政權的狩獵民族——女真

2017/06/07

活在黑色幽默生活網?中國網民發明「替代品」易如反掌

2017/06/05

不完美又怎樣?成為一個「壞掉的」女性主義者吧!

2017/06/05

革命派的成長與中國同盟會:激進派留學生與孫文

2017/06/01

末代王朝與近代中國:袁世凱任臨時大總統與《臨時約法》

2017/05/27

高碳社會來臨,台灣該如何迎戰?

2017/05/23

讀一本「遊民傳記」──看見體制、精神疾病、教育、家庭是怎麼影響一個人

2017/05/17

普普教皇安迪.沃荷:一幅畫不用想的時候,就是好畫

2017/04/26

「如假包換」的幸福?爆紅青年藏人婚紗照瘋傳時,卻有人在街上自焚

2017/04/26

行為藝術教母的人性實驗:逼顯人類底心的「恐懼」與「殘暴」

2017/04/25

參與政治的同時,也迫切需要「心理治療」的原因

2017/04/19

回到自然母親的懷抱 他是「種樹的詩人」

2017/04/12

只能在日本做為一個「中國人」生活的台灣人

2017/04/07

日本帝國的鴉片謀略 臺人吸與不吸原來都在謀劃中?

2017/03/29

古人賣房子是丟臉的?還要親族鄰居同意才可以

2017/03/27

美國失敗的教育制度:老師越爛薪水越高?!

2017/03/23

在埃及,社會根本是一個只有男性成員的兄弟會?

2017/03/14

只能被處死嗎?為何動物「發狂」的原因從不被了解

2017/03/10

女力時代:為何職場女性不能展現「性魅力」?

2017/03/08

誰還記得他們?八千多名在日本打拼的台灣少年工

2017/03/03

臣屬、遣使、侵略、征服──對日本人來說,中國是什麼?

2017/03/02

重構二二八:戰後的臺灣人的複雜處境

2017/02/28

林江邁:是二二八的導火線,也只是一個選擇沉默的母親

2017/02/28

民主夢碎:屠殺前夕的「二二八事件處理委員會」

2017/02/28

無法送達的遺書:她遙想一生的父親氣味

2017/02/28

熱門文章

張翎/盲約(上)

2017/06/26

【迎戰AI時代】如果今日知識已經客體化、又何必集中在一個空間聽取?

2017/06/21

【迎戰AI時代】模仿人腦的人工智慧 兩者有何差異?

2017/06/28

蘭心慧質美韶容:台灣近代「女學生」/「新女性」的誕生

2017/06/26

【迎戰AI時代】人工智慧來了,國家改革準備好了嗎?

2017/06/15

張翎/盲約(下)

2017/06/26

【迎戰AI時代】當數位給社會帶來第三次革命、「拇指世代」成為一種新人類

2017/06/19

【迎戰AI時代】人工智慧的可怕,在於預測的精確度

2017/06/15

【迎戰AI時代】世界的根本存在是什麼?萬物源於「訊息」

2017/06/16

【迎戰AI時代】無所不在的演算法支配著你的生活、取代記憶

2017/06/16

【迎戰AI時代】機器人取代了你,你就被開除了!

2017/06/28

【迎戰AI時代】AlphaGo打敗頂尖棋手,為何google選擇圍棋作為AI最前線?

2017/06/15

【迎戰AI時代】越來越趨近於人類、人工智慧的各種「學習」模式

2017/06/16

【迎戰AI時代】機器學習的終極演算法 將如何改變我們的未來

2017/06/16

李進文/今夜我凝視身體、如果在冬夜,討論有錢

2017/06/07

【迎戰AI時代】「人工智慧」征服人類,只是瘋狂科學家的劇本嗎?

2017/06/15

【迎戰AI時代】科幻成真,科學家預言機器人將具有自己的意識

2017/06/15

【迎戰AI時代】世紀初的經典人機大戰——會思考的電腦「華生」

2017/06/15

書上設計展:當代新銳設計,激盪臺式設計的無限活力

2017/06/12

不完美又怎樣?成為一個「壞掉的」女性主義者吧!

2017/06/05

聖經譴責的是雞姦儀式,並非同性之間的愛情

2017/06/07

革命派的成長與中國同盟會:激進派留學生與孫文

2017/06/01

活在黑色幽默生活網?中國網民發明「替代品」易如反掌

2017/06/05

用「毛皮交易」撐起新興政權的狩獵民族——女真

2017/06/07

商品推薦

贊助廣告

留言