A- A+

【迎戰AI時代】越來越趨近於人類、人工智慧的各種「學習」模式

2017/06/16 19:12:18 聯合新聞網 udn讀.書.人

文/三宅陽一郎,森川幸人

深度學習deep learning

深度學習是運用類神經網路的技術之一。它最大的變革點是,只要有充分的學習資料,類神經網路自己就可以自動抽出資料群的特徵。至今的圖像分析和資料分析,是利用抽出演算法來處理資料和問題。然而,深度學習不需要人為的幫助,就能自動抽出特徵。概略地說,深度學習是「只要將資料輸入類神經網路,它就能自行抽出特徵」的人工智慧。

類神經網路是模擬稱為神經元的腦神經單位,將之連結形成的網路狀模型。它會將輸入的符號不停在這個網路上傳遞下去。在類神經網路領域,一九八○年代的「誤差倒傳遞」(error backpropagation,誤差反向傳播)以來,重大的變革是二○○六年辛頓(Geoffrey Hinton)提出的新學習法,稱為自動編碼器(autoencoder)。這個手法的特徵之一是,讓類神經網路的各層都能階段式學習。例如,第一層將輸入的資訊原封不動輸出,並加以學習。第二層是在已經學習過的第一層上面,同樣再現輸入的資訊,並加以學習。第三層以降也一樣。像這樣每個階段都進行學習的類神經網路,就算階層再多,也具有很強的學習功能。

圖/臉譜提供
圖/臉譜提供

深度學習最擅長的是,它能辨識圖像資料或波形資料這類無法符號化的資料中的模式。從輸入層輸入圖像之後,就能進行階段式學習。一般常用的類神經網路結構,是各層一個個各自全部連結起來的感知器型態,但我們已經知道辨識圖像時,用特殊的方式連結更能有效運作。這稱之為卷積神經網路(convolutional neural network)。進一步參考人類大腦視覺區所發展而成的,就是當時任職於NHK放送技術研究所的福島邦彥提出的新認知機(頁89)。這成為深度學習的原型。它的特性是,將輸入的資料切成各種大小的片段,抽出特徵,使其成為多層次架構的中間層。例如輸入車子的圖像,它會抽出細部的模式,乃至大的構造和整體輪廓等。

利用這個特性,深度學習也能運用於圍棋人工智慧。二○一六年,戰勝職業棋士的Google 的AlphaGo,就是輸入所有棋盤資料,在各層抽出特徵。有些則是可以學習大師畫作的筆觸,或是抽取出動畫角色的特徵來研究。

書名:《從人到人工智慧,破解AI革命的68個核心概念:實戰專家全圖解 × 人腦不...
書名:《從人到人工智慧,破解AI革命的68個核心概念:實戰專家全圖解 × 人腦不被電腦淘汰的關鍵思考》
作者: 三宅陽一郎, 森川幸人
譯者:鄭佩嵐
出版社:臉譜
出版日期:2017年5月6日
深度學習如此飛躍發展,不可忽略的背景因素是硬體設備的性能提升。特別是,類神經網路是反覆進行的定型演算,很多部分可以進行並列式計算也是特徵之一。支持遊戲產業或電腦繪圖業發展、搭載圖形處理器(graphics processing unit, GPU) 的圖形卡(graphicsboard),也可以用於深度學習的發展。現在的圖形處理器有數百個運算核心所組成的並列演算裝置,適合深度學習的高速計算。圖形卡大廠輝達(NVIDIA)用該公司的圖形卡來提升深度學習的性能,提供程式庫(library)和框架(framework)產品,積極開設研討課程。另外,Google 也公開了框架「TensorFlow」,可以將深度學習善用於資料分析。

深度學習是人工智慧整體領域中的一個分支,但二○○○年左右,並不認為深度學習會形成這麼大的熱潮。或者應該說,從傳統的角度來看,這個領域的發展難以預期。然而,由於具先見之明的研究者的努力,促進了極大的變革,進而一躍成為時代的中心。但對於這樣的躍進,研究者與社會大眾的認知有一些落差。研究者的評價是,深度學習與過去的類神經網路相比有了飛躍性的進展,社會認知則認為深度學習讓人工智慧突然間更近似人類。另外,要真正實際運用於社會中,還需要更多時間及階段性發展,現在世界各地正加緊腳步開發深度學習,希望應用於更多領域。

機器學習machine learning

機器學習是指讓人工智慧能夠進行學習,以機器學習為手段來解決人工智慧中的問題。機器學習一詞,幾乎與人工智慧一詞同時出現。換言之,能夠做到超出程式設計師所設定的程式之外的事,是機器學習的一項基準。

機器學習還隱含「不只是規劃好的事」之意,表示機器自己可以學習。這裡所說的機器,當時是指從大型計算機展開的自動機器。

相較於獲取思考方式或最新的知識,機器學習更應該說是能調整被建置的思考方式,以預先設定好的知識型態儲存知識,進行學習。優化(optimization)和儲存是機器最擅長的部分。然而,不像人類可以從混亂的狀況中產生新的想法,人工智慧現在還無法做到這點。自己產生出想法,是人類才具有的創造性。

圖/臉譜提供
圖/臉譜提供

機器學習分為監督式學習(supervised learning)和非監督式學習(unsupervised learning)。兩者的明確區別是,監督式學習是準備好「訓練資料」(training data),讓人工智慧往單一個方向學習;非監督式學習則是沒有訓練資料,讓人工智慧自行透過自己的活動收集資料,從中自我學習。兩者迥然有別。

在監督式學習的情況下,如果輸入某個指令,訓練資料會教導做出相對應的行動。舉個具體的例子。在假想空間中設一隻虛擬犬(代理人)。對這隻狗發出「握手」、「坐下」、「跑步」的命令。從麥克風用聲音發出各種命令時,這隻虛擬犬一開始不知道應該做出什麼行動,所以隨機選擇反應。剛好做出正確的反應時,我們就誇獎它;做出錯誤的反應,就叱責它。這樣一來,它就能慢慢學會應該將哪種命令的聲音與哪種行動對應起來。

至於非監督式學習,則可以舉二○一六年戰勝職業棋士的AlphaGo為範例。AlphaGo 有兩個學習階段,第一階段是從人類過去的棋譜學習,學完之後進入自我對奕的學習階段。前者是從棋譜進行監督式學習的學習階段,後者是自我對奕來進行非監督式學習的學習階段。

一般而言,監督式學習需要大量資料,非監督式學習則需要提供適合學習的環境。例如,想讓人工智慧用非監督式學習的方式,學習現實世界的紙飛機設計,這是可行的。因為實際上的確有可供紙飛機飛行的環境。然而,若想讓人工智慧在遊戲中同樣設計紙飛機,因為遊戲中無法模擬空氣的流動等,沒辦法從實際的飛行經驗中學習。非監督式學習的前提是,必須提供整合性的環境。

圖/臉譜提供
圖/臉譜提供

非監督式學習的重要性the importance of unsupervised learning

人工智慧的模型,包括需要有例題和標準答案(稱為指令信號〔 instructional signal 〕)的模型,以及不需要例題和標準答案的模型。使用指令信號學習的是監督式學習,不使用指令信號學習的是非監督式學習。

監督式學習會遇到一些問題。舉例來說,假設要將人工智慧送到火星等未知的世界。無法預測在那個未知的世界會發生什麼現象,所以無法針對那些現象設定正確的答案。換言之,無法制定指令信號。再者,由人來設定標準答案,人工智慧無法超越那個人的聰明程度,因而受到限制。

因此,不需要指令或說標準答案的非監督式學習,特別受重視。

強化學習reinforcement learning

人工智慧在所屬的環境中,自己嘗試錯誤,從中找出最佳行動,這種學習稱為強化學習。強化學習是自己辨識行動的結果,也可視為非監督式學習。

強化學習的重點是,首先必須將自己的行動和狀況明確表現出來。接著,了解在什麼狀況下採取什麼行動,基於那個環境,會出現什麼樣的結果。這麼一來,就能學習如何採取最佳行動。指引學習方向是稱為獎勵(reward)的概念,獎勵是對結果的估計值。如何定義獎勵,決定了學習的方向。讓我們舉個例子。

賭場裡有三台吃角子老虎機A、B、C。預算是三千美元。在這種情況下,立刻把三千美元下注在同一台機器上,或是三台機器各下注一千美元,這樣的人應該沒看過吧。通常會在三台機器各下注小金額。假設先在每台機器各下注五十美元,看看出現什麼樣的結果。假設吐出的錢是一百美元、二十美元和七十美元。那麼,獲利機器的排序是A、C、B。接下來,在A、B、C三台機器下注兩百美元、四十美元和一百四十美元。依據結果,決定如何修改下一次的賭注金額。反覆依序進行,就能決定三台機器的下注方式。這就是從行為和結果來學習的強化學習。

圖/臉譜提供
圖/臉譜提供

再以對戰格鬥遊戲為例來思考。人類操作的角色與人工智慧操作的角色對戰。一開始,人工智慧會隨機做出踢、拳、射線。獎勵就是人類操作的角色體力減少的程度。狀態則是與人類操作角色的距離,以及自己與對方角色的速度。剛開始只是隨機出招,對方幾乎沒有任何損失,但幾次對戰的過程中,偶爾出現讓對方受到損失的情況。人工智慧把那些狀況記憶起來。在無數對戰的過程中,人工智慧能夠學習在什麼狀態下,採取什麼行動,可以削減對方的體力。這就是強化學習。

強化學習是從環境中找出適當行為的方式,是學習中最實用的方法之一。它的應用範圍非常廣泛,特別是想要學習的對象無法模型化時,能夠有效進行學習。

●本文摘自臉譜出版《從人到人工智慧,破解AI革命的68個核心概念:實戰專家全圖解×人腦不被電腦淘汰的關鍵思考》

延伸閱讀:看更多【決戰AI世代】主題選書

作者簡介:三宅陽一郎Youichiro Miyake

京都大學數學專攻,大阪大學物理學碩士,東京大學工學系研究科博士課程(學分取得滿期退學)。

從事數位遊戲的人工智慧開發及研究。設立國際遊戲開發者協會(IGDA)日本遊戲AI專門部會(主席),日本數位遊戲學會(DiGRA JAPAN)理事、藝術科學會理事、人工智慧學會(人工知能学会)編輯委員、日本計算機娛樂開發者大會(CEDEC)委員。

讀.書.人


我們每個人都閱讀自身及周遭的世界,俾以稍得瞭解自我與所處。我們閱讀以求理解或啟迪。我們不得不閱讀。

《閱讀地圖——人為書癡狂的歷史》

追蹤閱讀 快加入讀書吧粉絲團!


分享給好友 加入udn

相關新聞

聽懂臨終絮語:了解親人最後的話語

2017/11/08

與生態地景對話何以成為藝術?

2017/11/02

北韓宮廷│最終被指定繼承者「金正恩」真相大公開!

2017/10/18

屍屍的愛,燒融在黎明之前。

2017/09/22

賴活不如好死,當被判定「無效醫療」你只有死路一條?!

2017/09/20

「沖繩靈魂」專賣店,全日本最小書店URARA

2017/09/15

《鬼的歷史》(一)中國末代皇帝溥儀也迷碟仙?

2017/09/14

「親善交流」盛行,戰敗後的日本慰安史

2017/09/11

三度偷渡重返敘利亞,直擊困守內戰的苦難

2017/09/07

為什麼會有「恐怖主義」?關於恐怖主義的誕生

2017/08/30

離鄉背井、克盡職守,終結二次大戰的原子城女孩

2017/08/16

他們為何逃離故鄉?關於戰爭與自由的代價

2017/08/01

拒絕真相的人:人類既有認知該如何融入科學新發現?

2017/07/31

在四季的海洋上,從小艇捕捉鯊魚的大冒險

2017/07/31

從近代史學者走向外交,揭開時代帷幕–—蔣廷黻

2017/07/31

西洋名畫中的「同性之愛」

2017/07/27

山中獨處的夜晚:面對死亡、恐懼、找回寧靜沉穩

2017/07/27

當愛與黑暗吞噬了他們——劉曉波的文學與人生

2017/07/27

為何公司連年虧損、卻還能替創辦人和投資人帶來鉅富?

2017/07/27

近代紳士的整容提案──「梳整頭髮、刮鬍、美容」之必要

2017/07/26

人類為何開始穿內褲——愈是隱藏,反而愈提高價值?

2017/07/18

面對暴權酷刑 劉曉波為何宣稱:「我沒有敵人」?

2017/07/15

留不住文化資產?老屋、古蹟總難逃「自燃」下場

2017/07/13

加薩女記者的日常:當記者被家人都瞧不起、示威沒戴頭巾被賞巴掌

2017/07/04

遇上她們,哲學家叔本華、尼采、蘇格拉底都沒轍!

2017/07/03

【迎戰AI時代】模仿人腦的人工智慧 兩者有何差異?

2017/06/28

【迎戰AI時代】機器人取代了你,你就被開除了!

2017/06/28

蘭心慧質美韶容:台灣近代「女學生」/「新女性」的誕生

2017/06/26

【迎戰AI時代】如果今日知識已經客體化、又何必集中在一個空間聽取?

2017/06/21

【迎戰AI時代】當數位給社會帶來第三次革命、「拇指世代」成為一種新人類

2017/06/19

【迎戰AI時代】世界的根本存在是什麼?萬物源於「訊息」

2017/06/16

【迎戰AI時代】越來越趨近於人類、人工智慧的各種「學習」模式

2017/06/16

【迎戰AI時代】機器學習的終極演算法 將如何改變我們的未來

2017/06/16

【迎戰AI時代】無所不在的演算法支配著你的生活、取代記憶

2017/06/16

【迎戰AI時代】AlphaGo打敗頂尖棋手,為何google選擇圍棋作為AI最前線?

2017/06/15

【迎戰AI時代】人工智慧的可怕,在於預測的精確度

2017/06/15

【迎戰AI時代】「人工智慧」征服人類,只是瘋狂科學家的劇本嗎?

2017/06/15

【迎戰AI時代】世紀初的經典人機大戰——會思考的電腦「華生」

2017/06/15

【迎戰AI時代】科幻成真,科學家預言機器人將具有自己的意識

2017/06/15

聖經譴責的是雞姦儀式,並非同性之間的愛情

2017/06/07

熱門文章

聽懂臨終絮語:了解親人最後的話語

2017/11/08

燈泡復活的瞬間,將我們化為一幅永垂不朽的畫作。

2017/11/15

蘇上豪/再一次心跳

2017/10/30

石芳瑜/善女良男

2017/11/20

台語的撇步:好朋友來開講

2017/10/25

孤寂的異鄉人──張愛玲美國四十年

2017/10/26

逞強或堅強?男人心事誰人知

2017/11/01

無以競爭,我輸在自己的年齡。

2017/10/26

而,我只是希望母親愛我。

2017/10/31

世界終究無法科幻。

2017/11/02

與生態地景對話何以成為藝術?

2017/11/02

商品推薦

贊助廣告

留言