A- A+

【迎戰AI時代】機器學習的終極演算法 將如何改變我們的未來

2017/06/16 11:41:04 聯合新聞網 udn讀.書.人

企業為何擁抱機器學習?

書名:《大演算:機器學習的終極演算法將如何改變我們的未來,創造新紀元的文明?》
...
書名:《大演算:機器學習的終極演算法將如何改變我們的未來,創造新紀元的文明?》
作者:佩德羅.多明戈斯
譯者:張正苓,胡玉城
出版社:三采
出版日期:2016年8月5日
為什麼Google 公司的市值比雅虎(Yahoo)高出許多?明明兩家公司都是從網路廣告帶來營收,而且兩者都是最熱門的入口網站,也都採用拍賣模式出售廣告,且都是透過機器學習來預測用戶有多少可能會去點擊廣告(點擊的機率越高,這個廣告位置就越有價值)。但Google 的機器學習演算法比雅虎的還要好得多了。當然這不是他們在市值差異的唯一原因,但絕對是一個大的問題。對於廣告客戶來說,如果每一個預測的點擊並沒有發生,那等於是平白浪費了一個機會,而且對於網站而言,自然也會損失財源收入。隨著Google 網路廣告年收入高達500 億美元,只要潛在的有效點擊預測每提高1%,等於意謂著每年就可為公司增加5 億美元的廣告收入存入銀行。難怪Google 是一個機器學習的超級大粉絲,而雅虎與其他網站業者正試著努力的急起直追。

網路廣告正是主流商業型態的一種表現形式。在每一個市場中,生產者和消費者需要在交易之前進行聯繫,才能促成一場交易的發生。在網際網路出現之前的年代,買賣雙方交易的主要障礙在於實體面,例如:你只能在當地書店購買書籍,而且你的當地書店會局限於有限的貨架空間。但是當你可以在任何時間下載任何一本書到你的電子閱讀器時,就變成了選擇過多的問題。你如何在一家書店,瀏覽書架上數百萬冊的銷售圖書呢?對於其他資訊產品,例如:影音視訊、音樂、新聞、推文(tweets)、部落格(blogs)、一般的舊式網頁等,也有相同的選擇問題。除此之外,對於一切可透過遠程採購的商品與服務也是如此,如鞋子、鮮花、小工具、飯店客房、補教、投資等。它甚至會反映到人們尋找工作或交友的選擇問題上。你們到底如何能在茫茫大海中找到彼此?這是一個網路世代天天面臨的問題,而機器學習就是解決這類方案的最佳選擇。

隨著公司的成長,職場員工也經歷三個階段。早期,公司處處都是用人工完成一切,一位小型家庭自營式商店老闆,會親自了解客戶,而且他們會訂購、展示,並推薦相對應的商品。這種經營型態還算不錯,但沒有規模。在第二階段,也是最不快樂的階段,公司的發展擴大到需要開始使用電腦,因此開始招聘軟體程式設計師、顧問和資料庫管理人員,編寫出數百萬行程式碼,將公司所有能被自動化的功能完全自動化。還有更多的人被服務,但卻未必服務得一樣好,決策的制定可說是基於粗糙的人口類別,而電腦程式過於生硬死板,以至於無法匹配人類無限可能的多樣性。

第三階段,企業進入起飛轉折點,由於傳統缺乏足夠的軟體程式設計師和顧問,以滿足所有的客戶需求,所以公司無可避免地轉向機器學習。亞馬遜為了靈活將所有客戶採購喜好媒合,編寫在電腦機器學習程式中;臉書也強化編寫一套機器學習程式,對每位社群會員傳遞最佳、最期待的喜好資訊。全球最大零售公司沃爾瑪(Walmart)銷售數以百萬計產品,每天提供客戶數十億種商品購買選擇。沃爾瑪的軟體程式設計師更是試著編寫一套機器學習程式,滿足所有客戶需要的功能。這些公司所做的,就是採用機器學習演算法,把他們堆積如山的巨量數據資料進行資料探勘分析,並讓機器學習演算法推測出客戶想要的東西。

機器學習演算法可以稱得上是最佳媒合者,它們可以媒合生產者和消費者彼此接觸,克服資訊過載的問題。如果機器學習足夠聰明的話,你就可以從兩方面蒙受其益:在大規模方面,擁有大量的選擇與低成本;在小規模方面,可以具備個人化的風格。雖然學習器仍不盡完美,而且制定決策的最後一步,通常還是需要由人類來做判斷,但學習器可以睿智地簡化選擇,讓事情能控制在一個人可以管理的範圍之內。

回顧過去,我們可以看到,從電腦到網際網路,再到機器學習,這個進展的過程是不可避免的:電腦促進了網際網路的發展,創造了大量的數據資料和無限選擇的問題;而機器學習利用了大量的數據資料,以幫助解決無限的選擇問題。網際網路本身無法從「一體適用」(one size fits all)的需求模式,轉變成種類無限繁多的長尾理論模式。美國最大的線上影音服務平臺Netflix,可能庫存了十萬部DVD 影音產品,但如果客戶不知道如何找到他們喜歡的影片,那麼他們將會預設選擇熱門電影排行榜上的影片。只有當Netflix 擁有一套機器學習演算法,以找出符合你的喜好,並推薦適當的DVD 影片時,這種長尾理論才能真正起飛。

一旦這種不可避免的選擇問題產生,機器學習演算法就會成為「中間人」(middlemen),選擇權力變成集中於機器學習演算法上。基本上,Google的演算法主要會決定「你會找出什麼樣的資訊」,亞馬遜的演算法則會決定「你會購買什麼樣的產品」,而線上交友紅娘網站Match.com 的演算法,會幫你排定「你跟誰約會」。當然所有事情的最後一哩,仍然就是你自己從演算法呈現給你的選項中做出選擇。不過機器學習演算法已經幫你做好99.9%的選擇了。如今一家公司的成功或失敗,取決於學習器有多喜歡它的產品,以及整體經濟的成功,即是否每個人能以最優惠的價格取得最好的產品,以滿足他們的需要,也取決於學習器有多好。

對一家公司來說,要確保學習器喜歡其產品的最好方法,就是實際執行這些演算法。而誰能擁有最好的演算法和最多的數據資料者,必然能勝出。一種新型態的網路效應開始成形;誰擁有最多的客戶、累積最多的數據資料、學會最好的模型,便能贏得最多的新客戶等,開創一種良性的循環;或如果你是一位競爭對手的話,就是一個惡性的循環。雖然從Google 搜尋引擎轉換使用微軟公司推出的Bing 網路搜尋引擎,可能會比從視窗作業系統(Windows)轉換使用麥金塔作業系統(Mac)更容易,但實際上你並不會這樣做,即使Bing 的網路搜尋技術也像Google 的一樣好,然而因為Google領先進入市場,擁有較大的市場占有率,而且比較知道你想要什麼。可惜的是,一個剛進入搜索引擎業界的新進入者,如何能在擁有超過10 年學習的搜尋引擎身後,從零資料開始,急起直追。

你可能會認為一段時間過後,更多的數據資料只會讓新舊兩個搜尋引擎之間越相似,但這種飽和點會是遙遙無期的,長尾效應也會一直持續下去。如果你看一下亞馬遜、Netflix 給你的相關推薦,很明顯,它們仍然十分簡略,而且Google 的搜索結果仍留有許多不足之處。每個產品的每個特點、每個網站的每項功能,都盡可能使用機器學習來加以改善。例如:一個網頁底部的連結,應該採用紅色還是藍色?試試這兩者,並且看看哪一種顏色能吸引最多使用者的點擊。所以更好的方法,是讓學習器持續保持運作執行,而且不斷調整網站的各個細節。

相同的情況也會發生在各產業市場中,往往那裡也有很多的選擇和大量的數據資料。這場機器學習競賽已正式展開,端看誰的學習速度最快便能勝出。它不會停止更透澈地了解客戶的需求,公司可以將機器學習應用在他們營運的每個層面上,提供可用的數據資料,並且讓數據資料從電腦、通訊設備,以及更加便宜且普遍的感測器等,不斷地蒐集進來。「數據資料是新的石油能源」,這衍然已成為一句經常出現的流行說詞,如同石油煉製一樣,精煉數據資料會是門大生意。與任何公司一樣深耕於企業界的電腦巨人IBM 公司,已經規劃了該公司的成長策略,專注為其企業客戶提供分析。

企業把數據資料視為一項策略資產——我自己有什麼數據資料,是我的競爭對手所沒有的?我該如何利用這些數據資料?什麼數據資料是我的競爭對手有,而我卻還沒有的?

同樣的方式;一家沒有資料庫的銀行,根本無法與擁有資料庫的銀行相競爭;一家沒有機器學習的公司,同樣無法跟上一家使用機器學習的公司。雖然第一家公司的專家編寫了一千條的規則,來預測公司的客戶想要什麼,但第二家公司的演算法已學習了數十億條的規則,這一整套的規則就是為了每一位個別的客戶需求。這就像是有關於矛與機關槍的直接對壘。機器學習是一項很酷的嶄新技術,但這並不是企業為何接受它的原因。企業之所以擁抱機器學習,是因為這是產業必然的競爭趨勢,企業早已別無選擇。

●本文摘自《大演算:機器學習的終極演算法將如何改變我們的未來,創造新紀元的文明?》

延伸閱讀:看更多【決戰AI世代】主題選書

作者簡介:佩德羅.多明戈斯(Pedro Domingos)

電腦工程博士,現任華盛頓大學電腦工程系教授,該系是全美前十大電腦工程名校。他初試啼聲聞名圈內是兩度在資料採礦大會上獲得最佳論文,並在此後成為該領域的意見領袖。他在專業領域內獲獎無數,還包含美國國家科學職業成就奬,他也是史丹佛大學及麻省理工學院客座教授。他最有名的功績是破解了一個在機器學習領域中長久以來的瓶頸,成功把機器學習、哲學與人工智慧結合起來。這個突破性的研究還曾經登上著名的《新科學人》(New Scientist)雜誌的封面故事。

讀.書.人


我們每個人都閱讀自身及周遭的世界,俾以稍得瞭解自我與所處。我們閱讀以求理解或啟迪。我們不得不閱讀。

《閱讀地圖——人為書癡狂的歷史》

追蹤閱讀 快加入讀書吧粉絲團!


分享給好友 加入udn

相關新聞

聽懂臨終絮語:了解親人最後的話語

2017/11/08

與生態地景對話何以成為藝術?

2017/11/02

北韓宮廷│最終被指定繼承者「金正恩」真相大公開!

2017/10/18

屍屍的愛,燒融在黎明之前。

2017/09/22

賴活不如好死,當被判定「無效醫療」你只有死路一條?!

2017/09/20

「沖繩靈魂」專賣店,全日本最小書店URARA

2017/09/15

《鬼的歷史》(一)中國末代皇帝溥儀也迷碟仙?

2017/09/14

「親善交流」盛行,戰敗後的日本慰安史

2017/09/11

三度偷渡重返敘利亞,直擊困守內戰的苦難

2017/09/07

為什麼會有「恐怖主義」?關於恐怖主義的誕生

2017/08/30

離鄉背井、克盡職守,終結二次大戰的原子城女孩

2017/08/16

他們為何逃離故鄉?關於戰爭與自由的代價

2017/08/01

拒絕真相的人:人類既有認知該如何融入科學新發現?

2017/07/31

在四季的海洋上,從小艇捕捉鯊魚的大冒險

2017/07/31

從近代史學者走向外交,揭開時代帷幕–—蔣廷黻

2017/07/31

西洋名畫中的「同性之愛」

2017/07/27

山中獨處的夜晚:面對死亡、恐懼、找回寧靜沉穩

2017/07/27

當愛與黑暗吞噬了他們——劉曉波的文學與人生

2017/07/27

為何公司連年虧損、卻還能替創辦人和投資人帶來鉅富?

2017/07/27

近代紳士的整容提案──「梳整頭髮、刮鬍、美容」之必要

2017/07/26

人類為何開始穿內褲——愈是隱藏,反而愈提高價值?

2017/07/18

面對暴權酷刑 劉曉波為何宣稱:「我沒有敵人」?

2017/07/15

留不住文化資產?老屋、古蹟總難逃「自燃」下場

2017/07/13

加薩女記者的日常:當記者被家人都瞧不起、示威沒戴頭巾被賞巴掌

2017/07/04

遇上她們,哲學家叔本華、尼采、蘇格拉底都沒轍!

2017/07/03

【迎戰AI時代】模仿人腦的人工智慧 兩者有何差異?

2017/06/28

【迎戰AI時代】機器人取代了你,你就被開除了!

2017/06/28

蘭心慧質美韶容:台灣近代「女學生」/「新女性」的誕生

2017/06/26

【迎戰AI時代】如果今日知識已經客體化、又何必集中在一個空間聽取?

2017/06/21

【迎戰AI時代】當數位給社會帶來第三次革命、「拇指世代」成為一種新人類

2017/06/19

【迎戰AI時代】世界的根本存在是什麼?萬物源於「訊息」

2017/06/16

【迎戰AI時代】越來越趨近於人類、人工智慧的各種「學習」模式

2017/06/16

【迎戰AI時代】機器學習的終極演算法 將如何改變我們的未來

2017/06/16

【迎戰AI時代】無所不在的演算法支配著你的生活、取代記憶

2017/06/16

【迎戰AI時代】AlphaGo打敗頂尖棋手,為何google選擇圍棋作為AI最前線?

2017/06/15

【迎戰AI時代】人工智慧的可怕,在於預測的精確度

2017/06/15

【迎戰AI時代】「人工智慧」征服人類,只是瘋狂科學家的劇本嗎?

2017/06/15

【迎戰AI時代】世紀初的經典人機大戰——會思考的電腦「華生」

2017/06/15

【迎戰AI時代】科幻成真,科學家預言機器人將具有自己的意識

2017/06/15

聖經譴責的是雞姦儀式,並非同性之間的愛情

2017/06/07

熱門文章

聽懂臨終絮語:了解親人最後的話語

2017/11/08

燈泡復活的瞬間,將我們化為一幅永垂不朽的畫作。

2017/11/15

蘇上豪/再一次心跳

2017/10/30

石芳瑜/善女良男

2017/11/20

台語的撇步:好朋友來開講

2017/10/25

孤寂的異鄉人──張愛玲美國四十年

2017/10/26

逞強或堅強?男人心事誰人知

2017/11/01

無以競爭,我輸在自己的年齡。

2017/10/26

而,我只是希望母親愛我。

2017/10/31

世界終究無法科幻。

2017/11/02

與生態地景對話何以成為藝術?

2017/11/02

商品推薦

贊助廣告

留言