天堂va蜜桃一区二区三区,在线国产一区,性欧美videohd高精,免费成人av在线播放

   
 您當前的位置 : 體育新聞>體育快訊>

阿爾法首次復盤人機大戰  自評等級分遠超柯潔

海口網 http://www.taikongsh.cn 時間:2016-03-31 07:03

  “神之一手”的背后

  AlphaGo系統并非無懈可擊,但是,漏洞并不是所謂的模仿棋、打劫等等。它的漏洞體現在李世石贏得比賽的第四盤棋,AlphaGo取得巨大進步的價值模塊出現了瑕疵,這也是AlphaGo在5局棋中唯一的一次漏洞,也是唯一的一盤失利。

  在第四盤棋中,開局之后很快就幾陷絕境中的李世石,弈出了被來自中國的世界冠軍古力成為“神之一手”的白78手,凌空一挖。堅韌如山的對手突然倒下,AlphaGo變得不知所措,連續出現低級昏招,這也成就了AlphaGo有記載的公開的第一局失利。

  對于AlphaGo的異常表現,各路觀戰的職業高手充滿了猜測。即使是觀賽的哈薩比斯和席爾瓦也都不知道究竟發生了什么。

  事后的分析顯示,在李世石下出第78手之前,AlphaGo自有的勝率評估一直認為自己領先,評估的勝率高達70%。在第78手之后,AlphaGo評估的勝率急轉直下,被李世石遙遙領先,之后再也沒有縮短差距。

  為什么AlphaGo面對李世石的第78手表現如此差,是因為它沒有想到李世石的這手棋嗎?

  席爾瓦揭曉了這一秘密。AlphaGo的計算體系中,的確曾經評估過這手棋,只是在AlphaGo的評估中,李世石走那一子的概率大概是萬分之一,最終,它沒有想到李世石會這樣走,也就沒有計算李世石這樣走之后如何應對。

  賽后,獲勝的李世石則說,這一手在他看來是唯一的選擇。

  AlphaGo背后的蒙特卡洛樹搜索依賴的策略網絡,是根據人類對弈棋譜數據訓練出來的模型,它很難去預測白78手這樣的所謂手筋妙招,也就很難判斷基于這一步繼續往下搜索之后的勝負狀態。

  這就是AlphaGo在這5盤對局中表現出的唯一破綻,也是目前人類智慧還領先于AlphaGo背后的大數據驅動的通用人工智能(Data-driven Artificial General Intelligence)的地方。

  人工智能已然無敵?

  在此次大賽之前,多數來自職業圍棋界的棋手包括李世石自己都認為,李世石會輕松取勝。但是,DeepMind團隊卻信心滿滿。另一位DeepMind團隊的主力成員也曾經在UCL介紹AlphaGo的進展,在展望與李世石的比賽時,他曾就篤定地預言,AlphaGo會贏。

  當 有人問及從去年10月戰勝梵麾,到今年3月對陣李世石,半年時間當中, AlphaGo究竟有哪些方面的提升時,席爾瓦簡要回答說:“我們在系統的每一個模型上盡可能推進效果極致,尤其在價值網絡上獲得了很大的提升。訓練價值網絡的目標勝率除了通過自我對弈的結果外,我們還使用了搜索策略去盡可能逼近理論的勝率。”

  直觀地說,3月版本的AlphaGo比半年前的水平大概是讓4子——讓對方先占據4個星位!

  在戰勝李世石之后,中國、韓國、日本許多的職業棋手,包括李世石本人都希望能夠再與AlphaGo一戰。

  按照等級分排名,AlphaGo僅次于中國的世界冠軍柯潔,排名世界第二。而席爾瓦透露,AlphaGo的最新版本自我估分在4500左右,遠遠超出現在3600多的柯潔,實力水平大約在13段左右,人類選手中已然無敵!

  AlphaGo為什么會有這么強勁的表現?在講座當中,席爾瓦部分地復述和解釋了今年1月《Nature》上發表的論文,講述了人工智能的基本原理以及AlphaGo的技術框架。

  對于人工智能來說,圍棋游戲的難度在于,決策空間實在太大。決策(Decision Making)是人工智能的關鍵要素,使得機器能夠在人類的世界中發揮作用。

  在圍棋以及任何游戲中,一次決策往往使得游戲更新到了一個新的局面,于是影響到了接下來的決策,一直到最終游戲的勝負。人工智能的關鍵就是在決策空間中搜索達到最大效益的路徑,最終體現在當前決策中。

  圍棋棋盤上棋子可能的組合方式的數量就有10的170次方之多,超過宇宙原子總數。在近乎無窮的決策空間中,去暴力搜索出當前棋盤的下一步最優走子是絕對不可能的事情。

  AlphaGo的方案是在這樣的超級空間中,做到盡可能有效的路徑選擇。其思路是一個框架加兩個模塊:解決框架是蒙特卡洛樹搜索(MonteCarlo Tree Search),兩個模塊分別是策略網絡和價值網絡。

  策 略網絡(Policy Network)根據當前棋盤狀態決策下一步走子,是典型的人工智能決策問題。策略網絡搭建的第一步,基于KGS圍棋服務器上30萬張業余選手對弈棋譜的監督學習(SupervisedLearning),來判斷當前棋盤人類最可能的下一走子是什么。

  第二步,是利用監督學習得到的第一個策略網絡去通過自我對弈來訓練一個加強版的策略網絡,學習方法是強化學習(Reinforcement Learning),自我對弈3000萬局,從人類的走子策略中進一步提升。

  遵循策略網絡的判斷,在蒙特卡洛樹搜索框架下對每個棋盤狀態的采樣范圍就大大減小,這是一個搜索寬度的減小,但是由于一盤圍棋總手數可以多達250步以上,搜索的深度仍然帶來無法處理的巨大計算量,而這就由第二個模塊——價值網絡來解決。

  價值網絡(Value Network)的功能是根據當前棋盤狀態判斷黑白子某一方的勝率,是一個人工智能預測(Prediction)問題。

  處理預測問題的機器學習模型一般需要直接知道需要預測的真實目標是什么,比如預測第二天的天氣,或者預測用戶是否會一周內購買某個商品,這些歷史數據都有直接的目標數據可供機器學習。而在圍棋對局中,給定的一盤棋局完全可能在歷史上就找不到哪次對弈出現過這樣的局面,也就不能直接得到對弈最終的勝負結果。

  AlphaGo的解決方法是使用強化學習得到的策略網絡,以該棋局為起點進行大量自我對弈,并把最終的勝率記錄下來作為價值網絡學習的目標。

  有了價值網絡,蒙特卡洛樹搜索也就不再需要一直采樣到對弈的最后,而是在適當的搜索深度停下來,直接用價值網絡估計當前勝率。這樣就通過降低搜索的深度來大大減小了運算量。

  AlphaGo整合了目前機器學習領域的大多數有效的學習模型,包括通過采樣來逼近最優解的蒙特卡洛樹搜索,通過有監督學習和強化學習訓練來降低搜索寬度并作出走子決策的策略網絡,以及通過有監督學習訓練的降低搜索深度提前判斷勝率的價值網絡。?

  作為人類棋手翹楚,33歲的職業圍棋九段高手李世石,過去15年獲得了十幾個世界冠軍頭銜,總共下了1萬盤圍棋對弈,經過了3萬個小時訓練,每秒可以搜索10個走子可能。

  但是,作為人工智能科技進步的代表,吸收了近期機器學習人工智能的最新進展,建立起了全新的價值網絡和策略網絡,誕生只有兩年時間的AlphaGo,差不多經歷了3萬小時的訓練,每秒卻可以搜索10萬個走子可能。這一刻,勝負已分。

相關鏈接:
李開復:阿爾法跌破眼鏡 期待挑戰中國棋手
阿爾法機器人來海口了!能歌善舞還能做高難度動作
聶衛平:阿爾法狗后不敢再預測 四川能贏CBA很刺激
[來源:新浪體育] [作者:] [編輯:符德銘]
版權聲明:

·凡注明來源為“海口網”的所有文字、圖片、音視頻、美術設計等作品,版權均屬海口網所有。未經本網書面授權,不得進行一切形式的下載、轉載或建立鏡像。

·凡注明為其它來源的信息,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。

?
圖解海口一周熱聞:海口日報海口網入駐“新京號”
圖解海口一周熱聞|多彩節目,點亮繽紛假期!
圖解海口一周熱聞:海口新年音樂會將于2024年1月1日舉辦
圖解海口一周熱聞:海口招才引智專場誠意攬才受熱捧
圖解海口一周熱聞:海口獲評國家食品安全示范城市
災后重建看變化·復工復產
圓滿中秋
勇立潮頭踏浪行
“發現海口之美”攝影大賽
     
     
     
排行
 
旅客注意!海口美蘭機場T2值機柜臺17日起調整
尋舊日時光 海口部分年輕人熱衷“淘”老物件
海口:云洞襯晚霞 美景入眼中
嗨游活力海口 樂享多彩假日
海口:城市升騰煙火氣 夜間消費活力足
海口:長假不停歇 工地建設忙
市民游客在海口度過美好假期
2023“海口杯”帆船賽(精英賽)活力開賽
海口天空之山驛站:晚照醉人
千年福地尋玉兔 共慶海口最中秋
 
|
|
 
     www.taikongsh.cn All Rights Reserved      
海口網版權所有 未經書面許可不得復制或轉載
互聯網新聞信息服務許可證:46120210010
違法和不良信息舉報電話: 0898—66822333  舉報郵箱:jb66822333@163.com

網絡內容從業人員違法違規行為舉報郵箱:jb66822333@126.com

瓊公網安備 46010602000160號

  瓊ICP備2023008284號-1
中國互聯網舉報中心
国产精品久久久久9999赢消| 亚洲精品国产精品粉嫩| 亚洲天堂激情| 国产精品18| 日韩在线短视频| 精品视频免费在线观看| 国产精品极品国产中出| 日韩国产欧美视频| 男男成人高潮片免费网站| 鲁大师精品99久久久| 最新国产精品| 青草综合视频| 日韩中文字幕av电影| 99成人在线视频| 精品国产亚洲一区二区在线观看| 日韩精品成人一区二区在线| 日韩成人免费| 最新亚洲激情| 91精品国偷自产在线电影| 欧美女优在线视频| 日韩精品高清不卡| 日本精品在线一区| 视频在线观看一区| 天天天综合网| 欧美偷窥清纯综合图区| 日韩在线影视| 95精品视频| 日日夜夜精品视频天天综合网| 麻豆蜜桃在线观看| 一本色道久久| 波多野结衣一区| 老司机精品视频在线播放| 日韩精品1区2区3区| 久久久亚洲欧洲日产| 九九热这里有精品| 日韩欧美另类一区二区| 免费高清不卡av| 伊人久久大香线蕉综合热线| 99久久99久久精品国产片桃花| 精品中文字幕一区二区三区四区| 亚洲图片小说区| 日韩高清不卡一区二区三区| 国模一区二区| 国产不卡123| 蜜臀国产一区二区三区在线播放| a91a精品视频在线观看| 午夜精品网站| 欧美特黄一区| 狠狠综合久久| 午夜国产精品视频免费体验区| 波多野结衣在线播放一区| 国产一区清纯| 欧美色就是色| 午夜影院欧美| 波多野结衣一区| 一区在线视频观看| 亚洲专区在线| 美女精品一区| 日韩综合网站| 日韩中文欧美| 国产69精品久久| 欧美一区国产在线| 日本视频免费一区| 国产精品va视频| 亚洲区小说区图片区qvod按摩| 国产探花一区| 99久久免费精品国产72精品九九| 北条麻妃一区二区三区在线| 成人免费电影网址| 亚洲国产综合在线看不卡| 51精产品一区一区三区| 国产精品乱看| 黄色亚洲网站| 久久精品国产99| 你懂的成人av| 久久99成人| 久久久亚洲人| 国产手机视频一区二区| 欧美国产小视频| 日韩高清不卡| 亚洲综合婷婷| 久久综合色占| 日韩成人视屏| 999国产精品永久免费视频app| 亚洲不卡av不卡一区二区| 天天躁日日躁狠狠躁欧美| 国产精品99一区二区| 午夜电影亚洲| 国产毛片久久| 免费成人你懂的| 91影院成人| 日韩视频在线观看| 久久精品xxxxx| 麻豆成人在线观看| 国产一卡不卡| 精品国产麻豆| 啪啪国产精品| 婷婷六月综合| 人人狠狠综合久久亚洲| 日韩精品dvd| 韩国女主播一区二区| 国产欧美日韩一区二区三区在线| 影音先锋中文字幕一区| 亚洲综合激情在线| 欧美福利在线播放网址导航| 视频一区中文| 免费在线观看视频一区| 91久久久久久白丝白浆欲热蜜臀| 欧美91在线|欧美| 中文成人在线| 免费观看性欧美大片无片| 婷婷综合五月| 在线看片国产福利你懂的| 国产精品一国产精品k频道56| 老司机免费视频一区二区| 亚洲色图丝袜| 亚洲第一网站| 亚洲欧美春色| 美女视频黄 久久| 亚洲人和日本人hd| 亚洲高清毛片| 亚洲欧美小说色综合小说一区| 欧美一区国产在线| 精品中文视频| 久久精品影视| 日韩一区二区三区在线免费观看| 在线国产日韩| 国产精品xxxav免费视频| 黄色日韩在线| 先锋欧美三级| 亚洲品质自拍| 激情欧美一区二区三区| 欧美久久久网站| 亚洲涩涩av| 99国产精品99久久久久久粉嫩| 亚州精品国产| 日韩精品91亚洲二区在线观看| 色哟哟精品丝袜一区二区| 色综合桃花网| 国产精品久久免费视频| 91精品亚洲| 精品日韩视频| 五月综合久久| 精品91久久久久| 亚洲人人精品| 久久亚洲精品中文字幕蜜潮电影| 四虎成人精品永久免费av九九| 日韩国产欧美三级| 日本国产精品| 亚洲少妇视频| 国产在线不卡一区二区三区| 99成人精品| 影音先锋久久久| 天天av综合| 日本不卡一二三区黄网| 99久久久久| 免费在线成人| 久久久9色精品国产一区二区三区| 另类专区亚洲| 亚洲人成伊人成综合图片| www.九色在线| 日韩不卡一二三区| 久久性色av| 欧洲精品99毛片免费高清观看 | 91精品福利观看| 成人av动漫在线观看| 天堂av在线网| 色天天色综合| 久久亚洲精品中文字幕| 久久五月天小说| 亚洲视频二区| 在线日本制服中文欧美| 99九九久久| 自拍日韩欧美| 成人在线啊v| 老司机一区二区三区| 国产激情精品一区二区三区| 国产精品视区| 日韩成人动漫在线观看| 91日韩欧美| 成人另类视频| 久久精品国产在热久久| 国产一区观看| 综合欧美精品| 黄色成人av网站| 免费在线成人| 图片小说视频色综合| 午夜欧洲一区| 日韩成人高清| 亚洲一级一区| 国产精品亚洲一区二区在线观看| 中国字幕a在线看韩国电影| 一区二区免费| 国产欧美日韩综合一区在线播放 | 午夜欧美巨大性欧美巨大| 美女视频免费精品| 亚洲色图二区| 四季av在线一区二区三区| 久久精品免视看国产成人| 一区二区精品|