亚洲日韩久久|国偷自产一区二区三区蜜臀国|国产一区二区日韩|99热这里只亚洲无码,无码

浙江大學(xué)人工智能專家:麻將AI和阿爾法狗類似,有助于解決實(shí)際問(wèn)題

日期:2020-04-13 來(lái)源:錢江晚報(bào)閱讀:551
核心提示:浙江大學(xué)人工智能專家:麻將AI和阿爾法狗類似,有助于解決實(shí)際問(wèn)題
   從最早的AI在國(guó)際象棋中戰(zhàn)勝人類開(kāi)始,AI先后攻克了中國(guó)象棋、德州撲克、圍棋、DOTA、星際爭(zhēng)霸等多種游戲,為什么AI研究者都喜歡挑戰(zhàn)游戲領(lǐng)域呢?
 
  在去年的世界人工智能大會(huì)上,時(shí)任微軟全球副總裁沈向洋表示,游戲一直是人工智能研究的最佳試驗(yàn)田,訓(xùn)練游戲AI的過(guò)程可以不斷提升人工智能的算法和人工智能處理復(fù)雜問(wèn)題的能力。在現(xiàn)實(shí)世界中,金融市場(chǎng)預(yù)測(cè)、物流優(yōu)化等很多問(wèn)題與麻將游戲有著相同的特點(diǎn),包括復(fù)雜的操作/獎(jiǎng)勵(lì)規(guī)則、信息的不完全性等等。
  微軟全球副總裁沈向洋
 
  那么這次戰(zhàn)勝人類的麻將AI的出現(xiàn)有什么意義呢?記者采訪了浙江大學(xué)人工智能研究所所長(zhǎng)吳飛。他告訴記者,很多AI的研發(fā)都是針對(duì)某個(gè)領(lǐng)域或某個(gè)具體任務(wù)進(jìn)行的研究,這些AI的誕生的目的當(dāng)然不僅僅在某個(gè)游戲勝過(guò)人類這么簡(jiǎn)單,都是為了應(yīng)用到我們實(shí)際生活中去。
 
  吳飛告訴記者:“微軟這款麻將AI所采取的策略其實(shí)和圍棋當(dāng)中的Alphago是類似的,框架還是基于強(qiáng)化學(xué)習(xí)、深度學(xué)習(xí)和蒙特卡洛樹(shù)搜索。只不過(guò)它是針對(duì)麻將這個(gè)具體問(wèn)題進(jìn)行優(yōu)化,如針對(duì)麻將中不同出牌的策略專門進(jìn)行學(xué)習(xí)。圍棋的難主要體現(xiàn)在狀態(tài)空間非常復(fù)雜,它是19×19 的棋盤上每一個(gè)位置都有“黑、白、無(wú)”三種狀態(tài),這樣的復(fù)雜度差不多是10的172次方。在完美信息下只要算力足夠,就能通過(guò)搜索采樣的方式找到最優(yōu)的策略,AlphaGo就是利用蒙特卡洛樹(shù)搜索和深度強(qiáng)化學(xué)習(xí),成功解決了這一難題。而麻將這種屬于不完全信息,有個(gè)序貫決策問(wèn)題,它雖然所需要探索的空間相比圍棋要小,但是序貫決策問(wèn)題難在你的每一步對(duì)后續(xù)產(chǎn)生的結(jié)果都是未知的。”
  浙江大學(xué)人工智能研究所所長(zhǎng)吳飛
 
  在吳飛看來(lái),不論是圍棋還是麻將,現(xiàn)有的規(guī)則和標(biāo)準(zhǔn)都是可以用機(jī)器語(yǔ)言描述出來(lái)的,屬于“大數(shù)據(jù)小任務(wù)”,因此只要有足夠多的數(shù)據(jù)的支撐,加上在該特定領(lǐng)域內(nèi)強(qiáng)化學(xué)習(xí)和深度學(xué)習(xí),AI戰(zhàn)勝人類在大部分棋牌類游戲中都是可以實(shí)現(xiàn)的,但這不代表現(xiàn)在的AI就比人類厲害了,因?yàn)槿祟愋袨槭?ldquo;小數(shù)據(jù)大任務(wù)”,不只是單一問(wèn)題的集合,實(shí)際的應(yīng)用場(chǎng)景比游戲要復(fù)雜的多。
 
  “比如現(xiàn)在大家關(guān)注度比較高的自動(dòng)駕駛、城市大腦,這些場(chǎng)景更加復(fù)雜,沒(méi)有足夠多的數(shù)據(jù),也沒(méi)有足夠準(zhǔn)確的機(jī)器語(yǔ)言去描述,因此目前的人工智能在實(shí)際使用中還很局限。不過(guò)這類AI的出現(xiàn)對(duì)我們解決序貫決策問(wèn)題還是很有幫助的,比如對(duì)經(jīng)濟(jì)活動(dòng)的調(diào)整的預(yù)測(cè)和分析,來(lái)幫助經(jīng)營(yíng)者作出更好的決策;在交通、物流領(lǐng)域進(jìn)行效率優(yōu)化,降低成本提高收益等。”
打賞
聯(lián)系客服 投訴反饋  頂部