DeeCamp学员创新性地使用了多模型融合的斗地主AI-互联网最新资讯
点击关闭
您现在的位置泸溪新闻网首页>>国际新闻>>正文

游戏展示-DeeCamp学员创新性地使用了多模型融合的斗地主AI

韩天宇夺冠

該項目組組長張天昊同學說道:「相較於斗地主界『龍頭老大』騰訊使用監督學習做牌型預測,並且基於牌型預測做策略搜索,我們加入了博弈論的思想,使用了CFR模型;同時使用強化學習,在試錯與探索的過程中,學會斗地主策略;還用了多模型融合的思想,將多個模型的優點結合起來,方案具有擴展性。」

雖然斗地主這個牌類遊戲十分接地氣,但從AI的角度需要解決不完美信息下博弈問題,換句話說,要在無法看見其他玩家手牌的前提下,對遊戲中的14種合法牌型、13551種合法出牌、10的30次方的狀態空間和10的85次方的遊戲樹進行全面考慮。

據了解,當人類與人類對戰時,人類作為地主的勝率為52.4%、作為農民的勝率為47.8%;而該項目小組研發的AI在與人類進行對戰時,AI作為地主的勝率為58.6%、作為農民的勝率為41%。

創新工場首席執行官李開復則說道:「當下AI正在進入AI+、去賦能傳統行業的時代,是AI開花結果的最好時期,這個階段將會釋放大量的商業機會和人才成長機會,是一個千載難逢的好時代。」

四周的時間里,南京大學教授周志華教授、港科大教授張潼擔任科學總顧問,李開復領銜來自華為、曠視、科大訊飛、Google等頂尖公司的產業導師。

目前,業內對這一問題普遍採用規則模型+搜索的方式,DeeCamp學員創新性地使用了多模型融合的斗地主AI,可謂是從「專家中挑選專家」。

項目團隊並未一味追求勝率,而是通過調試做到一個和人類玩家相似的勝率結果,屬於陪玩性質。

8月16日,2019 DeeCamp人工智能訓練營在北京中國科學院大學雁棲湖校區舉辦成果展示暨結營儀式。6個項目小組作為代表在現場展示了自己Demo成果,由學術及產業導師現場予以點評。

經過4周的密集訓練,600名來自國內外的大學生接受了來自李開復、張潼、周志華、吳恩達等人工智能大牛導師的「學術+產業」課程培訓。相比起普通的校內課程,該訓練營中的學生共計完成了由22家企業發起的50個AI實踐課題,可以說具備一定用AI解決真實世界問題的能力。

其中,斗地主AI被評為「最突破」項目。從國際象棋到圍棋到德撲、電競,遊戲一直具有很高的AI水平表現力。

據了解, DeeCamp人工智能訓練營由創新工場在2017年首次發起,2018年被被教育部選中作為「中國高校人工智能人才國際培養計劃」兩個組成部分之一的學生培訓營。

结营仪式现场

今年的DeeCamp包括2次學術課程、18次產業課程、50個實踐課題,知識課程圍繞機器學習、自然語言處理、計算機視覺、機械人與自動化、自動駕駛5個全球最熱的AI研究方向展開,實踐課題涵蓋金融、零售、醫療健康、教育、公益、移動互聯網6大領域。

寵物健康狀態評價AI則被評選為「最實用」項目,利用計算機視覺和機器學習技術幫助寵物主人尤其是新手「一拍」隨時隨地了解自己寵物的健康狀態

具體來看,這個項目攻堅的技術堡壘可以被分解為狗體檢測、品種識別、年齡分類、體型度量,解決了體型標籤幾乎無法獲得、不同品種狗的肥胖標準不同、多隻狗的照片難以識別等技術難點。

現場展現的項目還包括「AI識別車輛損傷」、「AI金融風控」、「3D醫學影像診斷」、 「定雨神針:提高降水預報時空準確度」、「用人工智能構建一帶一路相關項目的知識圖譜」等,兼顧產業需求與社會意義。

中國科學院大學校長助理、經濟與管理學院執行院長、創新創業學院院長董紀昌在結營儀式上表示,本屆DeeCamp人工智能訓練營的成功舉辦是在前沿科學與創新創業領域校企合作的一個典型實踐,未來將會深化合作。希望學員們充分認識到科技創新帶來的必然發展,抓住時代的機遇。

今日关键词:世俱杯天津女排垫底