據英國《自然》雜志9日發(fā)表的一項研究,一種人工智能(AI)在著名對戰(zhàn)賽車游戲《GT賽車》中戰(zhàn)勝了世界冠軍級玩家。這個AI在遵守賽車規(guī)則的同時展現出了超凡的行駛速度、操控能力和駕駛策略。研究結果將對自主導航以及基礎AI研究具有應用價值。
AI的許多潛在應用都需要一邊與人類交互,一邊在物理系統(tǒng)中做出實時決策,而賽車正是這類情況的典型代表。賽車手必須進行復雜的戰(zhàn)術性操控去超越或阻擋對手,同時還要以極限牽引力來駕駛賽車。以PlayStation的游戲《GT賽車》為代表的擬真類賽車游戲不僅能再現操控真實賽車的挑戰(zhàn),也對機器學習的應用提出了挑戰(zhàn)。
索尼AI科學家彼得·烏爾曼及其同事此次讓一個名為“GT Sophy”的AI智能體學會利用深度強化學習來玩《GT賽車》。他們訓練這個智能體掌握在賽車比賽中高效加速和剎車的藝術,并學習如何在不同情況下或在對手擋路時替換行駛路線。想要訓練出一個成功的AI,最大的挑戰(zhàn)之一是要確保它不會因為觸犯賽車規(guī)則而受罰,這里的賽車規(guī)則是一組由外部人類裁判判決的寬松規(guī)則。
最后,“GT Sophy”利用代表不同賽車挑戰(zhàn)的三組賽車與路線組合——包括時速超過300公里的賽車——在對戰(zhàn)比賽中成功擊敗了4位全球頂級電子競技賽車手。
以上結果是計算機戰(zhàn)勝最強人類對手的一項最新競技任務,其他競技任務還包括國際象棋和撲克。研究人員認為,這一結果不但讓賽車游戲變得更有意思,還能提供用來訓練職業(yè)賽車手和發(fā)現新賽車技巧的高水平比賽。這種方法還有望應用在真實世界的系統(tǒng)中,比如機器人、無人機和自動駕駛汽車。
總編輯圈點
賽車的目標是什么?人們總是很容易下定義:在更短時間里超過所有對手,你就贏了。但如果僅僅是這樣,一級方程式賽車不會被稱為現代運動里最鬼斧神工的工程學展示。賽車實際上是一場人類最大限度利用物理學進行的復雜戰(zhàn)斗和策略風暴,輪胎的摩擦力、過彎的速度、剎車的時間點……專業(yè)選手對賽車的精準操控,專業(yè)團隊每一步戰(zhàn)術的制定,正是人類身體和智慧的最佳發(fā)揮。作為一個AI,“GT Sophy”卻沒有運用物理顯式計算,它所用的是神經網絡模型學習,以及足夠的數據“修煉”自身,最終,在與人類冠軍的正面交鋒中,它一騎絕塵。