?
中國(guó)科商網(wǎng)
人工智能控制器新實(shí)驗(yàn)成果或?qū)⑻岣呷詣?dòng)環(huán)境監(jiān)測(cè)成為現(xiàn)實(shí)的可能性
發(fā)布日期: 2020-12-04 11:13:42 來(lái)源: 中國(guó)新聞網(wǎng)

國(guó)際著名學(xué)術(shù)期刊《自然》最新發(fā)表一篇計(jì)算機(jī)科學(xué)研究論文稱,一種人工智能控制器能讓平流層的氣球一連數(shù)周待在原地,這一研究結(jié)果代表深度強(qiáng)化學(xué)習(xí)向現(xiàn)實(shí)世界應(yīng)用邁進(jìn)了重要的一步,將提高全自動(dòng)環(huán)境監(jiān)測(cè)成為現(xiàn)實(shí)的可能性。

該論文指,填充氦氣的“超壓”氣球常被用來(lái)在高層大氣開展實(shí)驗(yàn),比如氣象監(jiān)測(cè),如果被風(fēng)吹偏了航道,它們就要返回駐點(diǎn)。深度強(qiáng)化學(xué)習(xí)可以訓(xùn)練人工智能系統(tǒng)進(jìn)行決策,對(duì)于超壓氣球來(lái)說(shuō),這些決策包括采取哪些行動(dòng)來(lái)保持它們的位置不變。

論文通訊作者、加拿大蒙特利爾谷歌研究院馬克·貝勒馬爾(Marc Bellemare)和同事訓(xùn)練了一種人工智能控制器,這種控制器能根據(jù)風(fēng)的歷史記錄、預(yù)報(bào)、局地風(fēng)觀測(cè)和其他因素(如氦氣損失和電池疲勞),決定是否要移動(dòng)氣球。研究者利用一種數(shù)據(jù)增強(qiáng)算法來(lái)解釋數(shù)據(jù)中的空白,他們將這種命名為StationSeeker的技術(shù)應(yīng)用到分布在全球各地的Loon氣球上,包括一項(xiàng)在太平洋上空進(jìn)行的為期39天的受控實(shí)驗(yàn)。實(shí)驗(yàn)顯示,受到StationSeeker控制的氣球能成功實(shí)現(xiàn)自主導(dǎo)航,一旦被吹偏航道,它們能比傳統(tǒng)控制器控制的氣球更快地回到駐點(diǎn)。

英國(guó)牛津大學(xué)斯科特·奧斯普瑞(Scott Osprey)在《自然》同時(shí)發(fā)表的“新聞與觀點(diǎn)”文章中表示,深度強(qiáng)化學(xué)習(xí)的應(yīng)用此前已在受控環(huán)境(如電腦游戲)中得到演示,其受控環(huán)境擁有完整的數(shù)據(jù)集和明確定義的參數(shù)。但現(xiàn)實(shí)世界的可預(yù)測(cè)性更差,比如關(guān)于環(huán)境中風(fēng)的數(shù)據(jù)就不完整,因而很難采取最優(yōu)調(diào)整,讓氣球保持在原位。因此,馬克·貝勒馬爾和同事的研究成果代表了增強(qiáng)學(xué)習(xí)在現(xiàn)實(shí)世界應(yīng)用的一次巨大進(jìn)步。

關(guān)鍵詞: 智能

相關(guān)內(nèi)容

?