索尼的新AI驾驶员在《Gran Turismo》中实现了“可靠的超人”比赛时间

   日期:2025-09-26     来源:本站    作者:admin    浏览:63    
核心提示:      从国际象棋到围棋再到扑克,人工智能代理已经在许多游戏中击败了人类。现在,这台机器可以在经典赛车视频游戏系列《

  

  

  从国际象棋到围棋再到扑克,人工智能代理已经在许多游戏中击败了人类。现在,这台机器可以在经典赛车视频游戏系列《gt赛车》中取得新的高分。

  索尼今天宣布,其研究人员已经开发出一款名为GT Sophy的人工智能司机,它是“可靠的超人”,能够在《Gran Turismo Sport》中连续几圈击败顶级人类司机。你可能认为这是一个简单的挑战。毕竟,赛车不就是速度和反应时间的问题,因此机器不容易掌握吗?但电子游戏赛车和人工智能领域的专家都表示,GT索菲的成功是一个重大突破,它显示出对战术和战略的精通。

  “如此熟练地超越人类司机……代表了人工智能的里程碑式成就。”

  斯坦福大学汽车教授j·克里斯蒂安·格德斯在科学杂志《自然》的一篇社论中写道:“在面对面的竞争中如此熟练地超越人类司机,是人工智能的一个里程碑式的成就。”“GT索菲在赛道上的成功表明,神经网络有朝一日可能在自动驾驶汽车的软件中发挥比现在更大的作用。”

  GT索菲是用一种被称为强化学习的方法进行训练的:本质上是一种试错法,人工智能代理被扔进一个没有指令的环境中,并在达到某些目标后得到奖励。在GT Sophy的例子中,索尼的研究人员表示,他们必须非常小心地设计这种“奖励功能”:例如,为了塑造一种足以获胜的驾驶风格,微调碰撞惩罚,但这不会导致AI简单地将其他赛车手赶出道路。

  通过强化学习,GT Sophy仅经过几个小时的训练就能在赛道上导航,并在“一两天内”比训练数据集中95%的车手更快。经过大约45000小时的训练,GT索菲能够在三条赛道上取得超人的成绩。(对于《Gran Turismo Sport》玩家来说,他们所讨论的赛道是Dragon Trail Seaside、Lago Maggiore GP和Circuit de la Sarthe。)

  在测试人工智能代理与人类的对抗时,一个常见的问题是,机器具有许多天生的优势,比如完美的记忆力和快速的反应时间。索尼的研究人员指出,与人类玩家相比,GT Sophy确实有一些优势,比如带有轨道边界坐标的精确路线地图,以及“关于每个轮胎的负载、每个轮胎的滑移角度和其他车辆状态的精确信息”。但是,他们说,他们解释了两个特别重要的因素:动作频率和反应时间。

  GT索菲的输入被限制在10赫兹,而人类输入的理论最大值为60赫兹。研究人员写道,这有时会导致人类驾驶员在高速行驶时表现出“更流畅的动作”。在反应时间方面,GT sophia能够在23-30毫秒内对游戏环境中的事件做出反应,这比专业运动员估计的200-250毫秒的最高反应时间要快得多。为了弥补这一点,研究人员增加了人工延迟,训练GT索菲的反应时间分别为100毫秒、200毫秒和250毫秒。但正如他们发现的那样:“这三种测试都达到了超人的单圈时间。”

  GT索菲与三位顶级电子竞技车手进行了测试:艾米丽·琼斯,瓦莱里奥·加洛和伊戈尔·弗拉加。尽管没有人能够在计时赛中击败AI,但他们的对抗赛让他们发现了新的战术。

  电子竞技车手艾米丽·琼斯(Emily Jones)在《自然》杂志上发表的一篇感言中说:“看到人工智能会走的路线真的很有趣,在某些弯道,我走得很宽,然后又往回走,而人工智能会绕着弯道走,所以我学到了很多关于路线的知识。”“例如,在进入第1个弯道时,我的刹车时间比AI晚,但AI会比我更快地退出,并先于我进入下一个弯道。直到我看到人工智能,我才注意到这一点,我想,‘好吧,我应该这样做。’”

  索尼表示,目前正致力于将GT Sophy整合到未来的《GT赛车》游戏中,但没有提供具体的时间表。

 
打赏
 
更多>同类文章

推荐图文
推荐文章
点击排行