Close Menu
  • 首页
  • Web3
  • 政策
    • 审查
    • 法规
    • 交流
    • 隐私
    • 法律
  • Macro
  • Layer2
  • 比特币
    • NFTs
    • DeFi
    • 稳定币
    • 狗狗币
    • 以太坊
  • AI
  • 银行业
  • 游戏
  • 破产
  • 全部文章
热门内容

狗狗币与XRP下跌严重:底部在哪里?

2025年8月21日

比特币算力和挖矿难度飙升,手续费下降:BlocksBridge

2025年8月21日

塔吉克斯坦和哈萨克斯坦非法比特币挖矿现象上升

2025年8月21日
Facebook X (Twitter) Instagram
X (Twitter) Telegram
加密专场
Subscribe
  • 首页
  • Web3
  • 政策
    • 审查
    • 法规
    • 交流
    • 隐私
    • 法律
  • Macro
  • Layer2
  • 比特币
    • NFTs
    • DeFi
    • 稳定币
    • 狗狗币
    • 以太坊
  • AI
  • 银行业
  • 游戏
  • 破产
  • 全部文章
加密专场
首页 » 放松,你在玩《毁灭战士》方面仍然优于人工智能
AI

放松,你在玩《毁灭战士》方面仍然优于人工智能

By admin2025年4月26日没有评论1 Min Read
放松,你在玩《毁灭战士》方面仍然优于人工智能
放松,你在玩《毁灭战士》方面仍然优于人工智能
Share
Facebook Twitter LinkedIn Pinterest Email Copy Link

尽管围绕人工智能的讨论不断,甚至最先进的视觉语言模型——GPT-4o、Claude Sonnet 3.7 和 Gemini 2.5 Pro——在应对一个长达数十年的挑战时仍然举步维艰:玩经典的第一人称射击游戏《毁灭战士》。

本周四,一个新的研究项目推出了VideoGameBench,这是一个旨在测试最先进的视觉语言模型是否能够仅通过屏幕上看到的内容来玩并击败20款热门视频游戏的AI基准测试。

研究人员表示:“根据我们的经验,目前最先进的视觉语言模型在玩视频游戏时面临显著的困难,因为推理延迟较高。当一个代理截取屏幕截图并询问视觉语言模型该采取什么行动时,等到回应回来时,游戏状态已经发生了重大变化,行动不再相关。”

研究人员指出,他们选择经典的Game Boy和MS-DOS游戏是因为它们的视觉效果更简单且输入方式多样,如鼠标和键盘或游戏控制器,这样更能测试视觉语言模型的空间推理能力,而不是基于文本的游戏。

VideoGameBench由计算机科学家和AI研究员Alex Zhang开发。该游戏套件包括《魔兽争霸 II》、《帝国时代》和《波斯王子》等经典游戏。

研究人员表示,延迟响应在《毁灭战士》等第一人称射击游戏中问题最为严重。在这些快节奏的环境中,屏幕截图中可见的敌人可能在模型采取行动时已经移动——甚至已经到达玩家身旁。

对于软件开发者而言,《毁灭战士》长期以来一直作为游戏环境中技术能力的检验标准。割草机、比特币甚至人类肠道细菌都以不同的成功程度面对来自地狱的恶魔。现在轮到AI了。

麻省理工学院生物技术研究员Lauren Ramlan曾对Decrypt表示:“将《毁灭战士》从90年代的阴影中带入现代光明的,不是它引人入胜的游戏玩法,而是其吸引人的计算设计。基于id Tech 1引擎,这款游戏的设计只需最简单的设置即可进行游戏。”

除了在理解游戏环境方面存在困难外,这些模型通常还未能执行基本的游戏内动作。

研究人员表示:“我们观察到代理在理解其动作——例如向右移动——如何在屏幕上转化时经常遇到困难。我们测试的所有前沿模型中,最一致的失败是无法在《文明》和《魔兽争霸 II》这类游戏中可靠地控制鼠标,而在这些游戏中,精确和频繁的鼠标移动是至关重要的。”

为了更好地理解当前AI系统的局限性,VideoGameBench强调在动态和复杂的环境中评估其推理能力的重要性。

他们表示:“与未解决的数学证明和奥林匹克级数学问题等极其复杂的领域不同,玩视频游戏并不是超人类的推理任务,但模型仍然很难解决这些问题。”

编辑:Andrew Hayward

Share. Facebook Twitter Pinterest LinkedIn Tumblr Email Copy Link

Related Posts

经过数月的猜测,OpenAI终于发布了GPT-5

2025年8月15日

立法者呼吁对中国DeepSeek进行国家安全和数据风险调查

2025年8月13日

苹果公司在美国再投资1000亿美元,寻求人工智能转型

2025年8月10日

OpenAI的新模型“防越狱”功能?首日即被破解

2025年8月9日

埃隆·马斯克的xAI工具制作了泰勒·斯威夫特的裸体深度伪造视频,绕过了自身规则。

2025年8月8日

Cloudflare指控Perplexity AI使用隐秘爬虫绕过网站封锁

2025年8月7日
Add A Comment
Leave A Reply Cancel Reply

最新文章

狗狗币与XRP下跌严重:底部在哪里?

2025年8月21日

比特币算力和挖矿难度飙升,手续费下降:BlocksBridge

2025年8月21日

塔吉克斯坦和哈萨克斯坦非法比特币挖矿现象上升

2025年8月21日

尽管近期回调,Cardano和XRP鲸鱼活动达到数月以来的高点

2025年8月20日
保持联系
  • Facebook
  • Twitter
  • Pinterest
  • Instagram
  • YouTube
  • Vimeo
别错过

狗狗币与XRP下跌严重:底部在哪里?

2025年8月21日

加密市场继续下滑,从火热的七月中降温比特币当然是引领潮流,今天再次下跌,创下近三周低点。但今天两种主要加密货币的表现尤其糟糕:狗狗币和XRP。总市值今天暴跌3.4%,降至低于3.9万亿美元,仅在数周前…

比特币算力和挖矿难度飙升,手续费下降:BlocksBridge

2025年8月21日

塔吉克斯坦和哈萨克斯坦非法比特币挖矿现象上升

2025年8月21日
网站简介

加密专场

发现加密专场,一个引领您进入加密货币领域的门户网站。从最新的加密货币新闻到深度分析,我们为您提供全面的覆盖,帮助您了解加密货币的世界。

X (Twitter) Telegram
我们的精选

狗狗币与XRP下跌严重:底部在哪里?

2025年8月21日

比特币算力和挖矿难度飙升,手续费下降:BlocksBridge

2025年8月21日

塔吉克斯坦和哈萨克斯坦非法比特币挖矿现象上升

2025年8月21日
最受欢迎

四分之一的比特币投资者处于亏损状态,BTC价格滞涨:CrypoQuant

2025年4月12日

Oyster Labs:TON 生态 Web3 原生智能手机 Universal Phone 第一轮预售已结束

2023年7月4日

Hashdex提出申请推出以太坊和比特币双重ETF

2023年1月1日
©Copyright 2024 加密专场 版权所有.
  • 首页
  • Web3
  • 政策
    • 审查
    • 法规
    • 交流
    • 隐私
    • 法律
  • Macro
  • Layer2
  • 比特币
    • NFTs
    • DeFi
    • 稳定币
    • 狗狗币
    • 以太坊
  • AI
  • 银行业
  • 游戏
  • 破产
  • 全部文章

Type above and press Enter to search. Press Esc to cancel.