Close Menu
  • 首页
  • Web3
  • 政策
    • 审查
    • 法规
    • 交流
    • 隐私
    • 法律
  • Macro
  • Layer2
  • 比特币
    • NFTs
    • DeFi
    • 稳定币
    • 狗狗币
    • 以太坊
  • AI
  • 银行业
  • 游戏
  • 破产
  • 全部文章
热门内容

尤文图斯交易推动加密货币交易所WhiteBIT的代币达到历史最高价

2025年6月19日

Kraken的以太坊二层网络Ink Network即将推出代币

2025年6月19日

埃里克·特朗普否认参与Tron纳斯达克交易,尽管担任董事职务

2025年6月19日
Facebook X (Twitter) Instagram
X (Twitter) Telegram
加密专场
Subscribe
  • 首页
  • Web3
  • 政策
    • 审查
    • 法规
    • 交流
    • 隐私
    • 法律
  • Macro
  • Layer2
  • 比特币
    • NFTs
    • DeFi
    • 稳定币
    • 狗狗币
    • 以太坊
  • AI
  • 银行业
  • 游戏
  • 破产
  • 全部文章
加密专场
首页 » 放松,你在玩《毁灭战士》方面仍然优于人工智能
AI

放松,你在玩《毁灭战士》方面仍然优于人工智能

By admin2025年4月26日没有评论1 Min Read
放松,你在玩《毁灭战士》方面仍然优于人工智能
放松,你在玩《毁灭战士》方面仍然优于人工智能
Share
Facebook Twitter LinkedIn Pinterest Email Copy Link

尽管围绕人工智能的讨论不断,甚至最先进的视觉语言模型——GPT-4o、Claude Sonnet 3.7 和 Gemini 2.5 Pro——在应对一个长达数十年的挑战时仍然举步维艰:玩经典的第一人称射击游戏《毁灭战士》。

本周四,一个新的研究项目推出了VideoGameBench,这是一个旨在测试最先进的视觉语言模型是否能够仅通过屏幕上看到的内容来玩并击败20款热门视频游戏的AI基准测试。

研究人员表示:“根据我们的经验,目前最先进的视觉语言模型在玩视频游戏时面临显著的困难,因为推理延迟较高。当一个代理截取屏幕截图并询问视觉语言模型该采取什么行动时,等到回应回来时,游戏状态已经发生了重大变化,行动不再相关。”

研究人员指出,他们选择经典的Game Boy和MS-DOS游戏是因为它们的视觉效果更简单且输入方式多样,如鼠标和键盘或游戏控制器,这样更能测试视觉语言模型的空间推理能力,而不是基于文本的游戏。

VideoGameBench由计算机科学家和AI研究员Alex Zhang开发。该游戏套件包括《魔兽争霸 II》、《帝国时代》和《波斯王子》等经典游戏。

研究人员表示,延迟响应在《毁灭战士》等第一人称射击游戏中问题最为严重。在这些快节奏的环境中,屏幕截图中可见的敌人可能在模型采取行动时已经移动——甚至已经到达玩家身旁。

对于软件开发者而言,《毁灭战士》长期以来一直作为游戏环境中技术能力的检验标准。割草机、比特币甚至人类肠道细菌都以不同的成功程度面对来自地狱的恶魔。现在轮到AI了。

麻省理工学院生物技术研究员Lauren Ramlan曾对Decrypt表示:“将《毁灭战士》从90年代的阴影中带入现代光明的,不是它引人入胜的游戏玩法,而是其吸引人的计算设计。基于id Tech 1引擎,这款游戏的设计只需最简单的设置即可进行游戏。”

除了在理解游戏环境方面存在困难外,这些模型通常还未能执行基本的游戏内动作。

研究人员表示:“我们观察到代理在理解其动作——例如向右移动——如何在屏幕上转化时经常遇到困难。我们测试的所有前沿模型中,最一致的失败是无法在《文明》和《魔兽争霸 II》这类游戏中可靠地控制鼠标,而在这些游戏中,精确和频繁的鼠标移动是至关重要的。”

为了更好地理解当前AI系统的局限性,VideoGameBench强调在动态和复杂的环境中评估其推理能力的重要性。

他们表示:“与未解决的数学证明和奥林匹克级数学问题等极其复杂的领域不同,玩视频游戏并不是超人类的推理任务,但模型仍然很难解决这些问题。”

编辑:Andrew Hayward

Share. Facebook Twitter Pinterest LinkedIn Tumblr Email Copy Link

Related Posts

大脑聪明,模型微小:西班牙多元宇宙计算公司获得2.15亿美元融资,旨在为智能手机缩小人工智能应用

2025年6月18日

芭比和热轮玩具制造商将使用OpenAI技术提升生产力

2025年6月18日

OpenAI首席执行官表示我们已经超越了“超智能事件地平线”

2025年6月14日

《聊天机器人时代的爱情:研究发现75%的用户寻求AI情感建议》

2025年6月13日

人工智能将更快地取代您的工作,超出任何人的预期

2025年6月12日

谷歌推出集成Gemini AI的Android XR眼镜

2025年5月27日
Add A Comment
Leave A Reply Cancel Reply

最新文章

尤文图斯交易推动加密货币交易所WhiteBIT的代币达到历史最高价

2025年6月19日

Kraken的以太坊二层网络Ink Network即将推出代币

2025年6月19日

埃里克·特朗普否认参与Tron纳斯达克交易,尽管担任董事职务

2025年6月19日

比特币价格在伊朗冲突担忧中保持稳定

2025年6月19日
保持联系
  • Facebook
  • Twitter
  • Pinterest
  • Instagram
  • YouTube
  • Vimeo
别错过

尤文图斯交易推动加密货币交易所WhiteBIT的代币达到历史最高价

2025年6月19日

白BIT代币创下历史新高欧洲加密货币交易所白BIT的代币在周一达到了历史新高,价格飙升超过30%,原因是该交易所与著名的意大利足球俱乐部尤文图斯达成了为期三年的赞助协议。白BIT代币(WBT)目前的交…

Kraken的以太坊二层网络Ink Network即将推出代币

2025年6月19日

埃里克·特朗普否认参与Tron纳斯达克交易,尽管担任董事职务

2025年6月19日
网站简介

加密专场

发现加密专场,一个引领您进入加密货币领域的门户网站。从最新的加密货币新闻到深度分析,我们为您提供全面的覆盖,帮助您了解加密货币的世界。

X (Twitter) Telegram
我们的精选

尤文图斯交易推动加密货币交易所WhiteBIT的代币达到历史最高价

2025年6月19日

Kraken的以太坊二层网络Ink Network即将推出代币

2025年6月19日

埃里克·特朗普否认参与Tron纳斯达克交易,尽管担任董事职务

2025年6月19日
最受欢迎

23andMe基因数据上链:可能出现的风险有哪些?

2025年4月12日

2024年4月份区块链游戏研究报告:尽管市场不景气,活跃用户数量却创下新高

2024年5月11日

Hex创始人理查德·哈特宣称胜利,因美国证券交易委员会放弃欺诈诉讼

2025年4月25日
©Copyright 2024 加密专场 版权所有.
  • 首页
  • Web3
  • 政策
    • 审查
    • 法规
    • 交流
    • 隐私
    • 法律
  • Macro
  • Layer2
  • 比特币
    • NFTs
    • DeFi
    • 稳定币
    • 狗狗币
    • 以太坊
  • AI
  • 银行业
  • 游戏
  • 破产
  • 全部文章

Type above and press Enter to search. Press Esc to cancel.