GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 – 今日头条

2025年12月4日
ai大模型

你好，我是你的AI超级助手，专注于快速帮助你完成各种写作任务。我基于OpenAI的ChatGPT技术，具备处理故事、文案和编程代码的强大能力。同时，我还融合了通义千问、文心一言、豆包AI等多种智能体。期待你的加入，与成千上万的AI爱好者共同体验ChatGPT带来的高效与便捷。

鱼羊发自凹非寺

量子位 | 公众号 QbitAI

4.1与4.5孰大？OpenAI刚刚给出答案：

发布GPT-4.1，比GPT-4.5强的那种。

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 - 今日头条 1

参考文章：AI写作的魅力与实用性-探寻AI写作带来的新机遇与优势

新模型系列更新，一共带来三个版本：GPT-4.1，GPT-4.1 mini、GPT-4.1 nano——

与通常中杯大杯超大杯的设置不同，这回翻译过来，是中杯、小杯、超小杯。

OpenAI表示，4.1系列是API专供，不过列位非开发者先别急哈，人家也补充了，在ChatGPT里，4.1的能力将主要通过“融入最新版本的GPT-4o”体现。

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 - 今日头条 2

参考文章：AI论文检测新趋势-如何利用AI提升论文质量与原创性

能力方面，总结起来4.1系列纸面上最突出的优势有两点：

长上下文，3个型号均拥有100万token上下文窗口；

性价比，用内部老哥的说法就是：

现在你可以用4%的价格，畅享GPT-4o模型品质。

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 - 今日头条 3

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 - 今日头条 4

OpenAI还表示，GPT-4.1系列会在API里取代GPT-4.5 Preview，后者将于今年（2025年）7月14日下架。

GPT-4.1：主打性价比

展开来看，OpenAI整体上是把GPT-4.1和GPT-4o拿来对比的。

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 - 今日头条 5

以延迟为横轴，以智能为纵轴，可以看到，GPT-4.1比GPT-4o强了一丢丢，而4.1 mini则超出了4o mini一大截。

定量比较的结果是，编码方面，GPT-4.1在衡量真实世界软件工程技能的SWE-bench Verified上得分为54.6%，比GPT-4o的分数提高了21.4%，比GPT-4.5强了26.6%。

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 - 今日头条 6

指令遵循方面，在MultiChallenge基准中，GPT-4.1得分38.3%，而GPT-4o的得分是27.8%。

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 - 今日头条 7

长上下文方面，在多模态长下文理解基准Video-MME上，GPT-4.1刷新SOTA，在长篇无字幕类别中得分72.0%，比GPT-4o高了6.7%。

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 - 今日头条 8

值得注意的是，GPT-4.1 mini在多项基准测试中超过了GPT-4o。

比如在智能评估基准MMLU上，GPT-4.1 mini的得分为87.5%，超过了GPT-4o的85.7%，同时延迟降低一半，成本降低83%。

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 - 今日头条 9

GPT-4.1 nano则被定位为OpenAI“目前速度最快、成本最低”的模型。并且在部分测试中有超出GPT-4o mini的表现。

编码能力

OpenAI着重强调了GPT-4.1的编码能力。除了在各种编程任务上都超过GPT-4o，OpenAI还演示了其在前端编程方面的实际优势：

能够创建功能更强大、更美观的Web应用。

人类评分的结果显示，在80%的对比测试中，GPT-4.1的网站都比GPT-4o的网站更受欢迎。

比如给出同一段提示词，GPT-4o生成的网站长这样：

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 - 今日头条 10

而4.1的结果明显更美观：

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 - 今日头条 11

手快的网友则已经搞出了大家更想看的——小球测试。

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 - 今日头条 12

BTW，OpenAI提到，GPT-4.1会在API里取代GPT-4.5，GPT-4.5 Preview将在3个月后（2025年7月14日）彻底关闭，但这位老哥表示：我还是更喜欢4.5啊啊啊。

不过，老哥也坦承：4.5虽好，但4.1确实便宜太多啦（30倍价差）。

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 - 今日头条 13

百万长上下文

再来看一眼长上下文方面，GPT-4.1的具体表现。

大海捞针实验中，面对100万token上下文检索，3个型号均能100%过关。

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 - 今日头条 14

OpenAI还开源了一个新的评估平台OpenAI-MRCR，以测试模型检索和理解多条信息、并理解信息之间相互关系的能力。也就是说更接近实际应用中，大家对长上下文的真实需求。

结果如下：

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 - 今日头条 15

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 - 今日头条 16

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 - 今日头条 17

还发布了一个用于评估多跳上下文推理的数据集Graphwalks。所谓多跳，即在长上下文中进行多次逻辑跳跃，比如编写代码时在多个文件之间跳转。

在这个基准上，GPT-4.1与o1性能相当，轻松击败了GPT-4o。

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 - 今日头条 18

性价比仍不如DeepSeek R1

价格方面，相对于自家~~贵得要命~~的模型，GPT-4.1系列无疑是便宜的。

尤其是对比要被替代的GPT-4.5 Preview，2刀/百万tokens vs 75刀/百万tokens，价格属于大砍一刀只剩零头了。

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 - 今日头条 19

但精明的网友们发现，还是比不上DeepSeek R1：

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 - 今日头条 20

△图源：x@bongrandpOne More Thing

以上，你觉得GPT-4.1如何？

反正这个命名方式确实是蛮值得吐槽的。

但没准儿，OpenAI的意思是…4.10＞4.5？

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 - 今日头条 21

至少奥特曼本尊有被说服到（doge）。

他还自嘲了一波：

我们能不能在今天夏天之前搞定我们的模型命名？在此之前每个人都可以再花几个月时间来取消我们（我们活该）。

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 - 今日头条 22

参考链接：
https://openai.com/index/gpt-4-1/

— 完 —

量子位 QbitAI · 头条号

关注我们，第一时间获知前沿科技动态签约

来源：今日头条

原文标题：GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 – 今日头条

原文链接：https://www.toutiao.com/article/7493350320547791400/

声明：

文章来自网络收集后经过ai改写发布，如不小心侵犯了您的权益，请联系本站删除，给您带来困扰，深表歉意！

本文标题：GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比 – 今日头条
网址：https://www.aidamoxing.cn/2025/12/04/64248.html
----------------------------------------------------------------------------------------------------------------------
本站所有文章由ai大模型网通过chatgpt写作修改后发布，并不代表本站及作者的观点；如果无意间侵犯了阁下的权益，请联系我们删除。
如需转载，请在文内以超链形式注明出处，在下将不胜感激！

chatgpt中文官网凝聚国内优质模型：文心一言、通义千问、讯飞星火、腾讯混元、豆包ai等，只需一个账号即可用遍全网ai大模型，主打优质、方便、高效、低价；每周更有全天chatgpt免费使用活动.

添加售后客服

ai写作 ai论文 chatgpt中文 ai大模型

免责声明关于我们联系我们隐私政策网站地图

Copyright ©2024 | chatgpt中文网 | 苏ICP备：2023045497-4

AI 客服

你好，我是本站的 AI 客服助手。可以帮你快速查询产品说明、订单状态、售后规则等信息，也可以回答通用问题。