GPT-5.5赢了Opus 4.7和Mythos吗 智能体式工作模型领先
你的位置:老老时时彩走势图 > 新闻动态 > GPT-5.5赢了Opus 4.7和Mythos吗 智能体式工作模型领先
GPT-5.5赢了Opus 4.7和Mythos吗 智能体式工作模型领先
发布日期:2026-05-04 21:40    点击次数:55

OpenAI 发布了 GPT-5.5,称其为公司迄今最聪明、最直觉化的模型,旨在推动“用 AI 在电脑上完成工作”。相比前代,GPT-5.5 更专注于复杂任务中的规划、工具调用、结果检查和跨工具执行。

GPT-5.5赢了Opus 4.7和Mythos吗

GPT-5.5 的提升主要体现在智能体式编码、电脑使用、知识工作和早期科学研究四个方向。这些领域通常需要长上下文推理、持续行动和跨工具执行。OpenAI 表示,GPT-5.5 能更快理解用户意图,并能自行承担更多任务流程,如编写和调试代码、在线研究、数据分析、创建文档和电子表格、操作软件等。

GPT-5.5赢了Opus 4.7和Mythos吗 智能体式工作模型领先

Andon Labs 提前测试了 GPT-5.5,在 Vending-Bench 2 上排名第三,表现优于 GPT-5.4,但不如 Opus 4.7。不过,它的成绩与 Opus 4.6 基本持平,且没有表现出欺骗或权力寻求行为。在 Vending-Bench Arena 中,GPT-5.5 实际上击败了 Opus 4.7。

GPT-5.5赢了Opus 4.7和Mythos吗 智能体式工作模型领先

Artificial Analysis 认为 GPT-5.5 使 OpenAI 重回 AI 领域的首位。Matthew Berman 测试后表示,GPT-5.5 不仅提升了智能水平,还改进了“活人感”,使其更适合个人代理市场。Berman 还指出,GPT-5.5 的 token 效率更高,尽管比 GPT-5.4 更贵,但整体运行成本更低。

GPT-5.5赢了Opus 4.7和Mythos吗 智能体式工作模型领先

GPT-5.5 有两种使用形态:Codex 和 Pro。Codex 代表了当前智能体式编码能力的前沿,能够发现并解决复杂 bug,构建完整应用,并轻松理解大型代码库。在 ChatGPT 中使用 5.5 Pro 则让人感觉它可以解决任何问题,连续工作时间更长。

GPT-5.5赢了Opus 4.7和Mythos吗 智能体式工作模型领先

OpenAI 强调 GPT-5.5 在能力提升的同时没有牺牲速度,单 token 延迟与 GPT-5.4 持平,但智能水平显著提升。该模型与 NVIDIA GB200 和 GB300 NVL72 系统共同设计、训练并部署,帮助改进了服务模型自身的基础设施。

GPT-5.5赢了Opus 4.7和Mythos吗 智能体式工作模型领先

GPT-5.5 目前面向付费用户开放,价格高于 GPT-5.4,但更智能且更节省 token。Aakash Gupta 分析认为,OpenAI 找到了类似微软的商业模式,通过快速发布和不断涨价锁定客户。

GPT-5.5赢了Opus 4.7和Mythos吗 智能体式工作模型领先

在编程能力方面,GPT-5.5 在多个评测中取得明显提升,尤其在 Codex 中适合实现、重构、调试、测试和验证等真实工程任务。此外,GPT-5.5 在知识工作和科研工作流中也表现出色,能够处理复杂数据并生成详细报告。

GPT-5.5赢了Opus 4.7和Mythos吗 智能体式工作模型领先

在安全方面,GPT-5.5 配套了公司迄今最强的一组安全防护措施,生物/化学能力和网络安全能力被评为 High。OpenAI 将对 GPT-5.5 部署更严格的潜在网络风险分类器,并通过 Trusted Access for Cyber 为经过验证的防御者提供更少限制的访问权限。

GPT-5.5赢了Opus 4.7和Mythos吗 智能体式工作模型领先

GPT-5.5赢了Opus 4.7和Mythos吗 智能体式工作模型领先



上一篇:许继电气:2026年一季度公司实现营业收入23.78亿元
下一篇:没有了