先做个广告:如需代注册ChatGPT或充值 GPT4.0会员(plus),请添加站长微信:gptchongzhi
🥇o3在ARC-AGI公共基准得分为75.7%(得分是o1的3倍)。O3在高计算模式下得分为87.5%。🏠人类表现为85%。
🥇EpochAI 的 Frontier Math:o3 创下新纪录,解决了 25.2% 的问题,而其他模型都未超过 2%
🥇在 SWE-Bench Verified 上: o3比 o1 高出 22.8 个百分点
🥇在 Codeforces 上:o3 获得了 2727 分,超过了 OpenAI 首席科学家的 2665 分
🥇在 AIME 2024 上:o3 得分 96.7%,只漏了一个问题
🥇在 GPQA Diamond 上:o3 达到了 87.7%,远高于人类专家的表现
😢😭😭但目前因为安全原因,还无法公开。正在努力中~
推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top
网友评论