AI评测新标杆!GPT-5等前沿模型惨遭“零分”,博士级推理能力究竟还有多远? 在AI领域,各种评测基准层出不穷,但鲜有能让顶尖模型集体“折戟”的。近期,一个名为 FormulaOne 的全新AI评测基准横空出世,其结果令人大跌眼镜:包括 GPT-5... 2025-08-15 xiaomei 教程