详细阐述了 GPT-5 的进步点,以及 GPT-4.5 失败原因和 OpenAI 现在面临的困境和问题。

GPT-5不再注重智能的“量子飞跃”,而是注重实用性和用户体验的提升。
能够生成更加清晰、功能更丰富、用户更友好的代码, 更擅长处理复杂任务列表和边缘案例。
另外,推理效率有所提升。在补大幅增加算力的情况下,可以输出更高质量的答案。Token的利用更加高效。
引入了“Universal Verifier”强化学习机制,自动校验模型输出,借鉴了 o 系列(如 o1、o3)在推理任务上的经验。
感觉未来 LLM 评测标准(rubric)将逐步自动化,用户满意度和“信任度”成为新战场。
GPT- 4.5 的问题:
GPT-4.5 其实最初是作为 GPT-5 开发的,但表现不及预期,最后是以 GPT-4.5 的名字发布的。
主要原因是4.5相对于4O没有在小模型上实现重大的突破,但优化并未扩展到大模型。
GPT-4.5失败的主要原因是高质量的网页数据逐渐枯竭,预训练数据受限,预训练极限和数据稀缺变成了主要的瓶颈。
在公司管理和人员问题上:
研究主管 Mark Chen 和副总裁 Jerry Tworek 在 Slack 上存在明显的摩擦;同时,Mark Chen 也是团队重组和研究人员离职事件中颇具争议的人物。
微软独家权利直至 2030 年,计划在营利性结构中持有约 33% 的股份。 战略谈判正在进行中,同时 OpenAI 正在为可能的 IPO 做准备。