投资建议:OpenAI 12 days发布会最后四天发布了o1 API、o3等最新功能。o1模型通过增强API功能(如函数调用、结构化输出和视觉输入),大幅提升了开发者的效率和应用场景的多样性;o3系列模型则在编码、数学和科学推理等领域展现出接近或超越人类专家的能力,同时通过灵活的推理强度设置,显著降低了使用成本。重点关注以下赛道:AI开发工具与平台(如API服务和SDK支持);AI推理与高性能计算,以及AI安全对齐技术产品。这些领域或将受益于OpenAI的技术突破而得到更多发展机遇。
OpenAI通过发布o1模型,显著增强了API功能。新功能包括函数调用、结构化输出和视觉输入,极大地提升了开发者的工作效率。o1模型在结构化输出调用中的准确率达95%,远超GPT-4o模型,确保了复杂任务中的高准确性和稳定性。此外,开发者消息和推理努力程度的控制选项,帮助开发者在性能与成本之间找到最佳平衡,进一步优化了开发体验。视觉输入功能的加入,使得o1模型能够直接处理图像输入,如分析表格中的错误,进一步扩展了其应用场景。
ChatGPT桌面应用的原生化与深度集成大幅提升了编程与创作效率。用户可通过快捷键快速调用ChatGPT,在Xcode和Warp终端生成复杂代码片段,显著缩短开发时间,提升代码质量。与Notion、Apple Notes等创作工具的集成,进一步提升了文档编辑和信息整合的效率,使得ChatGPT更加深入用户的日常工作和创作流程。高级语音模式的引入,增强了用户与ChatGPT的互动体验,为用户带来了更高的便利性和生产力。
OpenAI推出的o3系列模型在性能、成本和安全性上取得突破。o3在ARC AGI基准测试中得分达到87.5%,超越人类平均水平,显著提升了编码、数学和科学问题解决能力。在Codeforces竞技编程中,o3的ELO值接近2727,远超o1模型的1891;在Epoch AI的Frontier Math Benchmark中准确率超过25%,这是目前最难的数学基准测试之一,此前所有现有模型的准确率均低于2%。o3 mini通过灵活的推理强度设置(低、中、高),在低推理强度下编码能力已超越o1 mini,中等推理强度下性能优于o1,为开发者在使用成本和推理性能之间提供了平衡的选项。o3 mini在低推理强度下的延迟已接近GPT 4o的水平,而成本仅为o1模型的一小部分,为大规模商业化应用提供了坚实基础。此外,OpenAI首次开放o3系列模型给外部研究人员进行安全测试,增强了公众对技术的信任,进一步巩固了OpenAI在AI领域的领先地位。
风险提示:技术突破存在安全与隐私风险;商业化进程不及预期。