今天我用 o3 的编程体验真是太棒了。我相信你们很多人最近也都有过类似的经历——无论是用 o3、Claude 还是 Gemini。
我花了几个小时用它迭代一个问题。我让它为一个高级机器学习项目提出一个新颖的算法应用方案,然后让它实现它,并编写单元测试。在运行任何程序之前,我借助一个单独的 o3 实例对它生成的代码进行了静态代码分析。然后,我迭代了它编写的单元测试——执行它们、反馈错误并提供高级指导。
这个算法已经足够先进了,即使经过这个迭代周期,我仍然不确定它是否正确。我可能需要继续测试和分析几天。
换句话说:计算机在两个小时内生成了一个程序,而我需要花两天时间才能完全测试和理解。
有了聊天机器人足够准确的预测,我完全检查其所有输出就变得不那么合逻辑了(甚至不可能!)——我只需要“感受”它。
我认为我们人类可能不再能够合理地验证这些计算机系统的输出。这对我们每个人来说都将是一个有趣的时刻。
原文: https://nonint.com/2025/05/23/vibe-coding/?utm_source=rss&utm_medium=rss&utm_campaign=vibe-coding