在编程能力方面， Gemini 和 GPT 哪个正确率更高？

最近我练算法主要使用 Gemini 和 GPT 。
我发现有时 GPT 会提供一些有错误的代码，这时候 Gemini 也可能会给错误的代码。
但 Gemini 强在速度比较快。
想问问各位的意见。

我比较喜欢 Claude 3.7 Sonnet ，其次 DeepSeek R1

gpt 正确率更高,Gemini 就只剩快了

代码问题个人感受是

开源的东西，Claude 3.7 Sonnet 最好， Gemini / ChatGPT / Grok / DeepSeek 这几家的思考模型差不太多

私有大项目的话，Gemini 靠 context window 大，把整个项目喂进去，稍稍有点优势，但不大

grok3 比 chatgpt 强

DeepSeekv3

最近用的挺多 windsurf 配合 3.7 很 ok ，部分问题使用 gpt-o3 解决的，至于 DS 为什么还有人觉得厉害我只能说他们没付款用过。用了 trae 的 r1 给我气的半死。做积分活动修改积分方法，解决原子性问题蹦出个死锁，解决死锁蹦出个嵌套事务，然后三个无限循环来来回回改。最后不再信任上下文记忆让兼顾三个问题解决，好嘛，解决完三个问题都出来了，最后用的 o3

＃6 根本没在乎基础业务逻辑，就像面试，光顾着高并发等问题解决最后基础逻辑走不通，仅仅单次调用接口时间 x20 最后来个系统繁忙

Gemini 这个鸡毛犟种，打死不用

Claude 永远的神

ge-mini 名字不都已经告诉你了么阉割 mini 模型

第一梯队 Claude 3.7 Sonnet 、o3 mini
Claude 更擅长于使用语法糖有时候容易出幻觉，o3 mini 更适合常规开发

其次是 git commit 的适合 qwen 总结合适

最后 Gemini 快、2M 输出一骑绝尘，正确率堪忧

合速度

在编程能力方面， Gemini 和 GPT 哪个正确率更高？

近期文章

热门推荐