在编程能力方面, Gemini 和 GPT 哪个正确率更高?
最近我练算法主要使用 Gemini 和 GPT 。
我发现有时 GPT 会提供一些有错误的代码,这时候 Gemini 也可能会给错误的代码。
但 Gemini 强在速度比较快。
想问问各位的意见。
我比较喜欢 Claude 3.7 Sonnet ,其次 DeepSeek R1
gpt 正确率更高,Gemini 就只剩快了
代码问题个人感受是
开源的东西,Claude 3.7 Sonnet 最好, Gemini / ChatGPT / Grok / DeepSeek 这几家的思考模型差不太多
私有大项目的话,Gemini 靠 context window 大,把整个项目喂进去,稍稍有点优势,但不大
grok3 比 chatgpt 强
DeepSeekv3
最近用的挺多 windsurf 配合 3.7 很 ok ,部分问题使用 gpt-o3 解决的,至于 DS 为什么还有人觉得厉害我只能说他们没付款用过。用了 trae 的 r1 给我气的半死。做积分活动修改积分方法,解决原子性问题蹦出个死锁,解决死锁蹦出个嵌套事务,然后三个无限循环来来回回改。最后不再信任上下文记忆让兼顾三个问题解决,好嘛,解决完三个问题都出来了,最后用的 o3
#6 根本没在乎基础业务逻辑,就像面试,光顾着高并发等问题解决最后基础逻辑走不通,仅仅单次调用接口时间 x20 最后来个系统繁忙
Gemini 这个鸡毛犟种,打死不用
Claude 永远的神
ge-mini 名字不都已经告诉你了么 阉割 mini 模型
第一梯队 Claude 3.7 Sonnet 、o3 mini
Claude 更擅长于使用语法糖 有时候容易出幻觉,o3 mini 更适合常规开发
其次是 git commit 的适合 qwen 总结合适
最后 Gemini 快、2M 输出一骑绝尘,正确率堪忧
推荐 Claude 3.7 Sonnet
对 flowith.io 怎么看
Claude 3.7 Sonnet 速度,准确性,代码质量一骑绝尘
grok3 目前推广期,免费版比较舍得出力
编码来说 claude 断崖领先,deepseek 紧随其后,其余差不多。 人文社科领域感觉 grok 更强
我只用过 o3 mini ,目前都能满足我的需求。想试下 Claude 3.7 Sonnet 。
我试过几次 Gemini, 就是大废物
同这样感觉,现在模型里面 Coding 领域 Claude 断崖领先,不知道那些用 openai 吭哧吭哧写代码的用没用过 Claude 。grok3 在日常使用(非 coding 领域)非常好用
基本所有有名的模型都使用过,写代码领域,除了 claude ,其它我都认为是垃圾,总是给我报错的代码,只有 claude 给了我直接替换运行的自信
三家的收费账户, 再加上 Grok 的免费试用
Claude >>> Gemini > ChatGPT > Grok (单说代码相关,Grok 其实挺好的)
第一个叫:DestroyPhysicalMonitor http://msdn.microsoft.com/en-us/library/dd692936(VS.85).aspx…
自带的防火墙貌似只能单独禁止某一 exe 文件联网,能不能实现禁止一个文件夹下所有的程序联网,并且可以方便一键开启和一键关闭。 如果自带防火墙不能实现,有没有好用的第三方软件实…
如题 断断续续在 Linux 下开发 有 7 、8 年了,但是水平毫无长进。 回到 Windows2 个月又开始心痒难耐 系统盘压缩出 300G 准备再搞个 Linux 玩玩 …
合速度