在编程能力方面, Gemini 和 GPT 哪个正确率更高?
最近我练算法主要使用 Gemini 和 GPT 。
我发现有时 GPT 会提供一些有错误的代码,这时候 Gemini 也可能会给错误的代码。
但 Gemini 强在速度比较快。
想问问各位的意见。
我比较喜欢 Claude 3.7 Sonnet ,其次 DeepSeek R1
gpt 正确率更高,Gemini 就只剩快了
代码问题个人感受是
开源的东西,Claude 3.7 Sonnet 最好, Gemini / ChatGPT / Grok / DeepSeek 这几家的思考模型差不太多
私有大项目的话,Gemini 靠 context window 大,把整个项目喂进去,稍稍有点优势,但不大
grok3 比 chatgpt 强
DeepSeekv3
最近用的挺多 windsurf 配合 3.7 很 ok ,部分问题使用 gpt-o3 解决的,至于 DS 为什么还有人觉得厉害我只能说他们没付款用过。用了 trae 的 r1 给我气的半死。做积分活动修改积分方法,解决原子性问题蹦出个死锁,解决死锁蹦出个嵌套事务,然后三个无限循环来来回回改。最后不再信任上下文记忆让兼顾三个问题解决,好嘛,解决完三个问题都出来了,最后用的 o3
#6 根本没在乎基础业务逻辑,就像面试,光顾着高并发等问题解决最后基础逻辑走不通,仅仅单次调用接口时间 x20 最后来个系统繁忙
Gemini 这个鸡毛犟种,打死不用
Claude 永远的神
ge-mini 名字不都已经告诉你了么 阉割 mini 模型
第一梯队 Claude 3.7 Sonnet 、o3 mini
Claude 更擅长于使用语法糖 有时候容易出幻觉,o3 mini 更适合常规开发
其次是 git commit 的适合 qwen 总结合适
最后 Gemini 快、2M 输出一骑绝尘,正确率堪忧
推荐 Claude 3.7 Sonnet
对 flowith.io 怎么看
Claude 3.7 Sonnet 速度,准确性,代码质量一骑绝尘
grok3 目前推广期,免费版比较舍得出力
编码来说 claude 断崖领先,deepseek 紧随其后,其余差不多。 人文社科领域感觉 grok 更强
我只用过 o3 mini ,目前都能满足我的需求。想试下 Claude 3.7 Sonnet 。
我试过几次 Gemini, 就是大废物
同这样感觉,现在模型里面 Coding 领域 Claude 断崖领先,不知道那些用 openai 吭哧吭哧写代码的用没用过 Claude 。grok3 在日常使用(非 coding 领域)非常好用
基本所有有名的模型都使用过,写代码领域,除了 claude ,其它我都认为是垃圾,总是给我报错的代码,只有 claude 给了我直接替换运行的自信
三家的收费账户, 再加上 Grok 的免费试用
Claude >>> Gemini > ChatGPT > Grok (单说代码相关,Grok 其实挺好的)
需求: 1. 抓取账号最新的推文,频率较高。例如输入账号 ID ,自动每 30 秒抓一次,不间断 2. 目标账号较多,需要同时监控上万计的账号 若有意向,可加微信联系合作:d…
之前用的是 WordPress ,一直想自己实现一套博客系统。 现在前端差不多写完了,第一次用 Nuxt.js ,也用了很多新的特性,前前后后忙了挺久,不过现在后端依旧是 Wo…
主要是想要用广告屏蔽和网易云音乐解锁之类的功能 代理跑在上面也可以 不知道有没有试过的 感觉可以用 docker 配置网卡,自己弄桥接。但是安卓上面没有试过,也搞不清楚那…