Gemini 2.5 pro 在这个问题上栽跟斗
因为最近发现了一个 bug 代码示例如下
public static void main(String[] args) {
double num = 0.0;
double min = Double.MIN_VALUE;
System.out.println(num < min);
}
然后我就去问 Gemini ,这段代码输出的结果是什么,结果在这种简单问题上都是答错的,紧接着去测试了一下 ChatGPT 和 DeepSeek ,都能正确分析给出 True 的结果
虽然这个帖子是在讨论 Gemini 的问题,但实际上弱弱的想问一句,是不是只有我一直误以为 Double.MIN_VALUE 是负数 shit T_T
写代码 不要使用 Gemini ,pom.xml 文件开头 <?xml ,gemini cli 生成了 <xml ,测试其他 ds claude glm4.5 模型没出过这样的低级问题
claude 也错了
推理过程正确,结果错误
我的 gemini 两次都回答 true ,你可能遇到降智了
AI 本质上是内容生成,现在就算是看起来再有逻辑,它也不会直接通过逻辑判断,所以这种测试在当下没有什么必要。对于训练者无非是针对这些东西做一些内容训练。
gemini 代码能力确实欠缺一些,建议 claude 或 deepseek-r1
我用 API 测试者正确的,有没有可能你 IP 太脏被降智了?
Sonnet 4 还会自我纠正
为什么我的也是 true 。
Gemini 我不信任他,刚开始我用一个开源项目进行测试,分析,只有它的输出驴唇不对马嘴,就在那编; chatgpt 都是没问题的。
我也感觉大概率是被降智,最近我的 gemini 也频繁遇到这样的问题,对话中我使用一些完全不生僻的简写或名词,它能直接开始臆想瞎编,哪怕调用一下搜索也不至于生成完全驴唇不对马嘴的答案。我这用的 IP 纯净度应该还好啊,有重置或修复的办法么?
降智这种成本控制操作确实难顶,哪怕直接严风控封 IP 呢
感觉 App 的 Gemini 是被降智了,AI Studio 里的 Flash Lite 都能答对。
Gemini 只会道歉和一个劲的客气,跟 tm 日本人似的。很傻瓜。
网页版 Gemini 和 AI Studio 都回答 false ,一纠正马上就抱歉了
强如 Claude 也降智
有可能哈,不过我是 gemini 的年度 pro 教育白嫖版,居然都降智!真是大胆
2.5 Pro 降智很严重,怀念 03-25
2.5-flash,纠正了两次
一直用的 VSCode Copilot (公司给我们买了 License ),最近看到好多吹 Cursor 的,好像没感觉有特别大的差别? 莫非就是 1.自动补全,2.通过 C…
发现 NAT 这东西挺好用啊,做一层 nat ,不做端口映射,后面的服务器基本不用担心来自公网的爆破了。 感谢各位的分享和指点. 这里虽然只提了NAT, 但是也使用了其他技…
请问一下大伙儿, 现在“最快的” DeepSeek API 是哪家? 只讨论满血版 671B, 阉割版不在讨论范围内. 需要稳定的, 官网 API 已经连续 9 天 Majo…
合速度