听说阿里云的通义千问 API 收费了,看了下价格。
阿里云 ==> 0.12 元/1000tokens
我看了下,我最近 20 天就用了大概 1000 * 1000 tokens,还好在免费额度里,算了下账,都差点要 120 远了😭,还好目前是免费的🤣
果断弃用,xdm ,还有什么便宜的 API 调用不?目前我了解到的最低价格是
GPT4 ==> 0.024 元/1000 tokens

国内的:kimi/ deepseek/ chatglm/ 01-ai/讯飞星火或者你用一个 sass 服务比如 openrouter.ai/市面上的大模型基本都有(开源或者闭源)

我用的 gpt4 0.07 /1k token

有一些算力的,自己部署开源模型,白嫖

如果能搞定绑卡支付,还是用 OpenAI 官方的省心:- 不限制不能并发(具体还是要看帐号的等级,而转发站现在 GPT 4 不能并发)- 转发站莫名其妙会请求失败(用过两三个,有一两个会出现这样的状况)又想省钱又想省心的办法可以自建一个 one-api ,然后加一个官方渠道,加几个一折左右的转发站,用它的负载均衡功能来达到省钱和稳定的目的。如果完全不想花钱,可以试试 ollama ,像 gemma7B 这种主观感觉跟 GPT 3.5 Turbo 差不多。

有开源模型推荐吗

meta LLaMA2

听闻 kimi 火,我去研究,🙏

为什么选择最贵的?😂

哈,并没有呀,GPT4 国内的 sass 只要 0.024 元

感觉 kiwi 也蛮贵的,moonshot-v1-32k 的 1M 上下文差不多也要 24 元了。😂

我使用 OpenRouter 免费的 API

成本在这,再怎么便宜也不会差距很大

你说的 gpt-4 能支持并发吗?据我所知国内的这些第三方 应该是没有很高的 gpt-4 使用的 tier 的 而且很多 gpt-4 都是用 azure 套壳的 并不是 openai 的 我记得 coze 的 dalle 的图就是微软的
吓得我去看了下 api ,发现 3.5 用了俩月,终于用了 1 刀了

Gemini 有免费额度 ai.google.dev/pricing

gemini 目前免费但是 api 很难用还不稳定

qwen-turbo 0.008 元 1000tokens

turbo 感觉回答问题不太精准哈,还是不太敢用😂

justchat.top

这个不支持 gpt4 吧

楼主说的 gpt4 0.024 是哪个

gemini 免费,买个域名在 cloudflare 上转发下国内就能访问了

chatglm4 0.1 元/1k tokens, 国内的模型算中文 tokens 比国外的少, 要用的话建议就是英文 gpt4, 中文 chatglm4, 不追求回答质量的话那选择更是非常多了等 claude-3-haiku api 放出来, 感觉可以考虑用这个, 看官网评测性能虽然弱于 gpt4, 但差距没有特别大, 而且看起来价格可能会很便宜

这个 api.kksj.me/ ,之前他们在 V2EX 推荐过,感觉还不错我就购买了,不过只买了 10 块钱😂

github.com/xai-org/grok-1

简单问题本地 ollama ( mistral/qwen-13b 这俩效果可以),M 芯片跑起来挺快复杂问题 Kimi / ChatGPT 4

为什么挑便宜的?便宜的能好用?一百多还不够一小时工资吧。

直接本地搭建一个 Qwen 7b 的,基本够用了应该,一张 4090 就可以跑

需要 gpu ?还是 cpu 也可以?

aws claude 3?

#26 qwen-13b 是哪个? 是 14B 么?想问一下你跑的哪个版本?速度怎么样?我用过一个,感觉有些慢,难道是我配置不行。。。。

与其找便宜的不如找效果最好的,要便宜有免费的那最便宜

我目前也用的是国内的转发站 ,大体就是 0.8 元人民币 ==> 1 美元额度。算下来就是楼上的 0.024/1k tokens 吧不过目前也就个人用用,冲了 200 刀( 160 人民币)。claude 3 的三个相关模型,gpt-4 的模型 看起来都能用。

所以不知道并发情况。之前还纳闷这些转发站的上游渠道,那现在似乎优点明白了:gpt-4 ---> Azureclaude ---> AWS

老哥用的那家的,推荐下,最近想试试

我去看了看,这家没 aff 啊,心好痛啊。 还好他家域名短,辛苦老哥看图片👆 真·广告位出租 👆

纯 CPU 就可以。M1 Pro, 16G 跑着挺快对,14b 我说错了。
together.ai 有 25 美刀额度免费
这些本地“小模型”只能跑点文科东西,反正对我来说基本上没法用。快倒是真快,刷刷刷好几屏我眼睛都跟不上。

谢谢

谢谢

支持中文不

低价的中转 API 平台上线 Claude 3 Opus 模型了 hesudu.com/t/1019642

#42 qwen-13b ,国内的模型中文支持好些。mistral 中文很烂

#39 写点 python 代码没问题的