开发了一个浏览器插件,一个本地知识库 AI 助手,关于 RAG 的,希望各位大佬帮我指定下,给点建议,产品本身以及推广都可以,谢谢
具体的介绍都在官网这里
guanzhangai.cn
网站打不开
搞笑呢,cn 域名和 AI 是互斥的,你有牌照吗?就敢大模型
再试下老哥,我改了下 DNS,测了下全国网速,应该没问题了
em, cn 域名和 AI 是互斥的, 这话我有点不太理解, 麻烦老哥帮忙解释下; 至于牌照与大模型,我也不太理解,我全程都用的第三方的开源 LLM 模型或者 api 调用,跟牌照有什么关系吗?
我也想做个类似的东西,不知道如何下手,op 大佬能指点一二吗?比如需要哪些基础知识,基于哪个开源模型来搞之类的。。。
我想想哈, 如果是你要做服务端的话, 可以去看下 langchain, 它里面有提供 python 和 nodejs(我已知的)的库,基本上是可以帮你直接从清理文本,到存入向量数据库,到搜索匹配,直接一条龙完成了的,很方便; 如果你要是像我一样做客户端的话, web 端我调研的方案, 基本上就是 transformjs 处理向量,加 indexdb 存储, 复杂的点主要是中间的一些优化, 我当初弄我这玩意时候,内存老是爆;向量模型的话,就是 huggingface 上找找 embeding 的, 目前国外很多人用的是 nomic-embed-text-v1,不过我测了中文效果不咋地,我就换成了 jina-embeddings-v2-base-zh,目前测试还不错,后面有时间我应该会更新一些我碰到的坑写到我那个博客里(官网里有挂,才刚弄), 希望能帮到你
www.cac.gov.cn/2024-04/02/c_1713729983803145.htm
有备案吗? 还用国外 api ?符合 "坚持社会主义核心价值观" 吗?
www.cac.gov.cn/2023-07/13/c_1690898327029107.htm
我去 我还真不知道这玩意 感谢老哥提醒;我找时间研究下,不过 api 我只用我们国内的,支持我们国产模型 qianwen 之类的 hh
这个功能有点不太明白哈,意思就是,用户将需要收藏的网站提交给你开发的插件,然后服务端会通过爬虫的方式将内容爬下来,输入到 llm 中,类似于一个 rag 的过程,然后就可以通过对话的形式来获取内容
你这是违法的,赶紧关了。
#4 有别的老哥已经说过了,我就不再赘述了。反正不建议在国内搞这些,即使政策允许,国内的付费意愿也太弱,没有任何意义,直接出海是唯一的选择。
没必要前怕虎后怕狼,做不做的起来还不一定
先上车后补票例子多了去了
不过还是建议从国外市场做,国内付费意愿太低,而且乱七八糟浏览器多,你这又是插件。
国外基本上 chrome ,firfox ,safari 支持了就够了
cn 域名做好进去的准备
谢谢大佬!
是的,总体就是你自己的所有资料会被向量化,然后根据你的问题进行匹配相关文档,再丢给 ai 回答;其实没有服务端,都是纯客户端,除了最后一步 llm 模型是怎么选的
好的 感谢
头疼....
嗯嗯 感谢指点
.....这么恐怖
有没有火狐的?
火狐目前还不行,还没去适配
本地有一个 1w 行的 txt 文件 每一行都是单独的 payload 。要求是请求同一个 url 使用每一行 payload ,如何能做到最快。不处理响应的 respon 只…
对这些银行业务不大熟。 双币卡是只有信用卡,没有储蓄卡的对吧? 如果要申请,哪家银行的比较好?我对信用卡权益啥的完全不了解。 因为双币卡是信用卡,所以同一家银行下也有不同类型的…
SpringBoot 项目,运行在 centos 服务器上。 有个需求要把 Word 文件转为 Pdf 文件,尝试了 libreoffice(免费),Apose Words (…