手里有 1 亿 6 千万篇裁判文书和 3 亿条工商信息数据,从程序员的角度如何最大化利用
如题,怎么样能将其利用起来?
数据还在持续更新,不过后续的难度不小
刑
细说
你这是把谁家裤子给脱了
合法数据的话和 SFT 一个 llama 呗
依我看就一个用处,放到 pt 站提供下载。
“找到需要执行的人,打电话给他们,然后告诉他们自己可以帮助执行,但是需要收取 10%的费用,先交钱”
“打电话给公司法人,我是工商局的,经核查,你司发现偷税漏税因为,需要你配合我们调查…”
暗网上卖
希望你说的利用不是赚钱。
3 亿条工商信息数据 . 做企查查?
这个不太刑啊
你想卖给谁还是想讹谁?
做成 api 服务行不行,需要办什么证吗
我主要是想知道做成 api 服务或者网站 app 行不行
#15 那么 2 楼已经回答你了
合法渠道没有对外提供的可能性,非法渠道(泄漏、暗网买卖)倒是不少
你好,欢迎拨打 KK 圆业务咨询电话。------------认真点说,工商不知道,但案例,你可以做个法律咨询网站,你这个数量应该可以带来一些流量了,然后有人咨询的就介绍给律师,这个流量是很值钱的。唯一担心的是你的数据是否合法。
企查查这类企业是取得了什么特殊资质吗
数据合法怎么说呢,大家都是用类似的方法拿到的
找到司法业务痛点,然后训练一个专业模型
一亿多的数据量似乎不太够啊
工商的数据如果官方接口记得是几块钱一次。。
你这就是标准的灰产。
先思考下合不合法
做啥都不合法 暗网卖了吧
这个裁判文书你比官方的还全,就没想过有问题吗,官方现在是把一些案子下线了,你这里不管是收费还是免费提供,那都是妥妥的泄漏国家秘密罪
卖给大家比较靠谱
拿来训练模型啊
做 tg bot 付费查询,前提是人和资金绝不要在墙内,否则一定会进去
如果真的很有信心,可以开个公司卖,不过企查查天眼查等,也有不少公司在做这个事了,红海市场竞争激烈
op ,我想问问,你是从什么逻辑出发认为这东西是你的,还想自己处理?
很多数据公司都在提供数据查询服务啊
低成本做这个事情倒还行,如果推广成本过高就不行了
你这来源。。。还是喂 GPT 然后出个 LawGPT 服务吧
在工位上长期使用两台 27 寸显示器干活,各种复制/粘贴+AI 打辅助,搬砖基本上还可以。 最近出差多的时候,外面就没有大屏显示器,只能在一台笔记本上干活,发现基本上干不动了。…
无论是运行时签名校验也好,还是把核心逻辑写到 native 代码也好,感觉都能轻松反编译,得益于 jadx ,IDA 这些工具,so 库也能给你搞出 C 伪代码来,各种命名,逻…
家里两台主力开发机,一个 pve 的,一个 mac 。平时外出或者公司,折叠键盘+手机或 pad 基本都能解决。最近外出,发现 todesk 很慢,怀疑是恶意限制的,尝试自建 …
合速度