手里有 1 亿 6 千万篇裁判文书和 3 亿条工商信息数据,从程序员的角度如何最大化利用
如题,怎么样能将其利用起来?
数据还在持续更新,不过后续的难度不小
刑
细说
你这是把谁家裤子给脱了
合法数据的话和 SFT 一个 llama 呗
依我看就一个用处,放到 pt 站提供下载。
“找到需要执行的人,打电话给他们,然后告诉他们自己可以帮助执行,但是需要收取 10%的费用,先交钱”
“打电话给公司法人,我是工商局的,经核查,你司发现偷税漏税因为,需要你配合我们调查…”
暗网上卖
希望你说的利用不是赚钱。
3 亿条工商信息数据 . 做企查查?
这个不太刑啊
你想卖给谁还是想讹谁?
做成 api 服务行不行,需要办什么证吗
我主要是想知道做成 api 服务或者网站 app 行不行
#15 那么 2 楼已经回答你了
合法渠道没有对外提供的可能性,非法渠道(泄漏、暗网买卖)倒是不少
你好,欢迎拨打 KK 圆业务咨询电话。------------认真点说,工商不知道,但案例,你可以做个法律咨询网站,你这个数量应该可以带来一些流量了,然后有人咨询的就介绍给律师,这个流量是很值钱的。唯一担心的是你的数据是否合法。
企查查这类企业是取得了什么特殊资质吗
数据合法怎么说呢,大家都是用类似的方法拿到的
找到司法业务痛点,然后训练一个专业模型
一亿多的数据量似乎不太够啊
工商的数据如果官方接口记得是几块钱一次。。
你这就是标准的灰产。
先思考下合不合法
做啥都不合法 暗网卖了吧
这个裁判文书你比官方的还全,就没想过有问题吗,官方现在是把一些案子下线了,你这里不管是收费还是免费提供,那都是妥妥的泄漏国家秘密罪
卖给大家比较靠谱
拿来训练模型啊
做 tg bot 付费查询,前提是人和资金绝不要在墙内,否则一定会进去
如果真的很有信心,可以开个公司卖,不过企查查天眼查等,也有不少公司在做这个事了,红海市场竞争激烈
op ,我想问问,你是从什么逻辑出发认为这东西是你的,还想自己处理?
很多数据公司都在提供数据查询服务啊
低成本做这个事情倒还行,如果推广成本过高就不行了
你这来源。。。还是喂 GPT 然后出个 LawGPT 服务吧
随着Apache、百度、Wordpress都在和Facebook的React.js以及其专利许可证划清界限,似乎大家又在讨论Facebook的这个BSD+PATENT的许可证问…
这个程序用于 HyperV ,将虚拟机画面通过 HVsocket 接口,也就是 vmbus ,将虚拟化画面实时传输到宿主机,从而显示和控制。目前已经在 ai 帮助下实现 HDC…
晚上走前前台 vs 的终端在跑测试任务,预计 3 小时跑完,白天来一看,人离开 20 分钟给我重启更新系统了,刚刚看了一下更新设置,太反人类了,明明前台在活动直接给我重启了?不…