如何拼凑不同网页的不同部分到一个网页
[需求]
经常浏览不同网站的网页,但是只需要其中一小部分内容。如何把不同网站 A 、B 、C 、D 的各自不同部分拼凑到一起到我个人的页面,提高浏览效率。最好能保持原有内容的交互,比如点击什么的。
[困难]
iframe cors 都会有限制的,我只是自己用,不用担心法律问题。
[方案]
1/ python 爬虫,本地 render ,然后提取内容,可以保存为图片,但是最好是文字的,保留 style 。然后拼凑到自己网页
2/ 用 qt webview 什么的,但是我想要一个网页版的,不要本地 app
3/ 好像有 caddy reverse proxy 绕过 iframe cors 限制
万能的 v2exer 请给出你宝贵的可行建议,谢谢!
之前貌似见到过 arc 浏览器有个类似的剪报功能,类似小时候剪报纸拼到自己的笔记本上。
我最近在开发一个类似的东西,从技术来说是可行的
准确描述需求,让 cursor+gemini pro 2.5 来处理
要是能弄成 drag and plug 简化操作最好。你是什么思路呢?
问过大模型了,感觉思路不是很靠谱。
#4 拼凑页面让大模型来生成肯定是可行的,大不了页面复杂一点,但这样做价值到底有多大,看页面为了获取信息,保持页面样式除了感动自己,并不会增加页面的主要作用。让大模型从原页面获取信息,按最适合的方式重新生成页面,无需保持原页面样式,这样更可行
有图表 数据 啊 不全是文字
#6 让大模型重建图表,数据很简单,但不一定是原来的样式,原来的配色,原来的组件,参考 deep research 的产品逻辑,从几十个数据源获得数据,然后重组写一份详细的研究报告,非常成功
iframe cors 都会有限制的,我只是自己用,不用担心法律问题。
nginx 反代一下,去掉页面上的限制,就行了。
谢谢你热心回复。这个办法也是一个办法,具体网页得具体实现。如果能有个通用一点的答案更好了。
貌似有的网页会检查在不在 iframe 里面,如果在就反抗一下。
还有 iframe 能不能实现自动滚动到某个位置浏览特定区域呢?
resources.arc.net/hc/en-us/articles/19231142050071-Easels-Capture-Create
Arc 浏览器提供了这个功能,不过用起来一般般
对,就是这个。感觉浏览器自身能支持就好。能动态更新截图,也可以静态。你说的一般般是什么体验?
用反代就是用来去掉 他那些检测的,iframe 可以设置自动滚动到某个位置的。
绕过 iframe 限制就行了:
我之前做过这个,就是给后端塞个反代的事儿。
让我想起来一个叫 Button Stealer 的扩展
你自己写个抓取任务,从你要的页面里抓到数据后,自己实现页面
想直接用别人的页面基本不太可能。
不过还可以给你提供一个思路,如果你想要的页面不需要操作,可以用一个虚拟机打开这些页面,然后开一个 OBS ,自己再建一个串流服务器,再用一个网页把几个视频合在一起就行了。
obs 这个思路有点意思!
自用要修改 cors 头,直接用 modheader 之类的 http 报文修改工具就行了,最省事的方案
单纯阅读的话有点像 RSS
rss 有实现一些,一个源一个看。这个拼凑的话,可以一个页面展示多个源。
V2EX 果然藏龙卧虎,这个第一次听说
之前我一直用家里的服务器对外服务,不过由于公网 ipv4 不好弄,而且限制颇多,所以一直都是买了一个云服务器用 frp 做中转,后来还换到樱花 frp 这类平台做中转。 后来我…
听说微信小程序开始收认证费,一年 300 元 个人小程序一般靠流量主赚钱,大概多少流量一年能补平投入+认证费用? 有没有懂哥分享一下 赚不到,另外个人认证一年 30 元 赚…
用 winscp 传输太慢了 可以用 php -S 弄个临时服务器 但我知道这个 php 不支持并发请求 所以无法多线程下载 其他语言有什么临时 http 服务器支持多线程下载…