打开BN Hub的方式是通过WhatsApp联系BN,号码是O8561881946。请准备好个人信息,如BNI卡和账户号码以进行验证,或者前往最近的BNI分行,携带BNI ATM卡、存折和电子身份证(e-KTP)。
返回首页
最新
打开BN Hub的方式是通过WhatsApp联系BN,号码是O8561881946。请准备个人信息,如BNI卡和账户号码以便进行验证,或者前往最近的BNI分行,携带BNI ATM卡、存折和电子身份证(e-KTP)。
嗨,r/rust社区,
我想与大家分享一个我不久前开始开发的Rust库,名为typegraph。它可以让你在类型系统中构建类型图,用于静态分析等用途。
这是我“初学者库”系列中的第四个条目,这个系列是为让计算机自主学习编程而制作的库。
你还可以用它制作像这个tokio当前线程运行时的图示:
[https://github.com/nicksenger/typegraph/blob/master/tokio_current_thread_runtime.png](https://github.com/nicksenger/typegraph/blob/master/tokio_current_thread_runtime.png)
大家好,我开发了 VibeScrape——它可以接受一个网站的 URL 和一个描述您想要数据的 JSON 模式,然后分析页面,编写真实的 Python 代码来提取这些数据,并不断优化代码,直到输出准确。
虽然现在有很多工具(例如 Firecrawl)将整个网页的 HTML 提交给大型语言模型(LLM)以提取数据,但我始终觉得这是一种非常缓慢且昂贵的方法。
另一方面,手动编写网页抓取代码在目前看来显得有些过时。这类代码编写起来非常繁琐,而且一旦网页的布局稍有变化,就会变得毫无用处。
VibeScrape 旨在自动化编写这类代码的过程。
1. 获取渲染后的 HTML——与浏览器看到的视图相同。
2. 让 LLM 从 HTML 中提取数据到您的目标 JSON 模式(“真实数据”)。
3. 生成 Python 抓取器代码以重现该“真实数据”输出。
4. 运行并将结果与真实数据进行比较。
5. 自动优化代码,直到输出匹配。
我发现让 LLM 完全控制代码生成和迭代过程的方式,对于我测试过的许多网站生成有效的抓取器代码效果很好!
不过,它在处理分页、验证码、无限滚动等方面仍然存在一些限制。希望能从 HN 社区获得一些早期反馈,看看这个工具是否有价值。网站上有一个促销代码 FIRST5,可以让您免费获得 5 个积分,但我也很乐意给任何联系我(contact@vibescrape.ai)的人提供更多积分!
谢谢!