返回首页
最新
上个月我在纽约走动时遇到了一些小雨,注意到大约一半的人都撑着伞。当几分钟后雨势加大时,这个数字接近80%。<p>这让我想到可以以某种方式来追踪这个现象,于是我搭建了一个网站!我正在进行人行道的实时直播,将其输入到YOLO模型中进行人群追踪,然后将每个检测到的人的画面发送到Gemini 2.0 Flash,它会返回关于每个人的服装以及他们是否撑着伞的结构化JSON数据。我还很享受让这个网站看起来像一个电视天气频道的过程。<p>我向一些朋友展示了这个项目,有人提到传奇的《Tasks》xkcd漫画(<a href="https://xkcd.com/1425" rel="nofollow">https://xkcd.com/1425</a>)现在已经过时了。如果你想检查一张照片中是否有鸟(或者某人是否撑着伞),你只需向一个廉价的视觉模型请求JSON数据即可。
嗨,HN!我们是Adit和Raunak,Reducto的联合创始人(YC W24,<a href="https://reducto.ai">https://reducto.ai</a>)。Reducto将非结构化文档(例如PDF、扫描件、电子表格)转换为结构化数据。这些数据可以用于检索、传递给大型语言模型(LLMs),或在后续的应用中使用。
我们创办Reducto是因为意识到当今许多AI应用需要高质量的数据。大家都知道,良好的输入会带来更好的输出,但全球80%的数据仍然被困在杂乱的PDF和电子表格中。Raunak和我推出了一个非常早期的最小可行产品(MVP),用于解析和提取非结构化文档中的信息,并且很幸运地吸引了许多技术团队的关注,因为他们发现我们的准确性是他们之前未见过的。
我们最初只是发布了一个API供工程师使用,但随着时间的推移,我们意识到一个准确的API只是解决方案的一部分。我们的客户希望能够轻松设置多步骤的数据处理管道,评估和迭代他们使用案例中的性能,并与参与实际文档处理流程的非工程团队成员合作。
这就是我们推出Reducto Studio的原因,这是一个基于我们API的网络平台,用户可以在其上构建和迭代端到端的文档处理管道。
通过Studio,您可以:
- 上传整个文件集,并获得针对评估数据的每个字段和每个文档的准确性评分。
- 自动生成并持续优化提取方案,以快速达到生产级质量。
- 保存每次运行,迭代解析/提取配置,并进行并排比较结果。
您可以在这里查看一些示例(<a href="https://studio.reducto.ai">https://studio.reducto.ai</a>),或者观看这个演示视频:<a href="https://www.loom.com/share/b243551741c642c6a594c00353fcecb3" rel="nofollow">https://www.loom.com/share/b243551741c642c6a594c00353fcecb3</a>。
如果您想上传自己的文档,可以登录并进行上传——我们不要求您预约演示或支付费用来试用。
感谢您的阅读和关注!这只是Studio的第一步,我们非常希望能收到关于任何方面的反馈:用户体验的粗糙之处(我们知道这些问题存在!)、能让评估更好的功能、您在处理困难文档时遇到的问题,或任何其他与非结构化数据处理相关的内容。