1作者: insane_dreamer大约 1 个月前原帖
在一份通讯中看到这张图表,令我颇感惊讶:美国的调查响应率低于70%,而2013年时超过90%。我认为这是“技术进步”以及如今沟通便利的一个有趣且负面的副作用。我们被信息淹没,只想关闭一切。更不用说无休止的垃圾电话(我不接任何不在我通讯录中的号码,因此调查员无法联系到我)。 这是一个严重的问题,因为如果调查响应率低,就会增加数据的误差范围,同时也意味着政府与公民之间的沟通减少了。 有一篇论文探讨了(部分)原因。 根据这篇文章,英国也面临同样的问题。 人工智能只会让这个问题更加严重,因为它使得在没有人参与的情况下发起垃圾电话变得更加容易。
2作者: arnaudbd大约 1 个月前原帖
嗨,HN!我一直在开发一个工具,将文件浏览器、白板、书签、笔记和简单的图形设计合并到一个轻量级的界面中。 这个想法是让所有这些工具感觉像是一个流畅的空间,而不是五个独立的工具。希望能够复制出一个物理桌面的感觉:在这里,秩序与自由共存。 这段15分钟的视频介绍了当前的alpha版本以及完整产品的愿景:<a href="https:&#x2F;&#x2F;youtu.be&#x2F;AcWzuBBuiPM" rel="nofollow">https:&#x2F;&#x2F;youtu.be&#x2F;AcWzuBBuiPM</a> 我非常希望听到你的反馈,特别是在概念和用户体验方面。如果你想尝试,alpha版本已经上线:<a href="https:&#x2F;&#x2F;gyst.fr" rel="nofollow">https:&#x2F;&#x2F;gyst.fr</a> 目前这是一个个人项目,灵感来自“第二大脑”/个人知识管理(PKM)运动,以及我对工具碎片化和过时用户体验的个人挫败感。
13作者: kbyatnal大约 1 个月前原帖
大家好!我们是Kushal和Eli,Extend的联合创始人(<a href="https://www.extend.ai">https://www.extend.ai</a>)。Extend是一个工具包,旨在帮助人工智能团队处理各种复杂文档(例如PDF、图像、Excel文件),并构建出色的产品。 我们创建Extend是为了应对那些会破坏大多数处理流程的复杂文档。您可以在我们的演示中看到一些示例(无需注册):<a href="https://dashboard.extend.ai/demo">https://dashboard.extend.ai/demo</a>。 我知道您可能会想“又一个文档API初创公司”。不幸的是,这个问题仍然没有得到解决! 我个人在之前的工作中花了几个月的时间来构建可靠的文档处理流程。各种边缘案例层出不穷——跨页的大型表格、超过100页的文件、潦草的手写、涂鸦的签名、以10种不同格式表示的复选框、多种文件类型……这个列表还在不断延续。在我们与YC的其他团队交流时,看到他们也遇到同样的问题,我们决定开始构建Extend。 我们最初推出了一套API,供工程师解析、分类、拆分和提取文档。这一功能开始受到欢迎,很快我们就在一些公司中投入生产,涉及的领域包括医疗代理、实时银行账户开户、抵押贷款自动化等。随着时间的推移,我们与这些团队紧密合作,亲眼目睹了原始OCR/模型输出与生产就绪流程之间的巨大差距(LLM和VLM并不是魔法)。 与该领域的其他解决方案不同,我们专注于三个核心领域:(1)计算机视觉层,(2)LLM上下文工程,以及(3)周边产品工具的构建。我们认为,三者的结合是实现99%准确率并在规模上保持这一水平所必需的。 例如,为了解析潦草的手写,我们构建了一个代理OCR校正层,利用VLM来审查并修正低置信度的OCR错误。为了处理多页表格数据,我们开发了一个语义分块引擎,可以检测文档中的最佳边界,使模型能够在较小的上下文输入下表现出色。 我们还推出了一个提示优化代理,旨在自动化团队在提示工程中花费大量时间的“打地鼠”工作。它作为一个后台代理,模拟团队中最佳的提示者,并在循环中运行,访问一系列工具(查看文件、进行评估、分析结果和更新模式)。 整个经历中最令人惊讶的部分是我们发现了如此多奇怪的PDF格式!我们遇到过从超市库存杂志、农药标签、建筑蓝图到卫星制造计划的各种文件。 以上所述的所有功能现在都已上线。您可以在这里查看实际效果(无需注册):<a href="https://dashboard.extend.ai/demo">https://dashboard.extend.ai/demo</a>。要上传您自己的文件,可以登录并进行操作(我们正在为今天注册的所有账户添加免费使用积分)。 我们很高兴能与HN分享这一切!我们希望听到您在构建文档处理流程方面的经验。请尝试一下,并与我们分享任何反馈(例如,未能处理的复杂文档、功能请求)。