嗨,HN!我开发了 Bank Parser 来解决注册会计师面临的一个问题:将旧的 Chase 和美国银行对账单导入 QuickBooks。
Chase 的 CSV 下载限制为 18 个月。对于超过 5 年的历史数据,注册会计师需要手动输入交易(每个对账单需要 45-60 分钟)。
通用的 PDF 转换器(如 Tabula、PDFTables)在处理银行对账单时失败,原因包括:
- 同一年内有多种格式(2024 年的 Chase v2 和 v3)
- 某些 PDF 中没有一致的标题
- 需要启发式列检测
我的解决方案:
- 基于结构的格式检测(而非基于年份)
- 对于没有标题的 PDF 进行启发式列推断
- 在 70 多个 PDF 上测试准确率达到 99%
- 适用于 QuickBooks 的 16 字段格式
技术栈:Node.js、pdfjs-dist(Mozilla PDF.js)、TypeScript、Bull 队列。
免费试用:200 次操作(3-4 个对账单)。
希望能听到任何与金融数据或 PDF 解析相关的反馈!
返回首页
最新
我构建了“生活记忆动态”(Living Memory Dynamics,LMD),这是一个用于在嵌入空间中直接模拟生物启发的“生活”情节记忆的Python框架——核心动态不需要外部的大型语言模型(LLM)。
记忆像生物实体一样随时间演变:它们具有代谢能量状态(生动→活跃→休眠→消退→幽灵)、情感轨迹和共鸣场,使得它们能够相互影响。核心部分是我推导出的一个新微分方程(约书亚·R·托马斯记忆方程),驱动连续时间演化:
dM/dt = ∇φ(N) + Σⱼ Γᵢⱼ R(vᵢ, vⱼ) + A(M, ξ) + κη(t)
这使得涌现行为成为可能:自动叙事弧(设定→冲突→高潮→解决)、通过四个运算符(类比转移、流形行走、正交组合、空洞外推)实现创造性飞跃,以及层次化的思想嫁接。
关键点:
- 纯向量操作(PyTorch + 可选的Triton CUDA内核以提高速度)
- 可选的轻量级语言基础,使用句子变换器
- 可通过pip安装:pip install living-memory-dynamics(附加语言/CUDA/全部功能)
- 在消费级硬件上的基准测试显示,数十个记忆的实时演化
这个项目非常新(昨天发布),我很快会提交到arXiv(正在等待推荐)。完整的研究论文和数学内容在仓库文档中。
希望得到反馈——尝试这些示例,并告诉我它为你生成了什么样的叙事或想法!
GitHub: [https://github.com/mordiaky/LMD](https://github.com/mordiaky/LMD)
PyPI: [https://pypi.org/project/living-memory-dynamics/](https://pypi.org/project/living-memory-dynamics/)
我们都经历过这样的情况:你构建了一个不错的计算器或产品逻辑,然后在它投入生产时庆祝。然而,几个月后,你却无法回答一个简单的问题,比如“为什么在计算总额之前要应用16%的税率?”等等。
- 你无法快速调整逻辑或计算,而不进行重构。或者仅仅重新排序计算步骤就需要花费很长时间。
- 更糟糕的是,只有特定的工程师或关键人员能够解释这个计算器或服务逻辑的工作原理。
我们正在寻找一个简单的低代码规则引擎,拥有简单的用户界面,但到目前为止,我们还没有找到合适的选项。如果有更好的替代方案,请指教。
为了应对这个问题,我构建了一个轻量级的规则引擎,以便在不重新部署后端服务的情况下,改变业务逻辑(定价、验证、状态管理)。
BaaS - 业务逻辑即服务
这个引擎作为一个Docker容器运行,并评估在应用代码之外定义的规则。它使用REST API。我们的目标是使决策逻辑明确、可验证,并能够在技术用户和非技术用户之间进行讨论。
Docker Hub: [https://hub.docker.com/r/zeguru/baas](https://hub.docker.com/r/zeguru/baas)
欢迎提出任何问题或解释设计权衡。