返回首页
最新
嗨,HN,
我们是 Shreyash 和 Bhavnick。我们开发了 Chonkie,这是一个用于文本和代码的高级分块和嵌入的开源库。之前它仅支持 Python,但我们刚刚发布了 TypeScript 版本: [https://github.com/chonkie-inc/chonkie-ts](https://github.com/chonkie-inc/chonkie-ts)
许多基于 JS/TS 的 AI 项目(例如使用 Vercel 的 AI SDK 或 Mastra 的项目)依赖于基本的文本分割器。但更好的分块意味着更好的检索,进而带来更好的性能。这正是 Chonkie 的设计初衷。
当前的原生分块器(在 TS 中):
- 代码分块器 – 处理 Python、TypeScript 等语言
- 递归分块器 – 基于规则的层次分割
- 令牌分块器 – 按令牌数量分割(完全可定制)
- 句子分块器 – 在句子边界处分割。分隔符可定制,因此适用于多种语言。
所有分块器都支持自定义令牌化器、分块重叠、分隔符等功能。
即将推出的原生 TS 功能(通过 API 客户端已可用):
- 语义分块器 – 在检测到意义变化时分割文本。
- SDPM 分块器 – 合并语义上相似的非重叠块
- 晚期分块器 – 为每个块生成上下文感知的嵌入
- 睡眠分块器 – LLM 精炼的递归块。显著减少令牌使用(从而降低成本),同时最大化块的质量。
- 嵌入精炼器 – 使用任何嵌入模型嵌入块
- 重叠精炼器 – 在连续块之间创建重叠,以更好地保留上下文。
Chonkie 是免费的、开源的,并且采用 MIT 许可证。GitHub: [https://github.com/chonkie-inc/chonkie-ts](https://github.com/chonkie-inc/chonkie-ts)
我们非常欢迎您的反馈、想法或贡献。谢谢!
在当今竞争激烈的环境中,传统餐饮运营如果不进行数字化转型,将难以维持可持续发展。缺乏集成系统、有限的数字营销以及完全没有自动化,会导致运营效率低下和收入机会的流失。因此,我为餐饮行业构建了一个完整的端到端自动化解决方案。
作为一个技术人员,我在销售方面没有任何经验,我应该采取什么理想的方法来启动我的销售流程?
期待向一些专家学习。
DoubleMemory 最初是一个实验,旨在看看我是否能以某种方式自动保存所有双击 cmd + c 的内容,因为我经常本能地这样做,这样我就不需要扩展程序来将链接和文本保存到应用中,同时避免像常规剪贴板管理器那样淹没捕获历史记录。
我的动机并不是创建一个稍后阅读的应用,但在过去六个月中,它演变成了一个独特而又统一的稍后阅读 + 书签组织器 + 剪贴板管理器 + 基于卡片的笔记应用。它还可以通过菜单栏快捷方式启动,并使用键盘快捷键进行导航。我最喜欢的部分是,与其呈现一系列文章标题,不如将所有内容以漂亮的预览卡片形式呈现,营造出一种半透明的 Pinterest 风格的灵感板。它还有一个巧妙的 iOS 应用,可以让你像在 iOS Safari 上一样,用拇指在文章之间滑动。
现在 Pocket 正在关闭,这在 Instapaper 回归独立、Omnivore、UpNext 以及多年来的众多其他服务关闭之后发生。这些都是云托管服务,这让我反思:也许这种以本地优先的架构在这个领域会有很好的发展空间。
以下是我不那么科学的比较:
## 域名
$10 与 $1M = 100,000 倍的差异。
## 服务器运行成本
除了 iCloud 运行的服务器外没有其他服务器 vs 每年 $1M = 1 倍的差异。
## 平台
仅限 Apple(Mac + iPhone + iPad) vs 多平台(支持 Windows、Linux、Android)= 20 倍的维护成本差异。
## 捕获
无需浏览器扩展 vs 维护各种浏览器和扩展商店的所有扩展 = 5 倍的差异。
## 架构
应用接收链接,Apple 为成千上万种不同类型的链接生成丰富的预览卡片,应用缓存这些预览卡片。
vs.
有人为每种链接类型或使用 Open Graph 编写一些自定义代码,一位设计师创建了一个适用于所有链接的通用卡片。
=
100 倍的成本差异。
我知道,Apple 正在对剪贴板施加更多限制,这基本上是在 Mac 系统上共享的全局状态,DoubleMemory 也支持其他捕获方式:拖放到应用/菜单栏图标/应用图标,右键点击 -> 服务菜单,或分享面板。我们将添加更多自动导入功能。
此外,我还为 Pocket、Omnivore 和 ReadWise 编写了一些导入器,详情请见:<a href="https://doublememory.com/posts/tools" rel="nofollow">https://doublememory.com/posts/tools</a>
应用中的所有内容都是免费的,没有限制。捕获实际上是第 0 步。你给我们机会保存你的内容,并不意味着你会从中获得任何价值(这不就是稍后阅读应用的典型故事吗?保存了却从未阅读)。最终目标是轻松检索这些内容,并最终消费它们。我希望最终推出与这些价值生成工作流程相一致的付费功能。
App Store 链接:<a href="https://apps.apple.com/us/app/doublememory/id6737529034">https://apps.apple.com/us/app/doublememory/id6737529034</a>
让我知道你的想法……
你好,我想展示一个我用人工智能帮助制作的简历网站生成器。它可以自定义并生成一个静态的HTML页面,可以在任何地方托管。由于Tebas的原因,我不得不手动上传到GitHub,因为在西班牙GitHub无法使用。