返回首页
最新
几年前,美国的软件公司遭受了重创,因为国税局停止允许软件开发费用的税前扣除。现在,这些费用必须在数年内进行摊销。
Hacker News(HN)对此进行了多次讨论,包括几天前的文章《税法中的定时炸弹正在推动大规模科技裁员》 - [链接](https://news.ycombinator.com/item?id=44180533) - (927条评论)。其他相关讨论可以在[这里找到](https://news.ycombinator.com/item?id=44203869)。
目前有一项重大努力希望能够推翻这一改变。参与此项工作的人员之一是YC的Luther Lowe([链接](https://news.ycombinator.com/user?id=itsluther))。Luther一直在组织YC校友,敦促立法者支持这一推翻。我问他是否可以在Hacker News上也进行此项活动。他表示可以——因此才有了这个讨论主题 :)
如果您是美国纳税人,并且同意软件开发费用应该像以前一样可扣除,请签署这封信,寄给相关委员会成员:[链接](https://docs.google.com/forms/d/1DkRGeef2e_tU2xf3TyEyd2JLlmZH8sGs6hhuVkokgpw/viewform?edit_requested=true)。
(如果您不是美国公民,请不要签署这封信,因为立法者只会听取纳税人的反馈,我们不希望稀释这一信号。)
我相信并不是所有人都同意我们的看法——HN是一个庞大的社区,任何事情都没有完全一致的意见——但在这个问题上,HN的社区共识接近一致,因此我认为我们也应该表达我们的声音。
Luther会在这里回答问题,希望HN能够为推动这一事项的完成做出贡献!
人们使用什么API或软件进行转录?如果是远程API,希望它快速、便宜,并且支持摘要功能。Groq看起来不错,因为它似乎支持音频文件的远程URL,这正是我所希望的。如果是本地解决方案,需要能够在基础的M4 mini上运行。我正在考虑llamafile/whisperfile,因为我希望能够通过命令行批量处理,或者将其用作本地API/服务器。
我开发了一个小应用,可以让你为手表设置“启动按钮”。这些按钮可以通过 webhook 部署、ping 一个 URL 或执行其他与 HTTP 请求相关的操作。你可以自定义按钮的颜色、标签、标题等。对于没有手表的人,这个应用在手机上也能正常使用。
我是在拥有一块只能告诉我时间的无用手表之前开发这个应用的,尽管它还提醒我需要站起来,尽管这样可能会危及我的生命(房间里有天花板尖刺)。我曾想过如何像巴克·罗杰斯那样生活,直到我意识到其实是迪克·特雷西在做这些事情,不过差不多。
你可以在这里获取这个应用:<a href="https://wristoff.com" rel="nofollow">https://wristoff.com</a>,或者直接从App Store下载:<a href="https://apps.apple.com/us/app/wrist-off/id6745457315">https://apps.apple.com/us/app/wrist-off/id6745457315</a>。
我在WWDC上进行了现场发布,那个时候它吸引了很多观众的注意,详情请见:<a href="https://bsky.app/profile/darkpie.bsky.social/post/3lr6r4tr2322q" rel="nofollow">https://bsky.app/profile/darkpie.bsky.social/post/3lr6r4tr23...</a>。
如果你有任何反馈,请告诉我。我希望这个应用既有趣又实用,但如果不能同时满足这两点,那就都不行。再见!
大家好!我们是 Shreyash 和 Bhavnick。我们正在开发 Chonkie(<a href="https://chonkie.ai">https://chonkie.ai</a>),一个用于数据分块和嵌入的开源库。
Python 版本:<a href="https://github.com/chonkie-inc/chonkie">https://github.com/chonkie-inc/chonkie</a>
TypeScript 版本:<a href="https://github.com/chonkie-inc/chonkie-ts">https://github.com/chonkie-inc/chonkie-ts</a>
这里有一个展示我们代码分块器的视频:<a href="https://youtu.be/Xclkh6bU1P0" rel="nofollow">https://youtu.be/Xclkh6bU1P0</a>。
Bhavnick 和我已经用大语言模型(LLMs)构建个人项目几年了。在这段时间里,我们发现自己经常需要编写自己的分块逻辑来支持 RAG 应用程序。我们常常犹豫使用现有的库,因为它们要么功能简单,要么显得过于臃肿(有些库超过 80MB)。
我们构建 Chonkie 的目标是轻量、快速、可扩展且易于使用。这个领域发展迅速,我们希望 Chonkie 能够快速支持最新的策略。目前我们支持:令牌分块、句子分块、递归分块、语义分块,以及:
- 语义双重分块:首先对文本进行语义分块,然后合并紧密相关的块。
- 代码分块:通过创建抽象语法树(AST)并找到理想的分割点来分块代码文件。
- 延迟分块:基于论文(<a href="https://arxiv.org/abs/2409.04701" rel="nofollow">https://arxiv.org/abs/2409.04701</a>),从嵌入较长文档中导出块嵌入。
- Slumber 分块:基于“Lumber Chunking”论文(<a href="https://arxiv.org/abs/2406.17526" rel="nofollow">https://arxiv.org/abs/2406.17526</a>)。它使用递归分块,然后由 LLM 验证分割点,旨在以减少令牌使用和 LLM 成本的方式生成高质量的块。
您可以在我们的基准测试中查看 Chonkie 与 LangChain 和 LlamaIndex 的比较:<a href="https://github.com/chonkie-inc/chonkie/blob/main/BENCHMARKS.md">https://github.com/chonkie-inc/chonkie/blob/main/BENCHMARKS....</a>
关于 Chonkie 包的一些技术细节:
- 默认安装约 15MB,而某些替代品则在 80-170MB 之间。
- 在我们的测试中,令牌分块速度比 LangChain 和 LlamaIndex 快多达 33 倍。
- 与主要的分词器(transformers、tokenizers、tiktoken)兼容。
- 基本功能零外部依赖。
- 实现了积极的缓存和预计算。
- 使用运行均值池化进行高效的语义分块。
- 模块化依赖系统(仅安装所需的部分)。
除了分块,Chonkie 还提供了一种简单的方式来创建嵌入。对于支持的提供者(SentenceTransformer、Model2Vec、OpenAI),您只需将模型名称作为字符串指定。您还可以为其他提供者创建自定义嵌入处理程序。
目前 RAG 仍然是最常见的用例。然而,Chonkie 生成的块经过优化,适用于创建高质量的嵌入和向量检索,因此并不完全依赖于 RAG 的“生成”部分。事实上,我们看到越来越多的人使用 Chonkie 来实现语义搜索和/或为代理设置上下文。
我们目前专注于构建集成,以简化检索过程。我们创建了“握手”——与 pgVector、Chroma、TurboPuffer 和 Qdrant 等向量数据库交互的轻量函数,使您能够轻松与存储进行交互。如果您希望看到某个集成(无论是向量数据库还是其他),请告诉我们。
我们还提供托管和本地版本,包含 OCR、额外的元数据、所有嵌入提供者,以及为希望拥有完全托管管道的团队管理的向量数据库。如果您感兴趣,请通过 shreyash@chonkie.ai 联系我们或预约演示:<a href="https://cal.com/shreyashn/chonkie-demo" rel="nofollow">https://cal.com/shreyashn/chonkie-demo</a>。
我们期待您的反馈和评论!谢谢!
嗨,HN,
在过去的几年里,我对机器学习的兴趣逐渐加深。鉴于这里的许多人可能也有同样的感受,我想分享一个我正在进行的项目:glowstick,它利用类型导向的元编程在Rust的类型系统中跟踪张量的形状,并在编译时确定哪些操作是被允许的,哪些是不被允许的。
我发现Rust在机器学习应用方面有很多优势,但在运行时才发现与形状相关的问题感觉有些奇怪,因为在开发过程中我通常并不会频繁运行代码。考虑到Rust提供了丰富的类型,我决定尝试利用这些类型来解决这个问题。
我为我最常用的两个机器学习框架——candle和burn,添加了集成库,并提供了使用类型化形状实现llama 3.2的示例,涵盖了模型内部和推理循环的大部分内容。目前,静态和动态维度的混合应该能够很好地支持大多数应用,尽管当然还有改进的空间。
欢迎任何反馈!
我在我的业务中使用 Google Workspace,刚收到 Google 的一封邮件,通知我他们将提高价格。他们提到的原因是:
> 更新后的订阅价格反映了显著增加的人工智能价值,以及我们为 Google Workspace 版本引入和即将推出的许多新功能。
我分享这个的原因是希望能劝阻其他公司和产品创作者走上这条路。我并不想使用他们新增的人工智能功能。从我的角度来看,他们通过添加干扰性的弹窗来强迫我使用我并不需要的人工智能功能,实际上让他们的产品变得更糟,而现在他们还要为此向我收费。
我一直在重新思考我的个人知识管理系统,并意识到我的工作流程正在变得以人工智能为主。现在,我的大多数项目和想法都是从与Claude/ChatGPT的对话开始的,但随后我会切换到Obsidian进行结构化笔记。这造成了一定的摩擦——我的思维过程分散在不同的工具之间。
你是选择“在笔记应用中添加人工智能”,还是“在人工智能应用中添加结构”?
我很好奇其他人是否也在考虑这个问题,以及他们是如何处理的。
大多数反馈工具的设计就像人们真的想要报告bug一样。其实并不是。除非你把这个过程简化到极致,或者更好的是,做得有点趣味性。
在推出了几个SaaS产品后,我注意到一个模式:有bug?有的。bug报告?没有。
这并不是因为用户不在乎,而是因为报告bug通常是一种糟糕的体验。
大多数工具希望用户:
* 填写一份冗长的表单
* 输入他们的电子邮件
* 描述一个他们几乎不理解的bug
* 可能还要登录或创建一个账户
* 然后或许才能提交
说实话:没有人会这样做。尤其是那些只是想使用你产品的人。
所以我开发了Bugdrop.app——这是一个可拖动的小虫子图标,用户可以直接拖到问题上,写下简短的备注,就完成了。无需登录,无需表单。只是提供了上下文丰富的反馈,供你的团队实际使用——包括截图、浏览器信息,甚至在遇到错误时的控制台日志。
奇怪的是?人们真的在使用它。即使是非技术用户也会点击它,仅仅因为“这个小虫子看起来很有趣”。
我并不想再开发一个“反馈套件”。我只想要一些轻量级、快速,并且简单到让人们愿意实际报告问题的工具。如果你曾经遇到过用户说“有东西坏了”,然后就再也没有消息,你可能会理解我的想法。
我最自豪的是什么?人们真的在使用它。而他们的用户?他们也在实际报告问题。即使是非技术用户。
我很想听听你是否遇到过类似的问题,以及这是否感觉像是能在你自己的项目中提供帮助的东西。我并不是想卖给你什么——只是分享我为满足自己需求而开发的东西。