2作者: weatherfused8 个月前原帖
在过去的四年里,我一直在开发Skyformer,包括制作所有的艺术作品。其技术特点包括: - 使用OpenGL进行图形渲染,使用OpenAL进行声音处理,使用GLFW处理输入 - 地形渲染采用受REDengine 3启发的技术,并配有自定义的地形/世界编辑器 - 支持TCP和自定义二进制协议的网络框架,以实现合作模式 - 即时模式用户界面框架,SDF文本渲染 - 级联阴影映射,带有柔和阴影 - 天气模拟(使用我自己的虚拟物理) - 动态天空穹顶 - 基于Gerstner波的水面效果 - 扫掠球体碰撞检测与响应 - 软粒子/透明效果 - 上帝光束 - 草地渲染 - FXAA、SSAO、辉光效果 - 等等 如果您有任何问题或反馈,请随时告诉我。谢谢!
140作者: dang8 个月前原帖
几年前,美国的软件公司遭受了重创,因为国税局停止允许软件开发费用的税前扣除。现在,这些费用必须在数年内进行摊销。 Hacker News(HN)对此进行了多次讨论,包括几天前的文章《税法中的定时炸弹正在推动大规模科技裁员》 - [链接](https://news.ycombinator.com/item?id=44180533) - (927条评论)。其他相关讨论可以在[这里找到](https://news.ycombinator.com/item?id=44203869)。 目前有一项重大努力希望能够推翻这一改变。参与此项工作的人员之一是YC的Luther Lowe([链接](https://news.ycombinator.com/user?id=itsluther))。Luther一直在组织YC校友,敦促立法者支持这一推翻。我问他是否可以在Hacker News上也进行此项活动。他表示可以——因此才有了这个讨论主题 :) 如果您是美国纳税人,并且同意软件开发费用应该像以前一样可扣除,请签署这封信,寄给相关委员会成员:[链接](https://docs.google.com/forms/d/1DkRGeef2e_tU2xf3TyEyd2JLlmZH8sGs6hhuVkokgpw/viewform?edit_requested=true)。 (如果您不是美国公民,请不要签署这封信,因为立法者只会听取纳税人的反馈,我们不希望稀释这一信号。) 我相信并不是所有人都同意我们的看法——HN是一个庞大的社区,任何事情都没有完全一致的意见——但在这个问题上,HN的社区共识接近一致,因此我认为我们也应该表达我们的声音。 Luther会在这里回答问题,希望HN能够为推动这一事项的完成做出贡献!
16作者: indigodaddy8 个月前原帖
人们使用什么API或软件进行转录?如果是远程API,希望它快速、便宜,并且支持摘要功能。Groq看起来不错,因为它似乎支持音频文件的远程URL,这正是我所希望的。如果是本地解决方案,需要能够在基础的M4 mini上运行。我正在考虑llamafile/whisperfile,因为我希望能够通过命令行批量处理,或者将其用作本地API/服务器。
3作者: var_ww_egg8 个月前原帖
我开发了一个小应用,可以让你为手表设置“启动按钮”。这些按钮可以通过 webhook 部署、ping 一个 URL 或执行其他与 HTTP 请求相关的操作。你可以自定义按钮的颜色、标签、标题等。对于没有手表的人,这个应用在手机上也能正常使用。 我是在拥有一块只能告诉我时间的无用手表之前开发这个应用的,尽管它还提醒我需要站起来,尽管这样可能会危及我的生命(房间里有天花板尖刺)。我曾想过如何像巴克·罗杰斯那样生活,直到我意识到其实是迪克·特雷西在做这些事情,不过差不多。 你可以在这里获取这个应用:<a href="https://wristoff.com" rel="nofollow">https://wristoff.com</a>,或者直接从App Store下载:<a href="https://apps.apple.com/us/app/wrist-off/id6745457315">https://apps.apple.com/us/app/wrist-off/id6745457315</a>。 我在WWDC上进行了现场发布,那个时候它吸引了很多观众的注意,详情请见:<a href="https://bsky.app/profile/darkpie.bsky.social/post/3lr6r4tr2322q" rel="nofollow">https://bsky.app/profile/darkpie.bsky.social/post/3lr6r4tr23...</a>。 如果你有任何反馈,请告诉我。我希望这个应用既有趣又实用,但如果不能同时满足这两点,那就都不行。再见!
26作者: snyy8 个月前原帖
大家好!我们是 Shreyash 和 Bhavnick。我们正在开发 Chonkie(<a href="https://chonkie.ai">https://chonkie.ai</a>),一个用于数据分块和嵌入的开源库。 Python 版本:<a href="https://github.com/chonkie-inc/chonkie">https://github.com/chonkie-inc/chonkie</a> TypeScript 版本:<a href="https://github.com/chonkie-inc/chonkie-ts">https://github.com/chonkie-inc/chonkie-ts</a> 这里有一个展示我们代码分块器的视频:<a href="https://youtu.be/Xclkh6bU1P0" rel="nofollow">https://youtu.be/Xclkh6bU1P0</a>。 Bhavnick 和我已经用大语言模型(LLMs)构建个人项目几年了。在这段时间里,我们发现自己经常需要编写自己的分块逻辑来支持 RAG 应用程序。我们常常犹豫使用现有的库,因为它们要么功能简单,要么显得过于臃肿(有些库超过 80MB)。 我们构建 Chonkie 的目标是轻量、快速、可扩展且易于使用。这个领域发展迅速,我们希望 Chonkie 能够快速支持最新的策略。目前我们支持:令牌分块、句子分块、递归分块、语义分块,以及: - 语义双重分块:首先对文本进行语义分块,然后合并紧密相关的块。 - 代码分块:通过创建抽象语法树(AST)并找到理想的分割点来分块代码文件。 - 延迟分块:基于论文(<a href="https://arxiv.org/abs/2409.04701" rel="nofollow">https://arxiv.org/abs/2409.04701</a>),从嵌入较长文档中导出块嵌入。 - Slumber 分块:基于“Lumber Chunking”论文(<a href="https://arxiv.org/abs/2406.17526" rel="nofollow">https://arxiv.org/abs/2406.17526</a>)。它使用递归分块,然后由 LLM 验证分割点,旨在以减少令牌使用和 LLM 成本的方式生成高质量的块。 您可以在我们的基准测试中查看 Chonkie 与 LangChain 和 LlamaIndex 的比较:<a href="https://github.com/chonkie-inc/chonkie/blob/main/BENCHMARKS.md">https://github.com/chonkie-inc/chonkie/blob/main/BENCHMARKS....</a> 关于 Chonkie 包的一些技术细节: - 默认安装约 15MB,而某些替代品则在 80-170MB 之间。 - 在我们的测试中,令牌分块速度比 LangChain 和 LlamaIndex 快多达 33 倍。 - 与主要的分词器(transformers、tokenizers、tiktoken)兼容。 - 基本功能零外部依赖。 - 实现了积极的缓存和预计算。 - 使用运行均值池化进行高效的语义分块。 - 模块化依赖系统(仅安装所需的部分)。 除了分块,Chonkie 还提供了一种简单的方式来创建嵌入。对于支持的提供者(SentenceTransformer、Model2Vec、OpenAI),您只需将模型名称作为字符串指定。您还可以为其他提供者创建自定义嵌入处理程序。 目前 RAG 仍然是最常见的用例。然而,Chonkie 生成的块经过优化,适用于创建高质量的嵌入和向量检索,因此并不完全依赖于 RAG 的“生成”部分。事实上,我们看到越来越多的人使用 Chonkie 来实现语义搜索和/或为代理设置上下文。 我们目前专注于构建集成,以简化检索过程。我们创建了“握手”——与 pgVector、Chroma、TurboPuffer 和 Qdrant 等向量数据库交互的轻量函数,使您能够轻松与存储进行交互。如果您希望看到某个集成(无论是向量数据库还是其他),请告诉我们。 我们还提供托管和本地版本,包含 OCR、额外的元数据、所有嵌入提供者,以及为希望拥有完全托管管道的团队管理的向量数据库。如果您感兴趣,请通过 shreyash@chonkie.ai 联系我们或预约演示:<a href="https://cal.com/shreyashn/chonkie-demo" rel="nofollow">https://cal.com/shreyashn/chonkie-demo</a>。 我们期待您的反馈和评论!谢谢!
14作者: bietroi8 个月前原帖
嗨,HN, 在过去的几年里,我对机器学习的兴趣逐渐加深。鉴于这里的许多人可能也有同样的感受,我想分享一个我正在进行的项目:glowstick,它利用类型导向的元编程在Rust的类型系统中跟踪张量的形状,并在编译时确定哪些操作是被允许的,哪些是不被允许的。 我发现Rust在机器学习应用方面有很多优势,但在运行时才发现与形状相关的问题感觉有些奇怪,因为在开发过程中我通常并不会频繁运行代码。考虑到Rust提供了丰富的类型,我决定尝试利用这些类型来解决这个问题。 我为我最常用的两个机器学习框架——candle和burn,添加了集成库,并提供了使用类型化形状实现llama 3.2的示例,涵盖了模型内部和推理循环的大部分内容。目前,静态和动态维度的混合应该能够很好地支持大多数应用,尽管当然还有改进的空间。 欢迎任何反馈!