我创建了Platter,旨在帮助独立创始人和独立开发者在X/Twitter上增长他们的受众,而无需花费数小时手动滚动和回复。
这个想法很简单:
- 它构建了你声音、产品和兴趣的数字化档案
- 它找到高价值的推文,让你可以提供有价值的回复
- 它帮助你用自己的语气轻松撰写深思熟虑的回复,只需点击一下
这不是一个Chrome扩展程序。你可以在任何地方参与互动,甚至在手机上。我之所以制作这个工具,是因为我发现社交增长虽然必要,但却很耗费精力。
我非常希望能听到社区的反馈,特别是那些在构建过程中努力增长的人。
返回首页
最新
嗨,HN,
我正在开发一个名为 QSS(量化相似性搜索)的向量搜索引擎。它是用 C 语言编写的,探索了将嵌入向量积极量化到每个维度 1 位的想法。它使用 XOR 和 popcount 进行快速近似搜索,然后通过对原始向量使用余弦相似度进行重新排序。
主要目标是看看在不牺牲太多搜索质量的情况下,量化可以推进到什么程度,同时在内存使用和速度上获得显著提升。
工作原理
嵌入被量化为每个维度 1 位(例如,300D → 300 位 → ~40 字节)。
搜索使用按位 XOR 和 popcount(汉明距离)进行。
短名单使用原始(浮点)嵌入的余弦相似度进行重新排序。
支持 GloVe、Word2Vec 和 fastText 格式。
目标
分析量化与搜索精度之间的权衡。
测量潜在的速度和内存提升。
探索这种方法在更大数据集上的扩展性。
初步测试
到目前为止,我只进行了几次小规模测试,但早期迹象令人鼓舞:
对于一些查询(例如“hello”,“italy”),前 30 个结果与全精度余弦搜索匹配。
在 Word2Vec 嵌入上,量化管道比标准余弦相似度循环快了多达 18 倍。
这些结果目前只是个案,我分享这个项目是希望在深入基准测试之前获得反馈。
其他说明
目前词查找是线性且未优化的,重点在于相似性搜索逻辑。
测试是在 2018 年的 iMac(3.6 GHz Intel i3)上单线程进行的。
如果你对向量搜索、量化或低级性能技巧感兴趣,我很想听听你的想法:
你认为这种激进的量化方法能在大规模应用中奏效吗?
还有其他你推荐探索的快速近似搜索技术吗?
项目仓库在这里:https://github.com/buddyspencer/QSS
感谢阅读!
嘿,HN!
我创建了 TNX API,使得与数据库的交互像用简单英语提问一样简单。
它的功能:
- 你写一个自然语言的提示(例如:“列出价格超过 20 美元的产品”)
- 我们的系统将其转换为 SQL 并执行
- 你会得到实际的结果,且可以选择可视化展示
- 你的数据保持私密——没有任何存储,AI 不会看到数据,API 在回复后立即忘记
我为什么要做这个:
为日常问题编写 SQL 对许多团队来说仍然是一个障碍。我希望有一个以隐私为首的、即插即用的 API,能够直接处理自然语言。TNX 不仅仅是翻译——它执行查询并返回实际答案(而不仅仅是 SQL)。
示例:
- 你问:“今年按产品类别的总销售额是多少?”
→ TNX 回复:[家具:$43,000,电子产品:$12,000] + “需要这个的图表吗?”
- 你问:“哪些客户在过去 90 天没有下单?”
→ TNX 回复客户的姓名或 ID,并提供后续操作的选项
注意事项:
- 基于现代 AI 模型(小巧且快速)
- 无需发送完整的数据库转储——只需元数据/配置 + 实时访问
- 易于 API 集成
- (额外提示:如果你感兴趣,我可以为你处理设置和定制)
试试看:
[https://www.tnxapi.com/UI/login.php](https://www.tnxapi.com/UI/login.php)
(用户名:“hi@tnxapi.com”,密码“1”(这样更难忘记))
(示例提示:
- “请给我 ID 为 20 的产品的名称、简短描述和价格。” 或
- “请列出 ID 从 10 到 20 的所有产品价格。” 然后
- “请列出 ID 从 10 到 20 的所有产品价格。”(我为这个测试复制了一些数据库,抱歉数据是德语的 xd))
祝好,
拉斯·特拉曼
(随时可以联系 hi@tnxapi.com :))