3作者: kushal20487 天前原帖
大家好, 我想分享一个Okapi的早期预览,它是一个内存中的指标引擎,同时可以与现有的数据湖集成。现代软件系统产生了大量的遥测数据。虽然我们可以讨论这是否必要,但我们都可以同意,这种情况确实发生了。 目前大多数指标引擎使用专有格式来存储数据,并且不采用分离存储和计算的方式。Okapi通过利用开放数据格式并与现有数据湖集成,改变了这一现状。这使得可以使用标准的OLAP工具,如Snowflake、Databricks、DuckDB,甚至是Jupyter/Polars来运行分析工作流(例如异常检测),同时避免了两种方式的供应商锁定——您可以自定义工作流,并拥有可更换的计算引擎。分离存储也减少了维护自有存储的运维负担,计算引擎可以根据需求进行扩展或缩减。 不过,并非所有数据都可以存储在数据湖/对象存储中——这对于近期数据并不适用。为了简化实时查询,Okapi首先将所有指标数据写入内存存储,并从该存储中读取近期数据。指标在到达时会进行汇总,这有助于缓解内存压力。指标在内存中保存一个可配置的保留期,之后会被转移到对象存储/数据湖中(目前仅支持Parquet导出)。这允许对近期数据进行快速读取,同时将老旧数据的查询处理卸载出去。在基准测试中,内存数据的查询在一毫秒内完成,写入吞吐量约为每秒280,000个样本。在实际部署中,由于网络延迟,性能可能会有所不同。 Okapi仍处于早期阶段——欢迎反馈、批评和贡献。谢谢!
7作者: geemus7 天前原帖
从那些神秘的终端命令到无数种自我伤害的方式,我一直在使用TLS证书方面感到困难。我很喜欢Let’s Encrypt让获取证书变得如此简单(而且便宜),但仍然有很多问题需要解决。 这就是我们构建Relay的原因:一个免费的基于浏览器的工具,它简化了ACME工作流程,特别是对于像家庭实验室这样的复杂设置。Relay充当您的ACME客户端与公共证书颁发机构(如Let’s Encrypt)之间的安全中介。 Relay提供更好体验的一些方式包括: - 使用任何ACME客户端在几分钟内快速、简化地获取证书 - 一次性前置DNS委托,无需到处散布入站流量或DNS凭证 - 清晰了解整个ACME过程及续订提醒 现在就试试Relay吧: [https://anchor.dev/relay](https://anchor.dev/relay) 或者阅读我们的博客文章:[https://anchor.dev/blog/lets-get-your-homelab-https-certified](https://anchor.dev/blog/lets-get-your-homelab-https-certified) 请试试看(只需几分钟),并告诉我您的想法。
24作者: jafioti7 天前原帖
嗨,HN,我是乔。我的朋友马修、杰克和我正在开发Luminal(<a href="https://luminalai.com">https://luminalai.com</a>),这是一款用于自动生成快速GPU内核的GPU编译器,专为AI模型设计。它采用基于搜索的编译方法,以实现高性能。 我们从高层次的模型代码出发,比如在PyTorch中使用的代码,生成非常快速的GPU代码。我们并不使用大型语言模型(LLMs)或人工智能,而是将其视为一个搜索问题。我们的编译器构建了一个搜索空间,生成数百万个可能的内核,然后在其中进行搜索,以最小化运行时间。 您可以在Mac上尝试`demos/matmul`中的演示,看看Luminal如何将一个简单的操作(在我们的中间表示中由12个简单操作表示)编译为一个优化过的、支持张量核心的Metal内核。这里有一个视频展示了这个过程:<a href="https://youtu.be/P2oNR8zxSAA" rel="nofollow">https://youtu.be/P2oNR8zxSAA</a> 我们的方法与传统的机器学习库显著不同,因为我们提前编译所有内容,生成一个逻辑上等价内核的大搜索空间,并在其中搜索以找到最快的内核。这使我们能够利用“苦涩教训”完全自动地发现复杂的优化,如Flash Attention,而无需手动启发式方法。最好的规则就是没有规则,最好的启发式就是没有启发式,只需搜索所有可能。 我们正在努力将CUDA支持提升到与Metal相当的水平,增加搜索空间的灵活性,添加完整模型示例(如Llama),并增加一些非常特殊的硬件后端。 我们的目标是大幅简化机器学习生态系统,同时提高性能和硬件利用率。请查看我们的代码库:<a href="https://github.com/luminal-ai/luminal" rel="nofollow">https://github.com/luminal-ai/luminal</a>,我很想听听您的想法!
1作者: YuriBychkov7 天前原帖
地点:美国纽约,纽约州 远程工作:是 愿意搬迁:开放讨论 技术栈:React.js, Next.js, Node.js, Express, TypeScript, JavaScript, Python, Django, Flask, PostgreSQL, MySQL, MongoDB, Firebase, Supabase, Docker, GCP 简历: [https://yuribychkov15.github.io/my-portfolio/YURI%20BYCHKOV%20-%20RESUME.pdf](https://yuribychkov15.github.io/my-portfolio/YURI%20BYCHKOV%20-%20RESUME.pdf) 网站:[https://yuribychkov15.github.io/my-portfolio/](https://yuribychkov15.github.io/my-portfolio/) 电子邮件:yuribychkov15@gmail.com GitHub:[https://github.com/yuribychkov15](https://github.com/yuribychkov15) LinkedIn:[https://www.linkedin.com/in/yuri-bychkov/](https://www.linkedin.com/in/yuri-bychkov/) 你好,我是尤里——波士顿大学计算机科学专业的应届毕业生。我曾担任前端开发者和全栈工程师,为现实世界的客户构建响应式网页应用和自动化系统。我的项目涵盖了数据驱动的音乐分析到全栈校园应用,我渴望加入一个团队,在那里我可以运用我的技术技能并成长为一名软件工程师。
1作者: ieuanking7 天前原帖
嗨,HN!<p>大型人工智能一直未能满足学生的需求。学习模式和当前的聊天机器人并没有强化或培养批判性思维技能,使信息转化为知识。与ChatGPT或经典聊天机器人不同,我们专注于阅读、笔记和引用,同时你可以使用@[item_name](类似于光标)进行参考、记录和归档。<p>想象一下:谷歌学术 + ChatGPT + AI高亮工具 = Fiig<p>我们目前的用户喜欢Fiig,因为它提供了资源密集型和内容驱动的体验。Fiig让你可以访问庞大的学术资源库,或者你可以整合你上传的文件,进行全面且个性化的研究。快速搜索多个学术数据库中的相关论文和研究。上传并索引你的PDF文档。AI驱动的搜索结果相关性排名。可以按出版日期、作者或期刊进行筛选。<p>我们的独特之处在于:强大的AI注释工具。Fiig可以在任何上传或找到的PDF中逐行高亮。这对于草稿修订、引用收集和资料浏览非常有帮助。在与PDF聊天时,Fiig会根据添加的PDF中的信息进行上下文锁定,从而最大限度地减少幻觉现象,并且随着你做笔记和互动,围绕你需求的上下文意识会显著增强。<p>今天就试试Fiig吧 -- www.ubik.studio<p>欢迎并鼓励反馈。<p>我们正在开发EVALS和一个应用程序。稍后会给你们更新!(我们只有两个人,工作量大得惊人,哈哈)
6作者: glawrence137 天前原帖
嗨,HN——我们是乔治和亚历克斯,正在构建 Channel3(<a href="https://trychannel3.com">https://trychannel3.com</a>),这是一个涵盖互联网上每个产品的数据库,可以通过文本/图像进行搜索,并内置了联盟营销功能。这里有一个演示:<a href="https://www.youtube.com/watch?v=Mx8FyP7KvJg" rel="nofollow">https://www.youtube.com/watch?v=Mx8FyP7KvJg</a>。 寻找优质产品数据出乎意料地困难。如果你希望你的软件能够推荐产品并深度链接到商家,你会很快发现你所需的数据——干净的标题、标准化的属性、去重的列表、当前价格和库存、变体选项、图片以及品牌信息——不仅杂乱无章,而且分散在众多零售商那里,且常常被复杂的机器人检测系统所屏蔽。 在构建一个能够推荐相关用品的AI教师时,我们遇到了这个问题。我们向Exa请求产品,但得到的却是文章,而不是结构化数据。Tavily和Bing(自2025年8月13日起已停用)也是如此。我们还被联盟计划拒绝,建议我们先积累上千个TikTok粉丝。Channel3就是我们希望拥有的API。 产品详情页面(PDPs)通常会展示主要商品以及推荐产品。我们使用计算机视觉技术来识别主要产品并找到其属性,如标题和价格。我们将相同的逻辑应用于该域名上的其他PDPs。 产品通常在多个零售商处销售,且没有保证它们的标签一致。我们通过使用大型语言模型(LLMs)和多模态嵌入将网络上的产品整合为一个规范化的集合,以真正理解每个产品。 为了将所有内容规范化为一个尽量简洁且可扩展的模式,我们必须持有明确的观点。一个50美元的10寸平底锅和一个60美元的12寸平底锅是同一产品吗?可能不是,但T恤的S/M/L变体是。我们的目标是,任何你特定搜索的产品都被视为独立的产品。 我们处理大量数据。我们很快就用完了Cloudflare Vectorize索引的空间,转而使用全新的AWS S3 Vectors平台,并与OpenSearch同步,以实现更快的响应时间和更动态的过滤。我们经常遇到速率限制,因此我们将工作分散到多个云服务提供商和AI模型上。 你可以搜索诸如“户外烧烤,低于1000美元”或“防汗无线跑步耳机”或“来自Paige的女性牛仔裤,样式类似于[<a href="https://www.gap.com/webcontent/0020/666/799/cn20666799.jpg" rel="nofollow">https://www.gap.com/webcontent/0020/666/799/cn20666799.jpg</a>]”这样的内容。产品以JSON格式返回,包含标题、品牌、图片、价格、规格等信息。 开发者可以从他们推动的销售中获得佣金(平均5%)。Channel3会抽取一部分。我们希望你从Channel3获得的收入远超你在其上的支出。你赢了,我们也赢。 我们提供API、SDK(Typescript和Python)和MCP。我们提供1000次免费搜索,之后每1000次搜索收费7美元。你可以在我们的仪表板上查看每个品牌的预期佣金。 到目前为止,产品仅限于美国(抱歉!我们会扩展)。我们已经上线了数百万个产品和数百名开发者。 要开始使用,请在<a href="https://trychannel3.com">https://trychannel3.com</a>上注册一个免费账户,然后选择你想要销售的品牌(从50000多个品牌中选择或请求你自己的品牌),生成API密钥,开始销售和赚钱。 我们非常希望得到这个社区的反馈。如果你之前构建过产品搜索,我们在模式中遗漏了什么?如果你尝试在应用中加入商业功能,遇到了什么阻碍?如果你尝试自己构建这个,你学到了什么?有没有你希望存在的端点(例如,价格提醒、补货Webhook、产品数据源)?对于任何建议,我们都非常欢迎。 我们会在这个讨论线程中全天回答问题,分享更多技术细节,并倾听任何能让这个工具对你更有用的建议。请随意评论!
16作者: brgross7 天前原帖
这个应用程序是为了回答我妻子“如果我们直走,会碰到哪个国家”的问题而设计的(通常是在她指着手机时提出的)。<p>但有两个额外的功能:<p>1. 它加载了不同年份的历史地图(目前包括公元前1年、公元700年、公元1000年、公元1300年、公元1800年和公元1900年),这样你就可以看到如果你有一台时间机器,并且朝着手机指向的方向走,会碰到什么。<p>2. 点击一个国家/地区,可以获取关于你所指向的内容的(AI生成的)简介。<p>工作原理:从你手机的方位开始,我们以每200公里为一步,沿着大圆轨迹进行追踪,先用边界框预筛选候选国家(大约5-10个,而不是200个),然后检查每个段落沿线约20公里的点,以捕捉海岸线,并在路径首次进入另一个国家时停止。<p>大圆轨迹(<a href="https://www.movable-type.co.uk/scripts/latlong.html" rel="nofollow">https://www.movable-type.co.uk/scripts/latlong.html</a>)是你可以从纽约市到达澳大利亚的原因,尽管在平面地图上看起来可能很难理解。<p>解释中可能会有一些奇怪的内容,我没有阅读所有1400个。如果你看到什么奇怪的地方,请告诉我,我会进行更新!<p>这个应用是免费的,没有广告或追踪——你的位置信息和方位仅在本地使用,以确定你的位置和你所指向的内容。<p>如果你将手机保持得比较平,效果可能会更好 :)<p>感谢André Ourednik和所有参与历史底图项目的贡献者:<a href="https://github.com/aourednik/historical-basemaps" rel="nofollow">https://github.com/aourednik/historical-basemaps</a>)
4作者: lieret7 天前原帖
如果你的代理在每一步都使用不同的语言模型会怎样?我们让mini-SWE-agent在GPT-5和Sonnet 4之间随机切换,结果在SWE-bench上的得分比单独使用任何一个模型都要高。 GPT-5单独得分为65.0%,Sonnet 4为64.8%,但在每一步随机切换时得分达到了67.2%。 这个结果让我们感到相当惊讶。博客文章中还有更多实验的内容。