嗨,HN,我正在构建Kuzco,这是一个用于在Apple设备(iPhone、iPad、Mac、Vision Pro)上本地运行AI模型的Swift SDK。我们的目标是让“离线 + 私密AI”像普通依赖项一样,能够轻松集成到SwiftUI/ UIKit应用中,而无需搭建服务器或支付按令牌计费的API费用。
它的功能包括:
- 文本生成与令牌流式传输(聊天风格用户体验)
- 视觉AI(本地分析图像)
- 通过Stable Diffusion生成图像
- 模型管理器,用于下载和管理设备上的模型
开发者体验:
- 创建与模型的会话
- 在生成过程中流式传输令牌
- 可选获取完整响应(主页上有代码示例,展示了具体流程)
我发布这个内容的原因是希望能从iOS开发者(以及任何进行设备推理的开发者)那里获得反馈:
- 什么会让这个SDK成为你“必用”的选择
- 你希望首先支持哪些模型(小巧、快速、够用 vs 较大、较慢、更好)
- 你目前面临的最大痛点是什么:性能、模型下载、用户体验、内存、应用大小、安全性等。
如果你想在准备好广泛分享时获得更新或提前访问,可以在网站上加入等候名单(无需信用卡)。
<a href="https://kuzco.co/" rel="nofollow">https://kuzco.co/</a>
返回首页
最新
我对每天使用Ubuntu(抱歉,Arch用户)越来越感兴趣,想知道在2026年,像Ubuntu这样简单的Linux发行版作为日常使用的安全性如何?
为了澄清我的问题:
- 在桌面环境中,Linux与Windows或MacOS相比相对安全吗?
- 如果不安全,需要更改、配置或避免什么才能提高安全性(如果可以的话)?
感谢您的时间。
编辑:(澄清)我已经对Linux进行了一些实验。这对我来说是向日常使用迈出的第二步。对我来说,更迫切的关注是[图形用户界面]应用程序的沙箱化。
我正在开发一个数字音频工作站,并且已经制作了我的第一个预发布版本,采用类似于 Git 的分支版本控制。<p>它在本地使用是免费的,而云同步或协作则需要付费。
看到很多人使用自定义沙箱(如Docker/VMs、firejail/bubblewrap)来运行编码代理(如Claude Code等),以及一些限制文件或网络访问的脚本。我很好奇,是什么导致人们需要自己动手做这些?那么,什么样的标准才算是“足够好”?
答案很简单:你对Claude的指示越“规定性”,输出结果就越糟糕。原因在于Claude试图进行模式匹配——它接受过数千种安全用户界面模式的训练,这就是为什么当你要求“一个现代化的仪表板”时,它并不会真正考虑问题的领域,而是默认使用它能迅速生成的任何安全设计模式。
我一直在开发一个Claude Code技能,以应对通用用户界面的输出,并尝试了不同的方法,比如详细描述我的个人视觉风格,例如边框使用的透明度值、特定的标记模式等。虽然我得到了还算不错的输出,但我意识到在不同指令下,大多数视觉输出看起来都很相似,缺乏创造性和信息架构的多样性。
因此,我分析并拆解了官方的前端设计技能,以了解它如何在创意任务中表现出色。我发现这个技能主要是基于原则和引发联想的,这在思考时非常聪明。它在激发创造力和保持不同任务范围内的结构之间保持了恰到好处的平衡。
所以我的方法发生了变化。我决定使用相同的模式来构建我的技能:详细阐述我的设计原则,但以引发联想的方式来框架这些原则,以迫使Claude在任何视觉输出之前深入探索任务领域(欢迎批评我的方法,但嘿,这确实有效)。从那时起,我从Claude那里得到了更加深思熟虑的初始输出,而不是默认使用它所训练的安全用户界面模式。
我为这个技能设定的目标是补充Anthropic的前端设计技能。虽然前端设计专注于任何网页用户界面的独特、令人难忘的美学,但界面设计则旨在在功能接口(如仪表板、工具、网页应用)之间保持系统的一致性,在这些地方,设计决策需要在多个会话中持续并累积。
我尽量不被这里的热潮所影响。我很好奇你们到目前为止用claude-code实际构建或发布了什么。
我为我的孩子们制作了一个小的语音闪卡游戏,链接在这里:[3 Letter Stories](https://apps.apple.com/us/app/3letterstories/id6753956099)。
此外,还有一个与此相关的工具,用于微调闪卡上的图像(这些图像都是在gemini上生成的AI图像)。
还有一些内部工具——一个自包含的页面,用于可视化JSON/Python字典,这显然已经存在。
目前还没有什么大项目,但这才过去几天。这个工具在构建前端/仪表板方面确实看起来非常出色。