返回首页
最新
我建立了一种简单的方法,将网站或域名链接到电话号码、电子邮件、Webfinger 和个人资料信息。主要方法是使用位于 /.well-known/telweb 的 JSON-LD 文档。对于电话号码,仅使用 _telweb 子域上的 TXT 记录作为备用。个人资料字段故意设计得很灵活。它被简单地定义为一个对象,您可以在其中放入任何您想要的信息。您可以在拨号器部分进行尝试。
大家好。
我一直在开发 Hitoku Draft,这是一款开源的、以语音为主的人工智能助手,完全在本地运行。我之前已经发布过相关信息,现在它还新增了语音编辑的转录功能。希望能得到反馈,因为我发现除了技术圈外,其他人对这项技术的使用仍然不多。
它具备上下文感知能力,能够读取你的屏幕、文档和正在使用的应用,以理解你正在进行的工作。你可以通过语音询问关于 PDF 的问题、回复电子邮件、创建日历事件、进行网页搜索、编辑文本等。
你可以使用代码 HITOKUHN2026 免费下载一个编译版本,链接是 <a href="https://hitoku.me/draft/">https://hitoku.me/draft/</a>(基础价格为 5 美元)。
它支持 Gemma 4 和 Qwen 3.5 进行文本生成,并且支持多种语音转文本后端(Parakeet、Qwen3-ASR)。
示例:
- Gemma4 的实际应用,<a href="https://www.youtube.com/watch?v=OgfI-3YjEVU">https://www.youtube.com/watch?v=OgfI-3YjEVU</a>
- 查询 PDF 文档,<a href="https://www.youtube.com/watch?v=ggaDhut7FnU">https://www.youtube.com/watch?v=ggaDhut7FnU</a>
- 回复电子邮件,<a href="https://www.youtube.com/watch?v=QFnHXMBp1gA">https://www.youtube.com/watch?v=QFnHXMBp1gA</a>
- 以及常规的语音听写(可选润色)
我目前在使用 Claude Code 和 Logseq 时频繁使用它。现在我和一些朋友还在开发一个新的跨平台版本。我们的目标是长期实现本地的 AI 交互模型,为人们和专业人士提供服务。