1作者: kshk123大约 2 个月前原帖
我开发了一个小型浏览器扩展,旨在帮助用户从任何网站上选中的文本创建提醒。我经常在电子邮件和网页中看到日期和时间(如“下周二下午3点”、“2025年12月25日”、“14:30”),希望能有一种方便的方法将它们转化为提醒,而无需切换应用程序。 <p>工作原理:</p> <pre><code> - 在任何网页上选择文本 → 右键点击“添加到提醒” - 它会检测常见的日期/时间格式(英文 + 欧洲/德语)并自动填写提醒时间 - 在弹出窗口中查看/编辑/删除提醒,或手动添加提醒 - 日期也可以手动编辑/添加,且高亮的文本不一定需要包含日期。 可选集成(仅在您选择时): - 通过OAuth与Google日历同步(创建事件) - 通过您在本机上运行的小型本地桥接与macOS Apple Reminders同步 链接: - Chrome 网上应用店:https://chromewebstore.google.com/detail/create-reminders/ecifdofkbodefbieanakcmhnncjhflkh - Firefox 附加组件:https://addons.mozilla.org/en-US/firefox/addon/create-reminders/</code></pre>
2作者: willm大约 2 个月前原帖
嗨,HN, 直到2025年中,我一直是一个名为Textualize的初创公司的首席执行官/首席技术官。出于某种原因,我成功获得了用于我开发的Python库的种子资金,这些库用于美化终端输出。经过三年的努力,我们最终因为资金耗尽而结束了项目。 老实说,那时我以为自己厌倦了编码。但事实证明,我厌倦的是压力和长时间工作。几周的休息是我所需要的。 就在那个时候,编码代理突然兴起,我再也无法忽视它们了。我对这些工具提供的用户界面并不感到满意。经过几年的终端工作,我知道可以提供更好的用户体验。因此,这个项目应运而生。 我原本计划在代理的SDK和前端之间创建某种层。幸运的是,在我开始构建这个项目后,Zed Industries发布了代理客户端协议([https://agentclientprotocol.com](https://agentclientprotocol.com)),这正是我所需要的。 我刚刚发布了代码(之前这是一个私有仓库)。Toad(取自Textual Code的玩笑)可以运行大量的AI代理,并提供更友好的终端用户界面。 可以把它看作是一个“自带代理”的编码命令行工具。使用你想要的任何代理。我并不是想向你出售代币。 有任何问题请问我。如果这篇帖子受欢迎,我会在这里待一段时间。
2作者: Mey0320大约 2 个月前原帖
嗨,HN, 我们是来自北京大学的OpenDCAI团队。我们开发了Paper2Any,这是一个开源工具,旨在基于我们的DataFlow-Agent框架自动化“论文转幻灯片”的工作流程。 问题:撰写论文很困难,但创建专业的架构图和幻灯片(PPT)往往更加繁琐。大多数AI工具仅生成静态图像(PNG),无法进行最终出版时的调整。 解决方案:Paper2Any接受PDF、文本或草图作为输入,理解研究逻辑,并生成完全可编辑的PPTX(PowerPoint)文件和SVG图形。我们优先考虑灵活性和保真度——允许您指定页面范围、切换视觉风格,并保留原始资产。 工作原理: 1. 多模态阅读:从论文中提取文本和视觉元素。您现在可以指定页面范围(例如,仅方法部分),以聚焦上下文并减少令牌使用。 2. 内容理解:识别核心贡献和结构逻辑。 3. PPT生成:它生成独立的元素(块、箭头、文本),而不是生成一张平面的图像,并提供可选择的视觉风格,将这些元素组织成幻灯片布局。 链接: - 演示:<a href="http:&#x2F;&#x2F;dcai-paper2any.cpolar.top&#x2F;" rel="nofollow">http:&#x2F;&#x2F;dcai-paper2any.cpolar.top&#x2F;</a> - 代码(DataFlow-Agent):<a href="https:&#x2F;&#x2F;github.com&#x2F;OpenDCAI&#x2F;DataFlow-Agent" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;OpenDCAI&#x2F;DataFlow-Agent</a> 我们期待听到您对生成质量和代理工作流程的反馈!
2作者: Yatharth3501大约 2 个月前原帖
我一直在开发MiraTTS,这是一个基于Spark-TTS的微调版本,旨在实现高真实感和稳定的文本转语音。我们的目标是创建一个速度极快但质量极高的模型。 大多数开放源代码的文本转语音模型要么计算负担沉重,要么生成16-24kHz的音频。Mira通过结合以下两种技术实现了高保真度和快速响应: FlashSR:用于生成清晰且明亮的48kHz音频输出。 LMDeploy:经过高度优化的推理,允许实现100倍的实时速度和低延迟(大约150毫秒)。 我构建这个模型是为了让本地用户能够访问一个高质量的本地文本转语音模型,适用于各种使用场景。目前该项目还处于早期阶段,我正在实验多语言版本和多说话者版本。流媒体功能也即将推出。 代码库: [https://github.com/ysharma3501/MiraTTS](https://github.com/ysharma3501/MiraTTS) 模型: [https://huggingface.co/YatharthS/MiraTTS](https://huggingface.co/YatharthS/MiraTTS) 我还写了一篇关于这些基于大型语言模型的文本转语音模型如何工作的分析文章: [https://huggingface.co/blog/YatharthS/llm-tts-models](https://huggingface.co/blog/YatharthS/llm-tts-models)
15作者: injung大约 2 个月前原帖
目前,大家都在使用人工智能工具进行发货,而我却在这里使用一个可视化编辑器。不过,我认为许多团队都非常熟悉“市场部想要再次更改着陆页”这个问题。 多年来,我一直遇到这个问题。营销活动页面不断涌入,工程师被拉入其中,工单堆积如山。通常这些页面的组件都是相同的,只是重新排列了一下。 几年前,我在一家初创公司工作时,我们构建了一个内部工具来解决这个问题。你可以注册现有的 React 组件,它们会以拖放块的形式出现,最终结果是一个 JSX 字符串。无需学习任何模式,也不需要更改你的组件代码。 我们在生产环境中使用了这个工具,处理真实流量,环境复杂且遗留系统较多。它表现得很好。随着时间的推移,它支持了大约 60% 的流量。市场部可以在不提交工单的情况下发布页面,产品团队也可以进行布局级的 A/B 测试。这个经历最终促使我对其进行整理并开源。 Composify 介于无代码页面构建器和无头内容管理系统之间。像 Wix 或 Squarespace 这样的页面构建器提供拖放功能,但会将你锁定在他们的组件中。还有一些优秀的工具,如 Builder.io、Puck 和 Storyblok,但许多工具要求你将组件适配到他们的模型中。Composify 刻意保持简约:它允许你直接使用实际的生产组件。 目前还处于早期阶段。文档需要改进,还有一些粗糙之处。但它已经在生产环境中运行,并为我们解决了一个实际问题。如果你已经有了一个组件库,并希望非开发人员能够从中构建页面,那么它可能会很有用。 主页: [https://composify.js.org](https://composify.js.org) 欢迎提问或反馈!
1作者: timeproofs大约 2 个月前原帖
我在许多领域(文档、人工智能输出、数据集、代码、日志)中不断遇到同样的问题。<p>存储告诉我我现在拥有什么。版本控制告诉我发生了什么变化。<p>但是当争议发生时,真正的问题往往更简单:这些数据实际上是什么时候存在的?<p>截图、PDF、仪表板、电子邮件……它们大多依赖于对系统或平台的信任。<p>在许多情况下,存储或共享原始数据甚至不是一个选项(隐私、合规、规模)。<p>我很好奇其他人今天是如何处理这个问题的。你见过哪些有效的实践方法?