返回首页
最新
我一直在学习Python,并决定做一些有用的东西。<p>我创建了一个SaaS(软件即服务),旨在保护视频不被以一些常见方式下载,比如使用浏览器扩展或直接视频链接。我认为攻击者需要花费一些时间才能真正从我的网站下载视频(至少我希望如此)。<p>你总是可以进行屏幕录制,但对此没有保护措施,除非你使用数字版权管理(DRM)。<p>这里有一个需要解锁的视频示例。<a href="https://peachka.net/v/1" rel="nofollow">https://peachka.net/v/1</a><p>我仍然不知道该如何处理这个解决方案,也许可以将其提供给创作者等。
我开始了一项实验,让一个基于WASM的网页应用与本地git仓库进行交互,看看效果如何。结果显示,这个效果相当不错!<p>我将其制作成一个“git封装”工具,可以显示你最频繁的提交时间,以及你最常使用的编程语言和文件。<p>尽管在使用文件系统API时会出现一些令人担忧的提示,但所有操作都是在本地进行的,你的代码保持私密。(当然,你也可以在克隆的公共GitHub仓库上进行尝试)。<p>欢迎告诉我你的想法!
我开发了一个小型浏览器扩展,旨在帮助用户从任何网站上选中的文本创建提醒。我经常在电子邮件和网页中看到日期和时间(如“下周二下午3点”、“2025年12月25日”、“14:30”),希望能有一种方便的方法将它们转化为提醒,而无需切换应用程序。
<p>工作原理:</p>
<pre><code> - 在任何网页上选择文本 → 右键点击“添加到提醒”
- 它会检测常见的日期/时间格式(英文 + 欧洲/德语)并自动填写提醒时间
- 在弹出窗口中查看/编辑/删除提醒,或手动添加提醒
- 日期也可以手动编辑/添加,且高亮的文本不一定需要包含日期。
可选集成(仅在您选择时):
- 通过OAuth与Google日历同步(创建事件)
- 通过您在本机上运行的小型本地桥接与macOS Apple Reminders同步
链接:
- Chrome 网上应用店:https://chromewebstore.google.com/detail/create-reminders/ecifdofkbodefbieanakcmhnncjhflkh
- Firefox 附加组件:https://addons.mozilla.org/en-US/firefox/addon/create-reminders/</code></pre>
嗨,HN,
直到2025年中,我一直是一个名为Textualize的初创公司的首席执行官/首席技术官。出于某种原因,我成功获得了用于我开发的Python库的种子资金,这些库用于美化终端输出。经过三年的努力,我们最终因为资金耗尽而结束了项目。
老实说,那时我以为自己厌倦了编码。但事实证明,我厌倦的是压力和长时间工作。几周的休息是我所需要的。
就在那个时候,编码代理突然兴起,我再也无法忽视它们了。我对这些工具提供的用户界面并不感到满意。经过几年的终端工作,我知道可以提供更好的用户体验。因此,这个项目应运而生。
我原本计划在代理的SDK和前端之间创建某种层。幸运的是,在我开始构建这个项目后,Zed Industries发布了代理客户端协议([https://agentclientprotocol.com](https://agentclientprotocol.com)),这正是我所需要的。
我刚刚发布了代码(之前这是一个私有仓库)。Toad(取自Textual Code的玩笑)可以运行大量的AI代理,并提供更友好的终端用户界面。
可以把它看作是一个“自带代理”的编码命令行工具。使用你想要的任何代理。我并不是想向你出售代币。
有任何问题请问我。如果这篇帖子受欢迎,我会在这里待一段时间。
嗨,HN,
我们是来自北京大学的OpenDCAI团队。我们开发了Paper2Any,这是一个开源工具,旨在基于我们的DataFlow-Agent框架自动化“论文转幻灯片”的工作流程。
问题:撰写论文很困难,但创建专业的架构图和幻灯片(PPT)往往更加繁琐。大多数AI工具仅生成静态图像(PNG),无法进行最终出版时的调整。
解决方案:Paper2Any接受PDF、文本或草图作为输入,理解研究逻辑,并生成完全可编辑的PPTX(PowerPoint)文件和SVG图形。我们优先考虑灵活性和保真度——允许您指定页面范围、切换视觉风格,并保留原始资产。
工作原理:
1. 多模态阅读:从论文中提取文本和视觉元素。您现在可以指定页面范围(例如,仅方法部分),以聚焦上下文并减少令牌使用。
2. 内容理解:识别核心贡献和结构逻辑。
3. PPT生成:它生成独立的元素(块、箭头、文本),而不是生成一张平面的图像,并提供可选择的视觉风格,将这些元素组织成幻灯片布局。
链接:
- 演示:<a href="http://dcai-paper2any.cpolar.top/" rel="nofollow">http://dcai-paper2any.cpolar.top/</a>
- 代码(DataFlow-Agent):<a href="https://github.com/OpenDCAI/DataFlow-Agent" rel="nofollow">https://github.com/OpenDCAI/DataFlow-Agent</a>
我们期待听到您对生成质量和代理工作流程的反馈!
我一直在开发MiraTTS,这是一个基于Spark-TTS的微调版本,旨在实现高真实感和稳定的文本转语音。我们的目标是创建一个速度极快但质量极高的模型。
大多数开放源代码的文本转语音模型要么计算负担沉重,要么生成16-24kHz的音频。Mira通过结合以下两种技术实现了高保真度和快速响应:
FlashSR:用于生成清晰且明亮的48kHz音频输出。
LMDeploy:经过高度优化的推理,允许实现100倍的实时速度和低延迟(大约150毫秒)。
我构建这个模型是为了让本地用户能够访问一个高质量的本地文本转语音模型,适用于各种使用场景。目前该项目还处于早期阶段,我正在实验多语言版本和多说话者版本。流媒体功能也即将推出。
代码库: [https://github.com/ysharma3501/MiraTTS](https://github.com/ysharma3501/MiraTTS)
模型: [https://huggingface.co/YatharthS/MiraTTS](https://huggingface.co/YatharthS/MiraTTS)
我还写了一篇关于这些基于大型语言模型的文本转语音模型如何工作的分析文章: [https://huggingface.co/blog/YatharthS/llm-tts-models](https://huggingface.co/blog/YatharthS/llm-tts-models)
目前,大家都在使用人工智能工具进行发货,而我却在这里使用一个可视化编辑器。不过,我认为许多团队都非常熟悉“市场部想要再次更改着陆页”这个问题。
多年来,我一直遇到这个问题。营销活动页面不断涌入,工程师被拉入其中,工单堆积如山。通常这些页面的组件都是相同的,只是重新排列了一下。
几年前,我在一家初创公司工作时,我们构建了一个内部工具来解决这个问题。你可以注册现有的 React 组件,它们会以拖放块的形式出现,最终结果是一个 JSX 字符串。无需学习任何模式,也不需要更改你的组件代码。
我们在生产环境中使用了这个工具,处理真实流量,环境复杂且遗留系统较多。它表现得很好。随着时间的推移,它支持了大约 60% 的流量。市场部可以在不提交工单的情况下发布页面,产品团队也可以进行布局级的 A/B 测试。这个经历最终促使我对其进行整理并开源。
Composify 介于无代码页面构建器和无头内容管理系统之间。像 Wix 或 Squarespace 这样的页面构建器提供拖放功能,但会将你锁定在他们的组件中。还有一些优秀的工具,如 Builder.io、Puck 和 Storyblok,但许多工具要求你将组件适配到他们的模型中。Composify 刻意保持简约:它允许你直接使用实际的生产组件。
目前还处于早期阶段。文档需要改进,还有一些粗糙之处。但它已经在生产环境中运行,并为我们解决了一个实际问题。如果你已经有了一个组件库,并希望非开发人员能够从中构建页面,那么它可能会很有用。
主页: [https://composify.js.org](https://composify.js.org)
欢迎提问或反馈!