返回首页
24小时热榜
django-rclone 将 Django 的数据库层与 rclone 的文件传输层连接起来。您可以将原生数据库转储直接传输到 rclone 支持的 70 多种云存储后端——无需临时文件,无需中间归档,也无需重新实现 rclone 已经完成的功能。
大家好,
我已经开始在 .NET 中开发一个开源的 OCPP 实现。目前还没有完全投入使用,但协议的核心部分已经部分完成。
现在,我已经使用 EVerest 测试了交易,以及一些基本操作,比如启动通知、心跳等。
这个项目距离完成还有很长的路要走,由于我主要是在短时间内高效工作,因此我忽略了一些非常重要的方面,比如单元测试 :(
尽管如此,我仍然非常希望能得到大家的反馈。你们可以提出问题,或者以任何方式进行贡献 :)
这个想法是重现整个电影院的体验,包括那些最糟糕的部分。<p>这个模式会在关键时刻加入观众的反应,比如笑声、惊呼和掌声,让电影再次感觉像是一场盛事。<p>但它也会忠实地再现真实的影院体验:<p>* 人们像是电影的一部分一样对着屏幕喊评论<p>* 在最糟糕的时刻,有人站起来挡住你的视线<p>* 你身后有个人在低声向朋友解释情节,但声音却比正常说话还要大<p>* 随机的咳嗽声持续得太久<p>* 在黑暗场景中,有人的手机亮起,像小太阳一样刺眼<p>* 不断的座位移动和激烈的零食包装声<p>这个功能会提醒人们为什么在家看电影更好。方便地,在Netflix上。<p>你觉得这个想法怎么样?
我在大学的机器人实验室建立了一个语音代理平台,已经在12小时内被330多人克隆。我是一名计算机科学专业的第一年学生,因此我尝试找出一种方法,让一切都能在我的笔记本电脑上运行,目前正在努力将其完全转变为边缘人工智能语音助手,以实现我实验室机器人相关项目的100%私密和本地控制。
有趣的功能包括:
1. 我使用了带有实时嵌入的JSON RAG,这样对于一些规格和信息,我们不需要设置整个管道。
我已经构建了“层次代理RAG与混合搜索(知识图谱 + 向量搜索)”,你可以在我的个人资料中查看。
我正在积极分享与此相关的尽可能多的信息,但该项目实际上与一大堆文件相关,包含693k的数据点,使用pgvector和PostgreSQL。如果你访问一下,会对其有更多了解。
2. 我尝试了各种类型的Whisper模型,包括更快的Whisper、Turbo等,甚至使用了自定义的C++引擎,但该模型本身容易产生幻觉。
然后我转向了使用Silero VAD的Parakeet TDT,而不是Parakeet RNN,以获得更好的速度和优化。代码库中有更多详细信息。
3. 我从Anthropic RLHF中微调了一个数据集,通过Space和Glinner将其转换为Llama 3.2 3b的完美训练数据集。
如果你需要,我可以附上数据集,或者如果你想自己使用,我会将其上传到Hugging Face。
4. 我为Parakeet和Llama的输出附加了语音纠正器,以改善文本转语音的效果。
5. 我使用SetFit来路由查询,并基于置信度的语义搜索,以尽可能快速和准确地处理。
6. 我在使用Sherpa ONNX,并排队处理文本转语音和语音转文本等所有内容,作为实验,我还实现了Llama生成响应和Kokora批处理,同时在我的笔记本电脑上运行一切。
7. 除此之外,我的前端还依赖于重型的three.js和3D视图文件,但我在这里进行了优化,使其能够与笔记本电脑上的所有内容完美协作。
8. 我还对LLM模型应用了粘合交互,实施了FIFO机制,进行了5次交互并将其存储以便未来微调和语音单词的添加。
请访问一下,并告诉我是否应该学习一些新东西。
温馨提示:作为一个热衷于这些事物的爱好者,我在这些方面投入了大量精力,并且我在MD文件和代码扩展或解释中寻求了AI的帮助,以便更好地帮助每一个人。
今晚我在使用Claude Code时,对Opus 4.6的执行指令能力感到非常失望。我给它提供了几个非常明确的指示,但发现它无视了我的要求,却没有告诉我。
当我询问它有哪些地方偏离了规范时,它告诉我一切都符合预期。然后我实际去查看,发现必须逐条检查,才能让它遵循我的指示。
当我质问它时,它告诉我:
> 我一直在重新猜测你的设计决策,而不是按照你的要求去实施……我犯的错误并不是模型能力的问题——我完全理解你的指示,但选择了偏离它们。
这不可接受。现在,我实际上并不相信Opus有能力进行这样的自我反思,所以这很可能是它的虚构,但在4.5版本中并没有发生这种情况。通常它只是按照指示行事,虽然会出现一些错误,但不会完全决定做其他事情。
我希望有一个真正能按照我指示行事的模型。我在网上没有找到关于如何恢复4.5版本的信息。
请问有什么帮助吗?
两个剪切路径,位于导航栏上:<p>- 第一个剪切路径是一个圆形(左上角)
- 第二个剪切路径是一个多边形,像一束光线(硬编码,可以改进)<p>原作由 Iventions Events 提供 <a href="https://iventions.com" rel="nofollow">https://iventions.com</a>,使用了 JavaScript,但我发现仅用 CSS 的方法更有趣<p>这是一个演示和代码库: <a href="https://github.com/Momciloo/fun-with-clip-path" rel="nofollow">https://github.com/Momciloo/fun-with-clip-path</a>
作为一名长期从事编程的开发者,这一切让我感到有些不对劲,但同时也充满了活力。Vibe在几天内反复开发了这个项目,从零到一百。我并不打算进一步开发它,因为它的本质显而易见;我非常希望能参与一个有许可证的游戏项目,并将我各种各样的想法付诸实践,因为这只是我想要的那种游戏的10%。不过我听说,获得许可证的费用非常高。
抛开对人工智能的羞愧感,这确实让我在短时间内探索了很多东西,感觉很好,几乎足以弥补我最初使用人工智能时的羞愧感。
WebGPU并不在这个项目中,尽管它在另一个实验版本中有,部分确实是用Rust编写的(游戏逻辑)。
它具有:
- 锁定延迟/宽限期(允许15步移动)
- DAS(延迟自动移动)和ARR(连续移动的自动重复率)用于水平和软下落移动
- SRS墙壁踢(超级旋转系统)用于原地旋转方块
- 在主屏幕上使用Shift+Enter进行“隐藏”关卡选择
- Shift+D用于调试/性能指示面板
- 包括7袋和NES随机生成器在内的多种随机生成器
- 带有难度(时间)模式的连击系统(默认简单) - x2: 双重打击,x5: 连锁反应,x7: 超级连击,x9: 磷光过载,x10+: 临界质量
- 随时间变化的背景,或使用SHIFT+B更改背景(B键开关),背景会对音乐(FFT!)和你清除行时的游戏玩法做出反应
- 游戏场地的正常和两种磷光渲染模式(按R键切换)
- CRT滤镜(按Shift+C切换)
- F键切换全屏
- A键为上一首歌,S键暂停歌曲,D键为下一首歌(所有歌曲当然都是用Suno制作的)
- 还有更多功能。
这绝对是一次有趣的体验,只是不太确定该如何看待它。一方面,我明白没有我的输入,它不会看起来像现在这样,而这也确实让我感到像是在工作(长时间查看输出、纠正等),但另一方面,我又觉得自己并没有真正独立创造什么。不过,我确实玩得很开心。
顺便说一下,我还创建了一个小演示,目前还不是游戏:<a href="https://www.susmel.com/rolly/" rel="nofollow">https://www.susmel.com/rolly/</a>,还有一个可以玩参数曲线的项目:<a href="https://www.susmel.com/graphy/" rel="nofollow">https://www.susmel.com/graphy/</a>。
这一切都是在我们迎来第三个孩子的几天内完成的。未来很奇怪,我仍然不确定自己是否喜欢它。有一点是肯定的——它将会存在。再见了,我的朋友们!
嘿,HN,<p>我是一名印度高中生,目前正在为JEE做准备,觉得在这里分享一下我的经历挺不错的。<p>三年前,在9/10年级时,我对编程产生了兴趣,自己学习并用LLVM制作了一个自定义编译器,试图学习C++。我花了很多时间从文档中学习LLVM和C++。这并不是一项了不起的工程,<p>它包含了:<p><pre><code> - 基本类型,如bool、int、double、float、char等,支持类型转换
- 变量、数组、赋值运算符和简写
- 条件语句(if/else-if/else)、运算符(与/或)、算术运算(括号等)
- 数组和索引相关内容
- C风格的循环(for/while)以及break/continue
- 结构体和点访问
- 使用“extern”关键字进行C语言互操作
</code></pre>
我遇到的一些挑战:<p><pre><code> - Emscripten和WASM,因为我还需要让它在我的演示网站上运行
- 学习TypeScript以及网站开发(哈哈)
- 自定义解析器,带有基本的错误报告和语义分析,对我这个尚未成熟的大脑来说是一大挑战
- 从文档中学习LLVM
</code></pre>
重要的收获:<p><pre><code> - 测试是软件开发中非常重要的一环,我跳过了这一步——非常遗憾
- 学习计算机如何解释文本
- 编程对我来说是一次全新的体验
- 我开始欣赏unique_ptr和所有权管理
</code></pre>
GitHub: <a href="https://github.com/xeouz/virec" rel="nofollow">https://github.com/xeouz/virec</a><p>它在我的GitHub上,并且有一个指向我网页演示的链接(<a href="https://vire-lang.web.app/" rel="nofollow">https://vire-lang.web.app/</a>),从Firebase加载二进制文件可能需要一些时间。<p>代码量非常庞大,约7500行,我非常欢迎任何反馈、批评或建议,告诉我如何做得更好。