12作者: kbyatnal3 个月前原帖
我创建了OCR Arena,作为一个免费的平台,让社区能够并排比较领先的基础视觉语言模型(VLM)和开源OCR模型。<p>您可以上传任何文档,测量准确性,并(可选)在公共排行榜上为模型投票。<p>目前它包含了Gemini 3、dots.ocr、DeepSeek、GPT5、olmOCR 2、Qwen等几个模型。如果您希望添加其他模型,请告诉我!
2作者: fraserphysics3 个月前原帖
这是SIAM出版的这本书第二版的草稿。 <a href="https://epubs.siam.org/doi/book/10.1137/1.9780898717747?mobileUi=0" rel="nofollow">https://epubs.siam.org/doi/book/10.1137/1.9780898717747?mobileUi=0</a> 有三件事情需要展示: 1. 草稿的PDF文件:<a href="https://www.fraserphysics.com/book.pdf" rel="nofollow">https://www.fraserphysics.com/book.pdf</a> 2. HMM项目,提供状态空间模型的代码: <a href="https://gitlab.com/fraserphysics/hmm" rel="nofollow">https://gitlab.com/fraserphysics/hmm</a>,文档可在 <a href="https://fraserphysics.gitlab.io/hmm/" rel="nofollow">https://fraserphysics.gitlab.io/hmm/</a>找到。 3. HMMDS项目,提供使用状态空间模型解决一些示例的代码: <a href="https://gitlab.com/fraserphysics/hmmds" rel="nofollow">https://gitlab.com/fraserphysics/hmmds</a>,文档可在 <a href="https://fraserphysics.gitlab.io/hmmds/" rel="nofollow">https://fraserphysics.gitlab.io/hmmds/</a>找到。HMMDS的默认目标是构建这本书。在我的本地系统上,构建这本书大约需要10小时。 我非常感谢对这三件事情的任何方面的评论或建议。 我特别希望获得以下方面的帮助: 1. 我使用NixOS进行开发。我已经记录了在其他环境中使代码可用的进展,地址是 <a href="https://fraserphysics.gitlab.io/hmmds/getting_started.html" rel="nofollow">https://fraserphysics.gitlab.io/hmmds/getting_started.html</a>。如果您能够在其他地方使用这些代码,请告诉我。 2. 在书的草稿中,我对EM算法的收敛性质进行了分析,分布在第43页的第2.5节“EM算法”和第137页的附录B“EM收敛速率”之间。这个分析与我见过的任何已出版的内容都不同。我希望能得到反馈,包括修正和引用。
33作者: a-fadil3 个月前原帖
嗨,HN,我是 Wealthfolio 的创始人。<p>一年前,我发布了第一个版本。从那时起,这款应用经历了显著的成熟,进行了两次重大更新:<p>1. 多平台支持: 现在可以在移动设备(iOS)、桌面(macOS、Windows、Linux)上使用,并且提供自托管的 Docker 镜像。(Android 版本即将推出)。<p>2. 插件系统: 我们增加了对扩展的明确支持,这样你可以进行自定义开发,编写自己的集成代码,定制应用以满足你的需求。<p>核心理念始终如一:始终保持私密、透明和开源。
1作者: AndrewKemendo3 个月前原帖
我曾考虑过建立一个数字助手/代理,来处理我大部分的医生预约、账单谈判、询问垃圾、医疗、家庭和汽车服务等事务,基本上充当我与非朋友互动之间的桥梁。 请问有没有人正在开发这样的服务,或者在使用类似的服务方面取得了成功?我愿意每月支付几百美元,但不幸的是,我没有10万美元或12个月的时间来投资一个最小可行产品(MVP)。
3作者: keepamovin3 个月前原帖
没错,这就是标题。别再把人工智能看作一种不公平的“作弊代码”,而要把它视为一种新的编程语言。也许在其他领域,这种类比并不适用,但没关系。你主要关注的是编码、系统管理等。 人们认为人工智能降低了门槛,削弱了专家的影响力,降低了质量。也许确实如此。但这并不是新鲜事。当C语言威胁到B语言的垄断,以及机器代码等时,肯定也有人这么说。C语言让“非专业程序员”能够编写程序。这在当时是不可接受的,是对神圣法典的亵渎!是异端邪说!然而,它却成功了。现在C语言几乎被所有人所喜爱,至少是受到尊敬的。 以此类推,人工智能只是一种新的编程语言。它并不是“有意识”的,也不是通用人工智能(AGI),几乎算不上机械智能。它<em>不是</em>你的朋友。它只是一个工具,一个非常有用的多功能工具。但目前,它仍然只是一个工具。 这就是你对待人工智能的方式,并且能够获胜。你不会心怀怨恨,也不需要“报复”。你只需继续前进。去做吧,使用它。它是一个工具,所以开始工作吧! :)
2作者: urnicus3 个月前原帖
前几天我在使用一个政府网站时遇到了这样的警告:“为了获得最佳效果,我们建议使用Internet Explorer”。 这种警告在2000年代非常常见。如今,当我再次看到这样的提示时,感觉就像猫咪看到猫薄荷一样。还有人需要与这种类型的网站互动吗?你能直接与它互动,还是需要使用虚拟机?我很好奇。