2作者: gcha9 个月前原帖
大家好!我是Gabriel Cha,作为哥伦比亚大学的新生,我想分享我在过去两周里开发的项目:Cloi——一个完全本地的调试代理,可以直接在你的终端中运行。链接:https://github.com/cloi-ai/cloi 我创建Cloi的原因是,市面上的每个AI编码工具都需要API密钥、订阅服务,并要求将你的整个代码库上传到他们的服务器。然而,Cloi完全在你的机器上运行。没有云服务、没有API密钥、没有订阅、没有数据离开你的系统。 这个技术非常简单:它捕捉你的错误上下文,在本地启动Ollama,生成针对性的修复方案,并且——仅在你明确允许的情况下——直接将补丁应用到你的文件中。在任何更改之前,你都可以查看每一个差异。 我们开箱即用的是Phi-4(在其体积下表现极佳),但你可以切换到任何你已安装的Ollama模型。你的机器,你的模型,你的规则。 安装非常简单:$ npm install -g @cloi-ai/cloi 顺便提一下,Cloi是免费的。如果你对实现感兴趣或者想请求新功能,可以在这里提出:https://github.com/cloi-ai/cloi 自发布以来,我们在短短5天内就获得了202颗星星!!!如果你觉得这个工具有用,我非常感谢你的支持。试试看,告诉我们你的想法! 来自Gabriel Cha和Mingyou Kim
2作者: gillyuv29 个月前原帖
你好,我将离开我的初创公司,他们规定了我可以行使期权的截止日期,否则这些期权将会失效。<p>有人可以推荐一位靠谱的税务顾问或者分享他们的经验吗?因为很多人可能需要在这方面的建议。<p>兑现承诺的时刻到了。
1作者: silasalberti9 个月前原帖
嗨,我们刚刚发布了一篇关于 Kevin-32B = K(ernel D)evin 的博客文章。<p>据我们所知,这是第一个在 CUDA 内核上进行强化学习训练的开源模型。我们的目标是展示使用 GRPO 进行多轮强化学习。我们使用了来自 KernelBench 数据集的 180 个 Python 到 CUDA 的转换任务。<p>结果令人惊讶地强劲!我们能够超越顶尖的推理模型,如 o3 和 o4-mini。<p>我们在博客文章中分享了我们的训练设置和经验。此外,该模型已在 HuggingFace 上发布:<a href="https://huggingface.co/cognition-ai/Kevin-32B" rel="nofollow">https://huggingface.co/cognition-ai/Kevin-32B</a>
4作者: career_question9 个月前原帖
你好,HN, 从小我就对机器学习和深度学习产生了浓厚的兴趣。目前我在加拿大多伦多的计算机科学本科专业读二年级,已经在行业中积累了近两年的经验(计算机视觉和自然语言处理),同时在学术界也有超过一年的全职人工智能研究经历。此外,我有不少开源项目(全部与深度学习相关),总共获得了超过1000个星标,其中一些在各自的领域内非常知名。然而,最近我感觉这个领域已经饱和,每天都有新的研究成果发布,作为一名人工智能开发者,我觉得自己不过是机器中的一个齿轮。我理解所有领域在某种程度上都受到这种现象的影响,但在人工智能领域,我的工作完全没有个人色彩,反而让我觉得自己像一个机器人,训练视觉变换器进行分类,微调大型语言模型以处理特定类型的文档,进行架构调整以实现微小的性能提升,等等。 你能建议我考虑计算机科学中的哪些替代方向吗?我有两个主要优先考虑的方面: * 创造力:我并不想寻找典型的软件开发职位,比如全栈开发者。相反,我对那些需要创造力的机会感兴趣,几乎像是在解谜一样,并且不会在一段时间后变得“例行公事”。 * 行业:我的目标是进入行业,而不是学术界。这并不是因为我不喜欢研究(事实上,我更喜欢研究而非应用工作),但尽管我不情愿承认,薪资确实在我的决策中起着一定作用,我的目标是六位数的收入。 举个具体的例子:我热爱逻辑、编程语言研究、理论计算机科学等工作,因为这些都满足我的第一个标准,但遗憾的是,似乎就业机会大多局限于学术界? 我非常感谢你的想法和反馈。