构建了一个人工智能报价生成器
返回首页
最新
我不确定是我变老了还是其他原因,但我对编程和软件工程的未来感到有些奇怪:大型语言模型(LLMs)确实令人印象深刻,但使用它们需要付费。我想不出软件行业中还有什么核心工具或技术——不仅对这个领域至关重要,对整个世界也同样重要——是非免费或非开源的。想想TCP/IP、Linux内核、Postgres、Git、ffmpeg、qemu、Latex、Kubernetes等等。确实,市场上有很多专有软件,但它们并不是互联网或计算行业的支柱。
现在,LLMs有潜力成为这一支柱的一部分,但似乎没有人特别担心它们不是开源的(我说的是GPT、Claude、Copilot、Gemini)。我知道有开源的替代品,但它们的能力远不如这些专有产品——而且看起来这里的大多数人都很乐意使用并为这些专有软件付费。
我不喜欢一个必须为每个token付费才能编写程序的未来。别告诉我“那就别用LLMs”;它们将会变得像今天的Linux一样:无处不在。
你好,HN。
我开发了 Flookup Data Wrangler,这是一个强大的 Google Sheets 插件,可以在不编写任何代码的情况下进行数据清理。
传统的 Soundex 算法是为单个单词设计的,比如“John”和“Jonny”,使得对这些字符串的比较变得简单。然而,典型的 Soundex 输出无法处理多词或重新排列的字符串比较,例如“John Doe”与“Doe Jonny”,因为这样会产生不准确的结果。
为了解决这个问题,我对 Soundex 算法进行了修改,支持多词和重新排列的字符串,添加了一个辅助函数,将输出重新编码为可以用于准确文本对文本比较的格式。这个优化保持了最小的开销,确保对性能的影响可以忽略不计。
通过利用这一增强功能,Flookup 用户可以做到以下几点:
+ 模糊匹配和合并
+ 重复项高亮和删除
+ 提取唯一值列表
……所有这些都是基于字符串或字符串部分的发音(如英语发音)。
我非常希望能收到反馈,特别是来自那些关注数据清理的人(我猜这应该是每个人)。
如果你有兴趣尝试一下,这里有一个快速入门指南: [https://www.getflookup.com/get-started](https://www.getflookup.com/get-started)
在未来,所有代码都将由人工智能编写,那么直接让人工智能为你的企业创建一个定制的客户关系管理(CRM)解决方案应该是轻而易举的,而不是配置现成的产品,对吧?<p>那么,实际上有人在这样做吗?这需要多久才能成为现实?