返回首页

一周热榜

2作者: johnstimac1116 天前原帖
我曾经是一名数据工程师,其中一个重要的方面就是数据监控。数据科学家和分析师在分析方面会对商业指标(如注册率、留存率等)进行大量监控,但作为数据工程师,我也需要确保系统没有出现故障。Data Axolotl 专注于后者。 市面上有很多支持数据测试的工具(我非常喜欢 dbt 测试),但即使编写了强健的测试,我们仍然会遇到意想不到的破坏性变化。大多数情况下,当产品经理询问某个不常见的指标为何在所有地方都变为 null 时,这就成了一个问题。我们并不知道这个指标正在被使用(有时甚至不知道它的存在),那么我们怎么能为它编写测试呢?(一个常见的原因是某个工程团队停止记录某个数字,因为没有人知道它的重要性;即使工程团队做了一切正确的事情,发送了“仅供参考,我们将移除遗留用户 ID 值”的通知,并安全地推出了更新,也没有人会预料到市场营销的投资回报率仪表板依赖于这个指标。) 这就是 Data Axolotl 的用武之地:Data Axolotl 是一个命令行工具,可以捕捉分析数据集中的意外破坏性变化,而无需提前知道可能会出错的地方。 简单来说,你只需将其指向一些数据表,每天运行,它就会随着时间的推移收集大量常见指标(如列的最小值、最大值、均值、行数、唯一值计数等)。如果任何指标突然发生变化,Data Axolotl 会生成警报。 整个工具运行在一个 Python 包中,因此你可以在本地或通过像 Airflow 这样的调度工具在自己的基础设施上运行。你不需要注册任何新的云服务,也不必担心数据泄露给第三方。历史数据可以存储在本地的 sqlite(默认)中,或存储在你基础设施上的远程数据库中。 这是一个相对早期的版本,目前仅支持 Snowflake 表,但我们希望未来能够添加其他数据库类型。 你可以今天就尝试 Data Axolotl,直接在本地机器上通过 pip 安装。`pip install data-axolotl` 完整的安装指南可以在 Readme 中找到。
2作者: rishikeshs7 天前原帖
背景:我更喜欢小型手机,目前使用的是iPhone 13 Mini,计划再用三年。可惜电池一直在耗尽,我已经换了第二块电池。我更倾向于自己修理,因为大多数当地商店提供的电池质量较差,而且我有点担心把手机留在那里。我的屏幕也坏了,后玻璃也破了。我在考虑从阿里巴巴国际站(Aliexpress)订购一些替换零件,并想知道除了ifixit上针对特定手机的指南,还有没有其他好的学习资源。