返回首页
最新
我常常需要打印原始张量(无论是手动打印还是输出到标准输出),特别是在阅读 PyTorch 或 JAX 代码时,以便理解数据的变换。例如,对于以下代码:
`x = torch.randn(32, 3, 224, 224).unfold(2, 16, 16).unfold(3, 16, 16).reshape(32, 3, 196, 256).transpose(1, 2).reshape(32, 196, 768).view(32, 196, 12, 64).transpose(1, 2)`
大家是如何可视化张量的,以便快速理解复杂神经网络中的数据流动的呢?
你好,HN,我正在推出 ConnectTheDotsPrintable——这是我为解决可打印市场中一个简单但意外未被满足的需求而开发的工具。
<p>问题
大多数现有的连线游戏产品都是静态的、通用的PDF文件。如果你想要一幅你狗狗的连线图、你最喜欢的风景,或者孩子的画作,你就没戏了。目前的选择优先考虑数量而非个性化,错过了像Etsy这样平台上对定制数字商品的需求。
<p>解决方案 / 工作原理
我开发了一个后端图像处理管道,利用边缘检测和简化算法提取任何上传图像的核心轮廓。这个过程大大减少了所需的点数,同时保留了可识别的形状。
<p>然后,该算法智能地在优化后的轮廓上放置一系列编号的点。这不仅仅是一个滤镜;它是一种结构转变,生成一个真正可解的连线游戏。
<p>主要特点 / 技术
定制化:上传任何JPG/PNG文件,获得个性化的拼图。
<p>矢量化:输出高质量、可打印的PDF/图像文件。
<p>性能:图像处理在服务器端进行,以快速生成。
<p>技术栈:使用Python(用于图像处理算法)和React/Next.js构建前端界面。
<p>我很想听听社区的意见:还有哪些其他图像处理功能可以让这个工具更具吸引力?