返回首页
最新
有这么多模型,而且不断有新的模型发布,我很难知道应该优先测试哪些模型。从经验来看,你发现哪些基准测试特别能反映实际性能呢?
我使用的有:
* Aider的Polyglot基准似乎是判断哪些模型在编码方面表现良好的一个不错指标:
https://aider.chat/docs/leaderboards/
* 我通常认为OpenRouter的使用情况可以作为模型受欢迎程度的一个指标,进而反映其实用性:
https://openrouter.ai/rankings
* LLM-Stats有很多基准测试的图表,我会查看:
https://llm-stats.com/
在计算机操作中,例如在微软Windows系统上,当有多个窗口(尤其是10个或更多)时,需要一种方法来有效地排列它们。
因此,我编写了一些代码来实现这一点。
简单来说,问题在于在日常工作中,一些窗口很容易被其他窗口完全覆盖。
例如,在我使用的Firefox浏览器版本中,如果我点击窗口A以打开一个新窗口B,Firefox会将B显示在窗口A的右下方;然后点击A会显示A,但会覆盖窗口B的左上角,甚至可能覆盖整个窗口B。
解决方案:基本思路是移动窗口,使所有窗口的左上角在屏幕上一条斜率从右上角到左下角的线上均匀分布。
[为了定义,如果窗口A覆盖了窗口B的部分或全部,那么在Z顺序中,A的层级高于B。可以把Z看作是一个与屏幕正交的坐标轴。]
这样,Z顺序中最上面的窗口位于左下角并且完全可见;我们至少可以看到每个窗口的左上角;如果点击某个窗口并更改Z顺序,那么该窗口将完全可见,并且我们仍然能看到每个窗口的左上角。
为了解决这个问题,我在Object Rexx 4.2.0中编写了代码,该版本允许找到窗口在Z顺序中的坐标并在保留Z顺序的情况下移动窗口。
我通过一个图标来调用这个解决方案,该图标位于屏幕的左上角,即一个几乎总是可见的位置。
其他人也可能会喜欢这个解决方案!
我相信,如果是英特尔的高管、哈切特出版公司或来自俄勒冈州的高级参议员,答案肯定会有所不同。