美团最近搞了个新的模型叫LongCat-2.0,宣称是使用国产芯片训练的,虽然说是重要一步,但是这价格。。。

这年头国产替代已经不是低价普惠的代名词了吗,咋价格比deepseek还高。

价格

价格

只有输入价格比pro便宜一点,但是大多输入都是走的缓存吧,感觉并没有把价格打下来,那国产替代的象征意义远大于实际作用了。

既然有了模型,那肯定得出tokenplan。

除了9.9元只能买一次的5000万 Token的资源包外,主要卖的是这个。

10亿资源包

这个资源包的好处是命中缓存免费,这点给大大的好评。建议所有厂商跟进。毕竟以我昨天的使用情况来看,我的缓存率都能搞到98%,一天大概使用250万,像是10亿这种根本用不完,一个月干20天,也就5000w的消耗。感觉营销部门的宣传点不太对,得跟小米学习一下。把价格优势糊脸上。主要就宣传“资源包缓存免费”。

当然,想要用完只coding肯定是不行了,就得多agent狂跑。

缓存使用情况

像是昨天的话如果缓存免费,那就省下超多的一笔积分消耗了。可惜小米要赚这个钱。

小米的积分消耗

和小米的价格对比。

价格对比

因为我只有小米的官方的codingplan,所以就拿小米来做主要测试了。

不过可惜的是这个模型不支持多模态,也就是不能读取图片。

那我就主要来测试一下我平常用到的使用场景吧。

OpenClaw接入longcat

我就直接让OpenClaw帮我接入了,这个模型是1M的上下文,支持深度思考,挺不错。

深思思考

以平常我要下载某音视频为例。如果我发某音链接,我的OpenClaw会自动下载无水印版本并传到我的nas指定文件夹并归类。这是一个比较简单的步骤,因为skill都已经写好。直接调用我试下。

下视频并传nas

整个流程还出现了一次报错,问了一下是调用出问题自己又去解决。不过整体对话的时候会感觉速度明显偏慢。于是我测一下速度。

测速

但是运行途中出现了任务中断的情况。

重新问的时候结果当前用的模型没测。这个智商有点低说实话,我感觉如果以人类的视角来看,“这个模型”指的就是当前用的吧。“和”小米模型说明还有非小米模型。所以感觉理解能力有点差了。

输出结果

速度测下来符合预期,确实慢的可怕。

速度太慢了

顺便看了一眼统计,OpenClaw这里提示花了2MToken,longcat后台显示只消耗了18万。

模型花费

longcat后台

至于测试写的文章,我还让他们几个互评质量。

互评质量

目前看来LongCat整体质量很不错。就是速度太慢了。

OpenClaw的运行上没有问题,但是OpenClaw这种定制智能如果拿来日常体验的话非常吃速度。所以我还是用mimo2.5了。如果你不是很介意速度的话,longcat肯定是经济实惠的选择。但是由于只有一个消费档位,所以就成了一个“高不成低不就的状态”。

愿意掏一个月400的看不上这点便宜,更注重质量。

普通用户一个月就几十块钱预算还用不上。

所以美团的longcat营销部门是真没打算往外卖啊,可能是因为算力不够?

vibecoding

我平常还用claude code来开发。将longcat接入到claude code。

来实现一个落地需求吧,将这个界面的UI优化成和登录界面风格一致。

授权成功

尝试优化

实际体验下来速度感知就没OpenClaw那么强了,因为vibecoding虽然要求很高速度,但是如果差别只是10几tokens/s,感受就不是很明显。再加上我之前用mimo2.5pro,所以实际体验下来速度差不多。不过智商属实堪忧。

气笑了

不过这也不能说明能力问题,因为每天也经常和这种事打架。

授权成功

最后做出来的感觉还不错,顶部的安全图标还有背景动画。

不得不感叹当缓存价格免费的时候,Token费用是真的省钱。

但是当出现负载稍微大一点的任务的时候,Token限速的弊端就凸显出来了。

思考时间过长

不过虽然思考时间相当长,但是解决问题的能力还是很强的。我主观的体感是比pro模型好一点,但是速度慢。

但我正感到很不错的时候,让他修个客户端登录不弹授权界面的bug,半小时没搞定。还改了一堆错的东西。我切回小米的时候还要一条一条修。

小米:《没必要,而且不应该加》

没必要而且不应该加

总结

longcat质量在一些场景还行,基础的使用场景也能跑,缓存部分完全免费的特性适合OpenClaw、claudecode这种需要多次调用工具的场景,因为这种消耗的Token大多都是缓存。但是速度偏慢、质量偏低我担心会给国产化抹黑。所以既然以国产之名做,那就尽可能做好一点。

已换回小米,差距真的还挺大的。