AI 打破了互联网的零边际成本神话

从 AI 应用的真实账单出发,重新理解传统互联网的低边际成本、AI 的按需生产属性,以及免费、增长和独立开发在 AI 时代为什么都要重新算账。

最近有个感觉越来越强:AI 应用不像传统互联网产品,更像是互联网后面接了一座工厂。

这个说法听起来有点怪。毕竟 AI 也是网页、App、API,也是软件工程,也是订阅、会员、SaaS 这些老词。用户打开一个页面,输入一句话,得到一段回答,看起来和过去使用搜索、IM、在线工具也没什么本质区别。

但账单不会骗人。

传统互联网很大一部分魔法,来自复制和分发。做一个搜索引擎很贵,做一个电商平台很贵,做一个社交网络更贵。但当系统已经建起来之后,多服务一个用户的额外成本,往往低得多。

这个额外成本,更准确地说叫边际成本。

English version: AI Broke the Zero Marginal Cost Myth of the Internet

互联网后面的 AI 工厂

边际成本低,才有了互联网行业很多后来被奉为常识的东西:免费、补贴、先增长后商业化、先把用户做起来再说。只要用户来了,后面总能想办法从广告、会员、佣金、游戏、金融、云服务或者别的什么地方把钱挣回来。

这种故事听多了,人很容易产生一种错觉:软件嘛,反正复制一份又不要钱。

AI 把这个错觉打碎了。

互联网以前像印刷术

传统互联网当然不是没有成本。服务器要钱,带宽要钱,工程师工资更要钱。大公司一年花在机器和人上的钱,绝不是小数目。

但它的基本气质还是复制和分发。

一篇文章写出来,可以被一万人看。一条商品详情页做好,可以被一万人打开。一条朋友圈发出去,可以在很多人的信息流里出现。一份搜索索引建好之后,可以服务无数次查询。哪怕背后还有缓存、数据库、推荐系统、广告系统,总体上仍然是在把已经存在的东西更高效地送到用户面前。

所以互联网像印刷术。

印第一本书很麻烦,排版、校对、制版、开机,都要成本。但机器一旦转起来,多印几本,单位成本就下来了。互联网把这件事做到了极致,甚至让人忘了纸张和油墨的存在。

这也是为什么早期互联网公司敢烧钱。用户越多,数据越多,网络效应越强,成本被摊得越薄。增长看起来像一条通向胜利的路,虽然路上死过很多公司,但逻辑本身是通顺的。

AI 不一样。AI 的很多输出不是提前印好的书,而是用户来了以后现场开炉。

AI 更像按件生产

用户问一句话,模型要推理一次。用户让它总结一篇长文,模型要读上下文再推理一次。用户让它画一张图,后面是更贵的图像模型和更长的计算时间。用户让 Agent 搜索、读文件、写代码、跑测试,那就不只是一次回答,而是一串连续的生产动作。

AI 的按需生产线

这时候,软件的外壳还在,工厂的性质却露出来了。

token 像原材料,GPU 时间像机器工时,显存像车间容量,模型能力像设备精度,上下文长度像工艺复杂度。API 调用像找外面的工厂代工,自部署模型像自己买机器建产线。

这不是一个完全严谨的经济学模型,但对开发者很有用。因为它会逼着人问一个朴素问题:

每来一个用户,到底是在挣钱,还是在亏钱?

过去做一个小工具,可能最担心的是服务器扛不住、数据库慢、带宽被打爆。AI 应用多了一个更扎心的问题:服务器也许扛得住,但钱包扛不住。

我之前写过《AI应用开发者的困局》。里面提到过一个 AI 绘图小程序,即使用了弹性部署,只在有用户请求时才启动 GPU,按秒计费,一张图也要 1 到 2 角钱。

一两角钱,听起来很便宜。

但如果这是一个免费功能,就完全是另一回事了。用户生成一张图,开发者掏一两角。用户生成十张图,开发者掏一两块。用户觉得“这功能真好玩”,开发者看账单觉得“这事不太妙”。

这就是 AI 应用和普通互联网工具最不一样的地方。它不是多几个访问、多几次点击那么简单。它的每一次有效使用,都可能是真金白银的消耗。

免费开始变得沉重

互联网产品喜欢免费。免费邮箱、免费网盘、免费社交、免费内容、免费工具,都是这套逻辑养出来的。

当然,免费从来不是真的免费。有人付广告费,有人付会员费,有人贡献数据,有人被生态绑定。只是用户感知不到,或者暂时不用直接掏钱。

AI 应用的免费比较尴尬。

用户不是只占了一个账号、几行数据库记录、几 MB 存储空间。用户只要开始真正使用模型,就开始烧成本。长上下文、多轮对话、图片生成、语音生成、视频生成、联网搜索、代码执行,这些东西越强,越不像空气。

于是很多过去可以后置的问题,现在必须提前想清楚。

未登录用户能不能用?免费额度给多少?高成本模型要不要限制?失败重试算不算额度?接口被刷怎么办?用户只是来玩一下就走,成本算谁的?付费用户的收入能不能覆盖模型账单?

这些问题看起来是商业问题,落到代码里全是工程问题。

要做登录,要做额度,要做限流,要做缓存,要做队列,要做模型分级,要看调用成本,要防止有人把接口当公共水龙头。以前做个网页工具,裸奔上线也不是不能活。AI 工具裸奔上线,有时像把一台开着的机器放在路边,还贴一张纸:欢迎免费使用。

当然会有人来用。

问题是机器归谁供电。

增长也可能是一种危险

互联网人通常怕没人用。

AI 产品当然也怕没人用,但它还怕另一件事:太多人来用,而且都是不付钱的人。

增长与成本仪表

这件事对独立开发者尤其残酷。大公司可以把 AI 当战略投入,可以用云、广告、生态、资本市场来摊账。独立开发者没有这么多腾挪空间。账单来了就是账单,信用卡扣款不会因为“这是未来趋势”就少扣一点。

所以 AI 应用的增长要看质量。

一个愿意为工作流效率付费的用户,和一个生成几张图就走的用户,对产品的意义完全不同。前者可能是业务,后者可能只是成本。以前说用户增长,多少还有点喜气;AI 应用里,低质量增长有时像接到一批没有货款的订单,车间加班加点,老板越忙越穷。

这也是为什么 AI 应用更早进入毛利思维。

一个功能酷不酷,不够。用户想不想用,也不够。还要看用得越多亏不亏。很多 AI demo 在展示时很惊艳,真正放到线上就会露出另一面:效果越好,大家越爱用;大家越爱用,账单越好看。

当然,是反方向的好看。

成本会降,但不会消失

有人会说,算力会越来越便宜,模型会越来越便宜。

我也相信会便宜。芯片会进步,推理框架会优化,模型会量化、蒸馏、裁剪,小模型会承担更多简单任务,大模型厂商也会继续打价格战。

但便宜不等于没有成本。

宽带变便宜以后,互联网没有停留在文字网页,而是走向图片、视频、直播、云游戏。存储变便宜以后,人们也没有少存东西,而是拍更多照片、传更多视频、做更多备份。

算力变便宜以后,AI 大概率也不会停留在今天这种问答强度。上下文会更长,Agent 会更复杂,自动化任务会更多,原本一天调用几次的东西,可能变成后台持续运行。成本下降会扩大使用边界,也会制造新的消耗方式。

所以真正需要的不是幻想成本归零,而是学会算账。

简单问题用便宜模型,复杂问题再用强模型。能缓存就缓存,能异步就异步,能让用户确认就不要重复生成,能在本地做的预处理不要全丢给大模型。模型路由、成本监控、额度体系、失败重试策略,这些听起来像工程细节,其实都是 AI 产品的生意基础。

一个不看成本的 AI 应用,就像一个不看电表的工厂。机器声越响,未必越兴旺。

旧互联网公式不够用了

AI 当然仍然是软件。

它可以快速迭代,可以在线分发,可以订阅收费,可以用很小的团队做出过去很难想象的东西。这些都是软件的优势。

但 AI 又不只是软件。

传统软件最厉害的是复制成本低。传统互联网最厉害的是分发成本低。AI 应用多了一个麻烦:高质量输出有生产成本,而且这个成本会随着使用量一起增长。

所以“先免费做大规模,再慢慢商业化”这句话,在 AI 应用里要重新掂量。

成本由谁承担?

用户直接付费,那产品就要值得付费。企业客户买单,那就要嵌进真实工作流。广告覆盖成本,那流量价值要足够高。平台补贴,那就要接受平台什么时候想补、什么时候不想补。如果只是开发者自己承担,那最好一开始就知道,这是练手、实验,还是一门长期生意。

不是所有 AI 项目都要赚钱。学习项目、作品集、技术验证,当然可以不赚钱。但如果把它当产品,就不能只讲愿景,不看账本。

互联网过去让人相信,规模会解决很多问题。

AI 会提醒人们,规模也会放大很多问题。

最后还是那句老话

所以,“AI 像制造业”不是一个单纯的比喻。

它是在提醒开发者:AI 把生产行为重新放回了每一次请求里。传统互联网像复制和分发,AI 更像按需生产。它仍然有软件的速度,却也有工厂的成本;它可以把入口开给全世界,也会在每一次输出时消耗真实资源。

这并不悲观。

相反,正因为成本真实,价值也会更真实。一个 AI 应用如果能让用户愿意为每一次生产付费,或者愿意为它带来的效率长期付费,那它就不只是玩具。它可能是工具,可能是服务,也可能是一种新的生产组织方式。

只是这个时代不再允许开发者完全躲在“互联网免费”的幻觉里。

软件把复制变得便宜,互联网把分发变得便宜,AI 则让计算本身变成产品的一部分。

而生产这件事,说到底从来不神秘:

机器要转,材料要耗,电表要走。有人愿意为它付钱,生意才可能继续。