Token,正从技术术语转变为钱,它现身于云服务账单之中,出现在招聘薪酬包里,存在于官方统计口径里,而你每日刷短视频,使用AI助手,叫网约车,背后都在消耗着它。有个东西,在中国日均消耗达180万亿个,到如今却还没有一个统一的中文名,这事本身就值得去琢磨。
从技术圈到账单上
处于2024年年初之际,国内日均Token的消耗量为1000亿,直至2025年9月,其突破了40万亿,在今年2月增长到180万亿。该数字源自国家数据局,这表明Token早已不是仅仅是程序员所关注的事物了。春节过后,普通人首次察觉到Token是需要花钱的——借助AI撰写一份报告便耗费几万Token,云厂商的计价单位全部都是Token,账单上的数字增长速度比工资还要快。
以前,于技术圈内部而言,提及Token之感并无任何别扭之处,恰似程序员阐述API、SDK那般自然。可是,一旦此物进入老百姓的账单范畴,情形便已然发生蜕变。你前往营业厅缴纳话费之时,账单之上书写的是“本月消耗流量20GB”,却无人会书写“本月消耗Data”。依循同样的事理逻辑,一个每日消耗达180万亿个之多的计价单位,绝无可能始终运用英文。
学术界其实早有答案
即便2021年时,复旦大学的邱锡鹏教授已将Token译成“词元”并写进教材,且学术界也予以认同,可那时却无人谈说此事,只因Token并不具价值,它仅是自然语言处理领域中的一项技术理念,与普通大众并无关联,故而译成何种名称都无关宏旨。
今年初,《人民日报》刊发了一篇名为《漫谈词元》的文章,其所采用的便是“词元”这一译名。由此表明,在官方层面实际上已然存在现成的答案。然而,问题在于,当Token从技术术语转变为钱的度量衡后,究竟由谁来进行命名,这就不仅仅关乎语言学家了。
一场围绕名字的利益博弈
当下,声量最为突出的名字称作“智元”,推动最为用力的是一家名为“新智元”的AI媒体。在他们自身的文章当中写得极为直白:“我们提议把Token翻译作行业新达成的共识,即智元,将‘新’字留给我们。”这表明一旦“智元”成为标准译名,那么这家公司的品牌便与行业基础术语紧密相连了,每一篇探讨Token的文章都在为它进行免费的宣传推广。
百川智能创立者王小川公开表明支持“智元”,宣称他感觉挺好,对于从事创建工作的模型公司而言,称作“智元”意味着所产生的并非计费单元,而是“智能的基础单元”,售卖 Token 是在售卖流量,售卖“智元”则是在售卖智能,其有关估值的说法全然不同,身为清华大学教授的杨斌提出“模元”,将命名的权利朝着模型公司方向牵引,另外有之倡导“符元”,追溯至计算机底层的符号处理定义,技术层面十分纯粹,然而提出这个译名独自创作的人未获得公司支持,在探讨当中几乎没有什么影响力。
谁定义名字谁掌握定价权
在GTC大会上,黄仁勋表示,于硅谷,有人在面试时询问“这份工作能分到多少Token”,对此,他建议将Token纳入工程师薪酬。OpenAI的Sam Altman则观点更为超前,其认为Token会取代全民基本收入,每个人所分到的并非钱,而是算力。这听起来仿若科幻,然而背后的逻辑清晰明了:谁对Token的中文名予以定义,谁便在定义这个新经济单元的属性。
瞧一瞧历史便会知晓,“卡路里”这一词汇得以确立之后,整体食品工业的定价体系、标签体系以及监管体系均是围绕着它而构建起来的。“流量”于中国电信行业的定义一经确立,运营商依据流量来进行计费,凭借流量展开竞争,依照流量去设计套餐,商业模式围绕着这两个字辗转运行了长达十几年之久。Token当下正行进在相同的道路之上,它已然成为了云服务的计费单位,成为了大模型公司的营收口径,成为了国家层面用以衡量AI产业规模的核心指标。
一个词值钱之后所有人都想刻名字
2021年,学术界定出的“词元”陷入无人在意的境地,并非是由于翻译存在欠佳的状况,而是因为在那个时候,这枚“币”所具备的价值尚不够高。如今,它有了较高价值,VC圈开启了关于投资打款能否直接给予Token的讨论,媒体、大佬以及教授,每个人都怀揣着自身所中意的名字以及背后所蕴含的道理纷纷涌入。
将其翻译从来都并非是个难题,难题在于这个词汇究竟是于何时起始变得具有价值的。黄仁勋于GTC之上并未参与有关中文命名的探讨,他践行了一件更为简便的事情:高高举起一条印有着Token King的冠军腰带,宣称数据中心便是Token工厂。他并不需要去争执其名称究竟是什么,他仅仅需要使得所有人都明白这一事物是由他所制造生产出来的。
这场争论其实无关翻译
一个词语一旦化作钱的衡量标准,为其取名便并非翻译,而是铸币行为。若称作“智元”,铸币权归于AI叙事范围,也就是说谁讲述智能相关的故事谁就能从中受益;当称作“模元”时,铸币权归属模型公司,即谁拥有大模型谁就好比拥有印钱的能力;要是称作“符元”,铸币权归还至技术自身,然而技术本能不能替自身发声。
处于全球范围内最大 Token 消费位置的中国,每日将 180 万亿个予以消耗,然而,此物究竟称作什么,怎样来定义,由谁去定义,直至如今依旧不存在定论,这并非是翻译水平方面出现的问题,而是这枚全新货币具备的铸币权利归属于何人这一问题。
每天你所消耗的那个 Token,若是非得要给它取个中文名字,那你会把它称作什么呢?