最近,科技圈里有个事儿闹得挺大,很多人都在讨论。
说的是有位叫安德烈·卡帕西的顶级人工智能专家,在网上免费公开了一个项目,名字叫nanochat。
这个项目最吸引人眼球的地方在于,它号称只需要花上大概一百美元,再加上他写好的八千行代码,普通人就能自己动手,造一个迷你版的ChatGPT出来。
这个消息一出来,马上就火了,在程序员的圈子里,这个项目的关注度涨得飞快,不到半天时间就收到了几千个赞。
一百美元,也就是咱们几百块钱,可能就是出去吃顿饭的开销,现在居然说能用来造一个人工智能聊天机器人,这事听起来是不是有点太玄乎了?
这到底是科技大神在给我们普通人发福利,让高科技变得亲民了,还是说这里面有什么我们没搞明白的门道?
咱们先得知道,这位叫卡帕西的专家可不是一般人。
他以前是特斯拉公司负责人工智能的总负责人,也是现在大名鼎鼎的ChatGPT母公司OpenAI的创始元老之一。
可以说,现在人工智能这么火,他就是最早在那扇大门里忙活的人之一。
所以,他拿出来的东西,分量肯定是不一样的。
他自己都说,这个nanochat项目是他写过的最“疯狂”的代码之一。
这个“疯狂”到底体现在哪儿呢?
简单来说,就是它把制造一个聊天机器人的整个过程,从头到尾都给你展示出来了,而且是用一种非常简洁、清晰的方式。
我们可以打个比方。
以前,如果有人想教你怎么造车,他可能会给你一份发动机的图纸,告诉你核心部件怎么运作,但这辆车剩下的部分,比如底盘、轮子、外壳怎么弄,你就得自己琢磨了。
卡帕西之前的项目就有点像这样,只管最核心的一块。
但这次的nanochat不一样,它给你的不只是一张图纸,而是一整套微缩版的“汽车生产线教程”。
从最开始怎么把一堆文字原料(数据)处理成机器能看懂的零件(分词),到怎么搭建起最核心的“思考引擎”(训练大模型),再到怎么教它学会像人一样对话、回答问题,最后甚至还包括了一个可以直接在网页上跟它聊天的界面。
整个流程,从无到有,清清楚楚,全都打包在这八千行代码里了。
那个一百美元的说法,也不是瞎说的。
卡帕西解释了,这笔钱主要是用来租用高性能的电脑服务器。
他举了个例子,租一个装了八块顶级显卡的服务器,让程序在上面跑四个小时,一个能跟你进行基本对话的迷你聊天机器人就训练好了。
这个机器人能干什么呢?
写个小故事,编几句诗,回答一些常识性的问题,基本上都没问题。
虽然它的聪明程度肯定比不上我们现在用的那些成熟产品,但已经具备了聊天机器人的基本雏形。
如果你愿意多花点钱,比如预算提到一千美元,让它多学习几十个小时,那它的能力就会有很明显的提升。
不仅说话逻辑更通顺,还能解决一些简单的数学题和编程问题,在一些标准化的知识问答测试里也能拿到不错的分数。
有数据显示,一个训练了二十多个小时的模型,在衡量综合知识水平的MMLU测试里能拿到四十分以上,这已经是个相当不错的成绩了。
看到这里,很多人心里肯定都活络起来了。
既然技术门槛一下子降得这么低,成本又不高,那我们是不是可以做点更有意思的事?
比如说,我把我们公司的所有业务资料、内部文件都给它学习,是不是就能训练出一个只为我们公司服务的、懂我们业务的“专属AI员工”?
或者,我把我所有的日记、写的文章、聊天记录都喂给它,是不是就能创造一个最懂我的“AI分身”,以后能模仿我的风格帮我写东西、回邮件?
这个想法实在是太吸引人了,因为它解决了我们工作中一个很大的痛点,就是希望能有个助手,既智能,又绝对了解我们的个性化需求。
就在大家对这个美好的前景充满期待的时候,卡帕西本人却站出来,给大家的热情浇了一盆冷水。
他非常明确地表示,他做的这个nanochat项目,其实并不适合用来实现大家想的那种“个性化定制”的目标。
这就让很多人感到困惑了,为什么不行呢?
卡帕西用了一个非常形象的比喻来解释这件事。
他把这个花一百美元训练出来的迷你模型,比作一个“心智非常年幼的小孩子”。
这个小孩子学会了说话,能模仿大人讲的话,但他的脑子里并没有多少真正的知识和理解能力。
现在,你希望把这个“小孩子”培养成一个精通你公司业务的专家,于是你把一大堆专业的内部报告和数据扔给他看。
结果会怎么样呢?
他可能会记住报告里的一些词句,甚至能学着报告的腔调,说出一些听起来很专业的词,比如“赋能”、“链路”、“闭环”之类的。
这种效果,卡帕西管它叫“有趣的鹦鹉学舌”。
表面上,它说的话题好像跟你公司的业务有关,但你只要稍微深入地问一个具体问题,它马上就露馅了,回答得前言不搭后语,逻辑混乱。
因为它根本就不理解那些文字背后复杂的商业逻辑和市场规律,它只是在进行一种基于概率的、纯粹的风格模仿,而不是真正的思考。
那么,要想真正实现一个好用的个性化AI助手,正确的路应该怎么走呢?
卡帕西也指明了方向,但这条路比大家想象的要复杂得多。
首先,你不能从一个“年幼的小孩子”开始培养,而是要找一个本身就已经很聪明的“成年人”做基础。
在人工智能的世界里,这个“成年人”就是指那些由科技巨头花费了巨额资金和海量数据训练出来的、已经具备强大通用能力的开源大模型,比如国外的Llama,还有我们国家做得很好的像阿里的通义千问、智谱的GLM等等。
它们本身的基础智力水平就已经非常高了。
其次,有了这个聪明的“成年人”还不够,你不能简单地把你的资料直接扔给他。
你需要一个非常专业的“老师”,把你的资料进行精加工,变成一套高质量的“专属教材”。
比如,把一份报告变成几百个一问一答的知识点,把一堆数据变成机器能理解的指令。
这个过程非常复杂,需要大量的专业技术和经验,目前还属于比较前沿的研究领域。
最后,用这套“专属教材”去训练那个聪明的“成年人”,并且在训练的时候,还要时不时地给他复习一下通用知识,防止他学了你的专业知识后,把原来会的常识给忘了,这在技术上被称为“灾难性遗忘”。
整个过程下来,远不是一百美元和几个小时能搞定的,它需要的是深厚的技术积累和大量的精细化工作。
这么一说,大家可能就明白了。
卡帕西开源这个nanochat项目,他的真正目的,可能并不是想让每个人都去开一个“AI小作坊”,而是想提供一个绝佳的“公开课”和“教学工具”。
在它出现之前,大模型的训练过程对绝大多数人来说,就像一个看不见摸不着的“黑箱子”。
我们只知道给它喂数据,然后它就能输出结果,但中间到底发生了什么,没人说得清。
而nanochat,就是把这个“黑箱子”变成了一个“透明的玻璃盒子”。
你可以亲眼看到,一行行代码是如何把冰冷的数据,一步步变成一个能与人交流的智能体的。
它用最简洁的方式,把每一个环节都清晰地展示了出来。
对于那些正在学习人工智能的学生,或者刚刚进入这个行业的工程师来说,这简直就是一本会动的、可以亲手实践的教科书,价值非常高。
从这个角度来看,卡帕西做了一件非常有意义的事,他在推动高深技术的普及和透明化。
这对我们国家的人工智能发展来说,也是一个很好的启示。
我们现在不缺应用AI的场景和市场,但要想在根源上变得更强大,就必须要有更多能够理解和掌握底层核心技术的人才。
像nanochat这样的项目,就为我们的年轻工程师和科研人员提供了一个非常好的学习和练手机会。
它能帮助我们的人才,从单纯的“使用者”,向更深层次的“创造者”转变。
只有当越来越多的人弄懂了AI背后的原理,我们才能建立起更加稳固和创新的自主技术体系,在未来的科技竞争中占据更有利的位置。
