自ChatGPT于2022年底问世以来,至今已逾一年半载。
这一年多来,经历了从对AGI的恐惧到接受的过程。在与朋友们交流时,发现自己在AI领域里是越来越“特立独行”—— 我已深谙人机协同之道,我的工作成果既融入了AI的智慧,也烙印着个人的思考,两者交织难分。
昨天一个朋友使劲问,是不是你写的,还是AI写的。你说我找AI炼个字,算谁的,AI比辞海好用吧。我所做的事情,主要都算是智力工作,不论决策,规划,制订还是撰写,也的确分不出来哪些是我这个人输出的部分,哪些是机器的。
由于自小喜欢科幻电影,喜欢机器人,所以这算是有对AI的内驱力吧。现在经营着一家很小的软件公司,尽管总觉得所用的技术很low,不及前沿,但在更广阔的视野中,它们仍属于高新技术的范畴。所以从接触到最新的科技信息上讲,比高精尖不如,比下还是有余的。
目前生成式AI的工具,使用起来还是有一定门槛的,比如就科学上网这一项,需要具备一定的计算机基础和专业知识,就能将很多非技术背景的人拒之门外。
前两天写的《聪明之道》,在那些常处“唤起”或“焦虑”状态的人群中,AIGC往往能展现出更强的效用潜力。若平时的事情都是放松或者无聊的情绪,那么也缺乏动力去了解“新质生产力工具”。
去年初GPT刚上市,就非常焦虑。从本质上讲,软件工程师就是翻译,把人类的自然语言翻译成机器的二进制语言。现在机器可以直接听懂人说话了,哪里还需要那么多翻译。直到我想通了一件事,只要比其他人快那么一点,就像熊来了的笑话里的那样,我就可以后被吃掉(没办法,在中国的精英教育理念下,只能有这样的思维模式),所以必须立马行动起来,毕竟替代人的还是掌握AI的人,而现在还不是硅基的天下。(参见《AI时代需要什么样的人才》)
魔法咒语
作为新生事物,总不是那么完美。去年初与ChatGPT3聊天,自己本地跑了Chatglm2 7B做RAG,“幻觉”现象明显,诗词张冠李戴,数据生搬硬造。你可以不会,但是不能胡说呀。与以前人工智障的各种音箱一样,令人啼笑皆非,当时想着至少还得七、八年才能见到AGI。媳妇去年试用后也就彻底断了再用的念头,由于兴趣,我断断续续地依然在跟进。
今年新产品如雨后春笋,眼见AGI就要破土而出。而高级/收费版也早已解决了幻觉问题。春节时,早上学会了行业分析,下午学会了看财报,感觉就是一天学会了冰系火系魔法,成为了“冰火大法师”,之后我继续“激励”媳妇(参见《亮剑》),她也终于愿意再尝试尝试,而再尝试后就如“滔滔江水连绵不绝”了。
其实不是的,核心挑战在于如何精准“凝结魔法咒语”上——提示词到底怎么写更有效。
提示词,就是写/说一段话,把你想让AI干什么表达清楚,他照着做。听上去很简单,做起来有难度,以至于我们现在都称其为提示词工程。
道理很简单,AI相当于一位掌握了全人类各领域学科知识的新员工,对你一窍不通,你得告诉他,他是谁,你是谁,上下文场景,做什么及输出的格式要求等等,类比一下你的新员工入职,先做公司的新员工入职流程,再去熟悉岗位工作环境。AI现在不需要时间去适应,需要你讲清楚。
AI的门槛
开始我觉着是表达能力的问题,毕竟大部分人的语文水平都是体育老师教的。根据调查,在社交交流方面,文字/语音的交互成本极高,只有5%的用户可以重度使用,这5%的用户消耗了50%的Token。因此推测:使用文字去展开脑海中想象的人,在人群中占比偏少,这是精神层面的消费。
后来发现,更核心的是解决问题的能力不足。无法准确定义问题,问不对问题就无从谈起解决,再加上傲慢,与对AI的不信任,想把AI用好的确有个过程且有点难度。 定义问题,举个简单例子,价格是什么?
在初接触到这个问题时,因职业习惯我会冒出来多个模型——软件及算法解决问题,都需要先对现实世界建模。在图书阅览室场景,可能更多的是个单点,只有图书的定价;在图书MIS场景中,可能是个数组,有采购价和定价;到再复杂些的ERP中,是个二维矩阵,因为价格会随时间变化,又增加了成本价,成本价还有先进先出、加权平均等不同的算法;而到金融(假设图书也能进期货市场)系统中,就变成了三维的,因为即使一次销售过程,售价也是一个区间加时间。对问题的理解,对场景的理解,决定了你问什么问题——用什么样的模型来分解问题。分解问题又包括:连续递进关系的活动和更细化些的子问题。
这些模型是我日积月累的经验,所以经验不足的人想用AI解决问题,因为缺少对模型、结构的把握,问不到点子上,问不出来。
谁容易傲慢?除了性格上自以为是的,就是那些专家们,因为他们浸淫多年赖以成名的路径,既是解决问题的方法,又同时是最大的拦路虎。也就是所谓的路径依赖效应。
路径依赖就是惯性,本质上讲是沉没成本。若要沿用新的方法或工具,那么过去的投入都会变成沉没成本,而新的方法工具还需要继续投入,有没有效果也不能肯定。比起成功,我们更恐惧失败,损失厌恶效应再发生作用,这个新的往往就被放弃掉了。
说到对AI不信任,根源在于人类不喜欢和没有情绪的机器聊天。
人类属于哺乳动物,哺乳动物的大脑边缘系统负责处理情绪、记忆、嗅觉等复杂功能。人和人、人和动物、动物和动物之间会产生边缘系统共振的状态,刺激下丘脑和杏仁核,在感受正面情绪时,下丘脑会产生多巴胺和催产素等荷尔蒙。多巴胺提升情绪,催产素促进关系,主要负责恐惧和焦虑的杏仁核会减少活动,让双方感觉安全舒适。
现在的AI产品还都没有任何情绪表达,和AI聊天没法让人产生催产素。即使前天GPT4o宣传视频中,AI有了些情绪反馈,这些个功能也都还没上线。
人类始终更喜欢人类,就算现在AI下棋吊打人类,人类还是只喜欢看人类下棋;不过也有一些反例,比如青少年更喜欢跟AI聊而不是跟心理医生聊,这个更多的是出于个人隐私安全的考虑。
还有一点就是数据安全。我23年闲暇写了大约不到10万字,没去什么平台发布,就是孤芳自赏。今年GPTs上线后,考虑了很长时间,才决定放进去做个“AI Bro Tsong”,看能不能自己站在自己肩膀上。这个就是怕别人盗了我的文章去,让我惊讶(参见苏联笑话:什么都别去思考;如果你一定要思考,不要说出来;如果你又要思考又要说,那就别写出来;如果你又思考又说还写,那么别签名;如果以上规则你都不遵守,那你就别惊讶)。目前与大模型的聊天对话记录,它都可以记录在册,怎么用,我们就鞭长莫及了。后来想着已经破罐子了,又一口气做了七个“AI强哥”,比较下他们的优劣,给他们挖挖坑(我自己的文章,我知道哪里有坑)。
最后就是要有闲(参见《你是不是很闲》)。我是我们公司的那只懒蚂蚁,本身也就在负责的新产品、新科技的探索工作,这样说来有点令人艳羡了。但是所有的画面都是看上去很美,做起来都是辛苦,8个小时的公司经营管理分析,产出2700个话题,63000字。😊
至于最终的反思,则带有一丝微妙的欣慰,那就是:狼来了,喊了一年多,依然没人动弹。