DeepSeek没那么火了?

Posted by Wantsong on Saturday, April 5, 2025

这两天一直有朋友问我,“感觉最近DeepSeek没那么火了,是这样么?”

我整理了思路,大致有以下几点:

  • 1. 圈里圈外两重天 圈里人天天追新模型,从代码最强的V3到画画最强的4o,再到推理能打的2.5,确实让人眼花缭乱。 圈外人呢?用惯了玩具的国人年初突然发现真正的工具,这个是火起来的主因。 但用惯了先进工具的人可能只会觉得“哦,原来你们也跟上来了”。而不习惯的依然不习惯,需要时间去消化。

  • 2. 技术是慢变量,资本是快变量 技术要靠实验室里日积月累,但资本总想“快进快出”。正如刘润评朱啸虎撤资时说,技术靠实验、试错、长期积累;资本靠回报、规模、周期压缩。当资本试图用“快钱逻辑”来推动“慢产业节奏”,就会形成撕裂感。真正改变行业的节点,从来都很安静。不是在发布会,不是在朋友圈,而是在某个实验室某次部署后。 慢、无声是符合行业改变的客观规律的。轰轰烈烈的那是运动,而社会格局改变向来是悄无声息的。 我们的人是不是太习惯于运动式,大干快干这些了?

  • 3. LLM相关的储备与改进都需要时间 到应用侧,从人的认识改变、基础设施的搭建、流程的变革再到相关人才的培养,哪一个不需要时间消化? 仅拿提示词来说,有多少人写不好?这个问题一直困扰了我两年,直到最近为了搞明白这个,连续整理了四个模型:

    1. 什么是问题
    2. 专家们如何思考解决问题
    3. 写提示词需要哪些学科知识和专业技能
    4. 一份“好”的提示词框架是什么样的

    这才发现,除了提示词本身是工程外,写好提示词这个对我们碳基来说也是一个系统工程:从底层认知、方法设计再到具体执行、扩展创新都需要长期培养和锻炼。

  • 4. 面向AI开发的元建模现在是空白 说到建模,了解软件开发的都知道面向过程在1970年代确立了方法论,面向对象到1990年代确立了方法论。尽管现在大部程序员可能还是面向过程的思路,但是多少都受到了OO的哲学和工具链(UML、设计模式)影响,这些都是过去软件开发的方法论——面向业务逻辑建模(企业流程、软件架构)。 而最重要的是,现在面向AI开发,还缺乏一套方法论——对建模的建模(即元建模),就像定义UML这种建模语言的语法和语义的规范那样,这样大家干活才不会像无头苍蝇。 现在人工智能领域最火最前沿的是面向认知建模,得拉着语言学、认知学甚至哲学的人一起搞事。这个做起来了,才能去对认知建模过程建模——元建模。

罗马不是一天建成的。火与不火都是个人的问题,就像我在“什么是问题”里讲,问题都是主观的,与客观事实没有关系。