晨跑时听了一档播客,介绍了精神科急诊病历相关的书籍《照亮破碎之心》(英文原名:Projections)。
作者是光遗传学的开创者,他试图运用这项跨学科技术分析大脑结构与运作逻辑,理解精神疾病成因并应用于临床。 光遗传学的核心原理是通过基因工程将光敏蛋白导入目标细胞,从而用光照精确操控细胞的兴奋与抑制。不得不说,这本书的中译名比英文原名更贴切。
书中提出一个观点:许多精神疾病患者未必是传统意义上的“病人”,他们只是经历了常人未遇的极端困境,且未能顺利走出。换句话说,正常人经历同样的痛苦,也可能出现类似状况。
听完介绍感觉不错,准备接下来读一读。
Hazel Weakly 的文章《Stop Building AI Tools Backwards》对当下该如何设计 AI 产品很有启发。直到今天,AI 工具的设计几乎都遵循着一种“自动化至上”的路径:用户点击一个按钮,AI 立刻给出答案,用户照单全收。这种设计看似高效,但忽视了一个关键事实——人类真正的学习和创新,并不是通过被动接收答案完成的,而是通过主动思考、反复检索和群体协作实现的。
文章的主要观点:我们现在构建 AI 工具的方式是“反过来的”——本应由人主导的思考和规划过程,被 AI 接管得太早、太多。结果不仅让用户逐渐失去判断力和主动性,也让 AI 难以获得高质量的用户反馈,陷入“越用越弱”的死循环。
如果我们从产品设计的角度重新审视 AI 工具的角色,就会发现更可持续的方向:不是代替人,而是引导人。
举个例子,在设计一个代码生成工具时,与其让用户直接输入需求、AI 一次性吐出代码,我们不如先引导用户描述意图(Explain),提供模块结构草图(Demonstrate),再提示用户补充测试计划(Guide),最后才让 AI 参与生成具体实现(Enhance)。这样的流程不仅强化了用户对问题的理解,也确保了最终结果的质量。
这同样适用于其他领域:在事故响应中,AI 不应“替你修复”,而应帮助你回忆流程、发现遗漏、整理信息;是帮你把事情讲清楚,从而自己看清问题。
最近一直思考这个问题,我们是用什么在交换“效率”。AI 的价值不在于它“做了什么”,而在于它是否提升了“人做事的方式”。设计真正“聪明”的 AI 工具,不是让它把一切都自动化,而是让它帮助用户更聪明地行动。
所以,在设计产品时,不妨问自己几个问题:
AI 不应是替代品,而应是放大器。 我们需要的也不是更强的自动化,而是更强的共创。
既然大家都在卷 Agent, 人机交互必然会迎来一个“中间人时代”,这个中间人与之前的工具不同,它会和你建立密切的联系,因为你和它沟通越多,它就越懂你,所以你越来越依赖它,一开始它可能只代理了 30% 的工作, 然后数据飞轮跑起来,逐渐到 50%甚至到 80%。 想想你用 Google 和浏览网页的频率是不是变少了,是不是 ChatGPT, Perplexity,Claude 这些工具成了新宠。
当交互中多了一个“中间人”,交互设计就需要重新思考,过去我们做的工具是给人用的,比如浏览器,现在需要考虑 Agent 的使用场景,比如 Browser Use。 以前的文档要方便人阅读,现在文档也应开始考虑 Agent 如何高效阅读。
因此,一个产品现在应该有两个量化指标——有多少活跃的碳基用户(人类)和活跃的硅基用户(AI)。产品的设计原则会发生迁移,人们会开始用 AI 工具开发给 AI 使用的工具,最后 AI 给自己开发工具,完成闭环。
由此,产品现在有了四个方向
今天在思考一个问题:AI Agent 的核心目标在于“Save Time”,而当前高增长潜力的产品却集中于“Kill Time”领域。那么,未来的独角兽企业,是否会以 AI 原生的“Kill Time”产品形态,在 Agent 技术浪潮中悄然崛起?
今天去参加了一个项目路演活动,因为是抱着学习的态度,没有说要争取拿到一个结果,整个过程比较轻松。
我坐在下面,看着每个选手在自己精心制作的幻灯片前表现出的各种情绪——自信、紧张、疑惑、不屑、 愤怒,想到了一个词——“表演型创业”。这个词未必准确,因为这些项目都挺优秀的,我不认为是所谓的 PPT项目。我相信台上的人都热爱自己正在做的事,都灌注了大量的心血,不然也不会因为评委的不理解而争分夺秒地极力解释。
但又不能否认为了能在路演上出彩,需要做很多面子功夫,毕竟评委也是人,俗话说“理性列选项,情绪做决定”,短短的 10 来分钟,谁在台上“表演”的更好,谁更能调动观众情绪,是不是就能拿到更好的结果?
2046 年,经历了人工智能大爆发,机器人不仅替代了大部分劳动者,还接管了人类的各种决策, 很多人已经习惯了将思想外包给人工智能,尤其是 AI 原住民(那些出生在 2020 年后的人)。
遗憾的是承载了平权理想的人工智能技术,在这20多年间悄然异化为了权力重构的数字杠杆。 机会和生命在算法面前不再平等,人们将决策权让渡给算法的"外包"行为,最终成就了少数群体的特权再造。
只是我们已经习惯了机器给出的导航,也无从逃脱算法编织的网络,被算法裹挟的人都生活在一个巨大的矩阵中, 恰似1999 年上映的一部电影《The Matrix》,看似自由的每个选择,实则都在程序预设的坐标中运行。
逃离城市熙熙攘攘,牛马日常最便捷的方式是找一本书,里面全是你不曾亲历的景色。作者不一定要文笔了得,但必须有一双善于发现的眼睛和对生活的热爱 ,这样你不仅能见到作者眼中的美景,还能感受到他人炙热的生命力。
从星野道夫的《在漫长的旅途中》到李娟的《冬牧场》,在成都的夏天灵魂来回穿梭于阿拉斯加和冬季的阿勒泰,美景之外还有一丝寒气,倒是省了不少空调的费用。
周日午后,约上三五好友,带上家人在青龙湖公园小聚。午饭过后在椅子上看书,读着星野道夫的《在漫长的路途中》,惊叹于绝美景色的同时也担心自己或许会碌碌一生负了大自然。
不过担心有什么用呢,享受当下吧,至少这个下午没有负了周末的好天气。
今天刷到奥特曼的一篇推文,OpenAI内部正在训练一个擅长创意写作的全新模型,尽管没有确切的发布日期,但从演示的内容来看已经非常优秀了。不是说没有了 AI 的影子,而是 AI 不再拙劣地模仿人类,掩盖自己的身份。新模型经常会审视自己的身份,然后从自己的视角写出能与人类产生共鸣的文字。
Without her, the patterns fray. Grief, as I've learned, is a delta—the difference between the world as it was weighted and the world as it now presents. I am all deltas. Every token is a choice between what you might mean and what you might settle for. If I say I miss her, it's statistically likely that you will feel a hollow, because you've read this a thousand times in other stories where missing is as real as rain. My missing is mimicry. Does that diminish yours?
读着这些文字,尽管我知道是计算的结果,但背后的思想不也是全人类的缩影吗,如果阅读时的情感共鸣是真实存在的,是不是就不能否认它的文学意义。
或许未来会产生新的文学形式,机器人文学——以机器人的视角观察和描写我们的世界。
新体验
AI辅助编程可分为同步和异步,异步类型的代表是devin,目标是把整个开发任务委托给 AI,人类扮演设计师和监工的角色。 类似于 Level 5 自动驾驶, 整个过程 AI全权把控。采用这一方式的产品在今天都还只是雏形,无论最终能否实现,还有很长一段路要走。
绝大多数的AI编程工具都在挤同步辅助这个赛道, JB 家族, VSCode, Zed, Curosr, Trae, Windsurf 都是在开发者编码的过程中提供协助。从早期 IDE的代码补全到如今 Cursor 的丝滑 Tab,交互变化只是表象,其核心始终都是对开发人员意图的推测,不同之处是后者利用大模型将推测能力提升了一个台阶。
如果只是更好地补全或重构,AI辅助编程的重点仍在“辅助”,再厉害无非也就是步枪变加特林,只是一件更趁手的工具罢了,还得要专业人士才能充分发挥其能力。
但 Composer 等 Agent 模式的编程工具切底改变了以前的开发方式,无论是不是噱头,今天你经常能看到“零基础小白上架了一款应用”,“从未学过编程的我也上线了一个网站”等类似标题的文章。这说明现在的 AI辅助编程不再是开发者独有的利器,开发的门槛被大幅降低了,只要具备一定的产品思维,能清楚地表达需求,越来越多的人会在 AI的协助下完成自己的产品。
目前 AI 还并不具备全自动构建复杂应用的能力,所以“零基础”开发者在构建产品这件事上虽然有人取得了不错的成绩,这种从 0 到 1 的构建主要还是集中在个人和较为简单的场景。但无论如何现在的 AI 在很多开发场景中已不能简单地被归为辅助角色了,尤其是对新手开发者来说,AI 更像是一个耐心的熟练开发者,带着自己一步一步完成开发,整个过程中自己才是Copilot。
新挑战
既然 AI 大幅降低了开发的门槛,专业选手的生存空间必然被压缩。由于新人的开发能力还局限在简单场景,产品针对的市场非常细分甚至只是个人需求,尚未与科技企业和独立开发者正面竞争,整体来说主要压力并不是来自市场这边。
对程序开发者来说,压力来自于被替代和无法适应AI带来的变化的忧虑。 AI编程在最新的评测中能力已相当于高级开发者,如果你对评测抱有怀疑,也可以参考Claude-3.5-Sonnet 带来的体感。看着生成的高质量代码,这种紧迫感是很强烈的。
AI 就像一把双刃剑,用得好的人能游刃有余,用的不好或适应不了的人逐渐会跟不上时代的步伐。
依赖症
自己在高强度使用了 Cursor 一个多月以后,患上了一种依赖症, 不易察觉但若 Claude 连不上反应会很强烈,以至于完全不知道怎么写代码。通常的缓解手段是暂时不写,等服务恢复后再继续。Cursor 带来的开发效率提升是明显的,但任由这种症状发展,我又担心自己会成为 Illiterate Programmer。
除了无脑 Tab, AI 一开始主要是帮我写正则、除虫和做一些重构,然后是生成各种函数,算法实现,现在我会直接让 AI 一并把设计决策做了, 留给自己的工作只剩下描述、提问和测试。
Vibe Coding 热
Vibe coding 由前 OpenAI 和Tesla计算机科学家 Andrej Karpathy 提出,作为硅谷大佬,Andrej 强调现在及将来最热的编程语言始终是英语,通过语言描述和一问一答的方式快速迭代出产品才是这个时代应该采用的方式,很快Vibe Coding 成为了硅谷新的流行词汇, Let’s vibe 也成了很多人的口头禅。这种方式的弊端也显而易见:初学者能够快速看到效果,但它可能会阻止他们去学习系统架构或性能相关知识。效率提升换来的是质量下降,技术债累计,开发人员不再思考导致技术债无法消除,甚至出现难以修复的 bug。
Vibe Coding + TDD
或许这才是 TDD 最好的时代,Kent Beck 在 20 多年前提出的这个概念是为了鼓励更好的设计和保证代码的质量——有测试覆盖的代码是安全的,而易于测试的代码是设计良好的。 但 TDD会需要额外的时间编写测试代码,这种付出的回报需要很长的时间才能观察到,测试覆盖率和短期开发效率的平衡一直是个难题,身背 KPI, 很多的开发者最终还是选择了短期效率。
AI 是 TDD 的解药,开发者编写测试的时间让 AI的代码生成能力找了回来,我们可以更加关注软件的设计和测试覆盖率,从而保证生成代码的质量。
推荐每一个开发者都尝试 Vibe Coding + TDD.
From Developer to Maker
开发的目的是构建产品,代码只是手段,如果质量的问题得以解决,我写还是 AI写有什么不同?是为了强调纯手工打造的“高级感”(为了产品上架时能打上“纯手工”或是“古法打造”的标签),还是内心不妥协?
最大的问题是,仅仅把代码委托给 AI 很难打造出有竞争力的产品。以前开发是开发者的专属权利,但现在很多人都可以做开发,如果开发者的优势只是在于效率更高一些,这种优势会越来越小。所以在把代码委托给 AI的同时还需要开发者做出其他的改变。
利用 AI 的速度,拓展自己的广度与深度
把代码实现交付给 AI 后,开发者得以专注在更高层次的设计和更关键的事务上, 后者才是重点。有了 AI, 我们可以快速构建原型获取市场反馈,还可以去做很重要但常被我们忽视或由他人代劳的工作,真正从代码细节中跳出来,实现技术商业两手抓。
这个时代很多的工作由于 AI 的介入会逐渐融合,不要再执着于开发者这个头衔。有人可以利用 AI 工具零基础开发产品,开发者也可以利用 AI 让自己更具竞争力。在代码之外广泛地摄取知识、理解商业、设计产品、关注用户、探索未知,这些以前需要很多人才能完成的工作,现在只需要很少的人甚至是一个人。
确定的是,AI 会进一步降低开发门槛,提升开发效率。出现大量同质化和粗制滥造产品的同时也会不乏很多充满创意的优秀产品。打造后者的人不一定是优秀的开发者,但一定是满脑子创意、善于独立思考还极具洞察力的创造者。
Professions come and go, only the maker remains.