AI之LLMs:当 AI 成为常驻合作者—AI 让我们做更多,也让我们担心更多:Anthropic 的使用数据与体验洞察—Claude 在岗位上的影响(产能、技能与协作的双刃剑)
导读:Anthropic的这项内部研究提供了一个独特而深入的视角,揭示了人工智能(特别是其自研的Claude)如何在其核心技术团队中引发一场深刻的工作变革。研究结果清晰地描绘了一幅充满机遇与挑战并存的图景。
在机遇方面,AI显著提升了软件开发人员的生产力,通过处理调试、代码理解等基础任务,以及实现新功能和设计规划等更复杂的工作,使员工能够以更少的时间投入获得更大的产出。Claude不仅加速了现有工作,还催生了新类型的工作,如修复“小麻烦”和进行此前因成本过高而无法开展的探索性项目。工程师们因此变得更加**“全栈”**,能够跨越专业领域,快速学习和迭代,提升了解决问题的广度。AI还改变了获取知识的方式,成为员工提问的“第一站”,加速了学习过程。
然而,这种变革也带来了显著的挑战和担忧。最突出的是对技能退化的担忧,即过度依赖AI可能导致工程师丧失亲手解决问题时获得的深入理解和附带学习,进而影响其有效监督AI产出的能力,形成“监督悖论”。此外,AI的介入也改变了职场社交动态,减少了同事间的日常互动和传统的师徒指导机会。更深层次的担忧在于职业未来的不确定性,许多工程师开始将自己的角色定义为“AI代理的管理者”,但对于长期而言,AI是否会最终取代人类工作,以及软件工程这一职业的最终形态,仍存在普遍的迷茫和矛盾心理。
文章强调,Anthropic作为AI构建者,其内部经验虽有特殊性,但可能预示着更广泛的社会转型。为了应对这些挑战,Anthropic正积极探索内部策略,包括促进团队协作、支持职业发展、建立AI增强型工作的最佳实践,并考虑结构性的角色演变和再培训方案。
总而言之,该研究表明,AI在提升生产力、拓展能力边界方面潜力巨大,但其对人类技能、协作模式和职业路径的深远影响不容忽视。未来的关键在于如何深思熟虑地驾驭这场转型,在享受AI带来的便利的同时,维护和发展人类的核心能力,并为不确定的未来做好准备。Anthropic的实践为其他组织提供了一个宝贵的“实验室”案例,展示了在AI时代,企业如何主动探索和适应工作模式的演变。
本研究通过对Anthropic内部工程师和研究人员的调查、访谈及Claude Code使用数据分析,深入探讨了AI(特别是Claude)如何从根本上改变软件开发人员的工作性质,带来了希望与担忧并存的显著变革。
AI如何重塑Anthropic的工作:
- 研究目的:考察AI在早期采用者(Anthropic员工)中的实际影响,以期为更广泛的社会转型提供借鉴。
- 研究方法:2025年8月对132名工程师和研究人员进行调查,53次深度定性访谈,并分析内部Claude Code使用数据。
- 主要发现概览:工程师工作效率显著提高,变得更“全栈”,学习和迭代速度加快,能够处理此前被忽视的任务。但同时也引发了对技术能力退化、有效监督AI产出、团队协作减少以及职业未来不确定性的担忧。
- Anthropic的特殊性:作为AI构建公司,员工拥有尖端工具和稳定领域,其经验可能预示着其他行业的未来趋势。
- 核心挑战:在AI带来生产力提升的同时,如何维护技术专长、保持有意义的协作,以及为AI增强型职场中学习、指导和职业发展的新方法做准备。
展望未来:
- 早期成果:员工对Claude的使用大幅增加,不仅加速了现有工作,还促进了新代码库学习、减少了繁琐任务、拓展了新领域,并解决了此前被忽视的改进。
- 希望与不确定性:生产力提升和学习效益显著,但对软件工程工作的长期发展轨迹仍存在不确定性。
- 历史类比:AI转型可能类似于软件工程从低级到高级语言的演变,或从个人贡献者到管理者的角色转变。
- 当前局限:仍处于早期阶段,Anthropic作为早期采用者,其发现可能不完全适用于其他组织或背景。
- Anthropic的未来行动:
- 与内部工程师、研究人员和领导层对话,解决机遇与挑战。
- 探讨团队协作、职业发展和AI增强型工作的最佳实践(如AI流畅性框架)。
- 将研究范围扩展到工程师之外,理解AI对组织内所有角色的影响。
- 支持外部组织(如CodePath)调整计算机科学课程以适应AI辅助的未来。
- 探索结构性方法,如组织内部的角色演变和再培训新路径。
- Anthropic的定位:作为一个负责任的职场转型实验室,不仅研究AI如何改变工作,更要实验如何深思熟虑地驾驭这种转型。
目录
当 AI 成为常驻合作者—AI 让我们做更多,也让我们担心更多:Anthropic 的使用数据与体验洞察—Claude 在岗位上的影响(产能、技能与协作的双刃剑)
1、关键发现(Key findings)
核心要点
经验 / 技巧
2、调查数据(Survey data)
2.1 常用任务类型
核心要点
经验 / 技巧
2.2 使用率与生产力变化
核心要点
经验 / 技巧
2.3 Claude 带来的“新工作”
核心要点
经验 / 技巧
2.4 “完全委派”能力的界限
核心要点
经验 / 技巧
3、深度访谈(Qualitative interviews)
3.1 AI 委派的策略与直觉
核心要点
经验 / 技巧
3.2 技能分布的扩展与深度能力的担忧
核心要点
经验 / 技巧
3.3 编码工艺(craft)与工作意义的变化
核心要点
经验 / 技巧
3.4 职场社交与指导/辅导的变化
核心要点
经验 / 技巧
3.5 职业前景与不确定性
核心要点
经验 / 技巧
4、Claude Code 使用趋势(Claude Code usage trends)
核心要点
经验 / 技巧
5、展望(Looking forward)与组织动作
核心要点
经验 / 技巧(面向组织)
6、方法学与局限(Appendix / Limitations)
当 AI 成为常驻合作者—AI 让我们做更多,也让我们担心更多:Anthropic 的使用数据与体验洞察—Claude 在岗位上的影响(产能、技能与协作的双刃剑)
地址 | 《How AI is transforming work at Anthropic》 https://www.anthropic.com/research/how-ai-is-transforming-work-at-anthropic |
时间 | 2025年12月3日 |
作者 | Anthropic |
1、关键发现(Key findings)
文章在开篇总结了来自问卷、访谈和使用日志的主要结论:工程师通过 Claude 在调试、理解代码、实现新特性等方面获得显著生产力提升,同时工作内容变得更宽泛(“full-stack”),但也带来对深层技能萎缩、协作减少与职业不确定性的担忧。
核心要点
>>最常见用途是 调试(debugging) 与 代码理解(code understanding)(日常使用比例最高)。
>> 自报数据:当前员工平均在 60% 的工作中使用 Claude,认为生产力平均提高约 50%(较去年 2–3 倍提升)。
>>约 27% 的 Claude 辅助工作是“之前不会做的”新工作(例如小工具、可视化、扩展实验等)。
>>大多数员工只会将 0–20% 的工作“完全委派”给 Claude(即仍需人类监督/验证)。
经验 / 技巧
把 Claude 当作 “常驻合作者” 而非“自动接手者”:适合用来快速把可验证、低风险、可拆分的子任务交给模型。
2、调查数据(Survey data)
本节详细阐述了对132名Anthropic工程师和研究人员的调查结果,揭示了Claude在编码任务中的具体应用、对生产力的影响、催生新工作的能力以及可完全授权工作的比例。
核心要点:
- Claude在编码任务中的应用:
- 最常见的日常任务:调试(55%)、代码理解(42%)、实现新功能(37%)。
- 较少使用的任务:高级设计/规划、数据科学、前端开发(可能因其复杂性或并非核心任务)。
- 使用率与生产力:
- 使用率从12个月前的28%上升到目前的59%。
- 生产力提升从12个月前的20%上升到目前的50%。
- 14%的“超级用户”生产力提升超过100%。
- 生产力模式:多数任务类别中,时间投入略有减少,但产出量显著增加。
- 时间节省的复杂性:部分人因调试AI生成代码或理解AI代码而花费更多时间,但也有人因此能坚持此前会放弃的任务,或进行更彻底的测试和探索。
- 产出量增加:普遍且显著,是AI提升生产力的主要方式。
- 局限性:生产力难以精确测量,自报数据存在偏差(如高估),但员工通过战略性AI授权可能克服了外部研究中发现的生产力下降因素。
- Claude催生新工作:
- 27%的Claude辅助工作是原先不会做的。
- 包括项目扩展、制作交互式数据仪表板等“锦上添花”的工具、文档和测试等繁琐工作,以及手动不划算的探索性工作。
- 工程师能修复更多“小麻烦”(papercuts),提升工作质量和效率。
- AI允许多版本并行探索,带来更多创造性。
- 可完全授权的工作比例:
- 超过一半的工程师表示只能“完全授权”0-20%的工作给Claude。
- 原因在于需要与Claude主动迭代协作,并验证其产出,尤其是在复杂或高风险任务中。
经验技巧:
- 将Claude用于调试、代码理解和实现新功能是高效的策略。
- 通过战略性地选择可授权任务,可以最大化AI的生产力效益。
- 利用AI处理“小麻烦”和探索性工作,可以提升整体工作质量和创新性。
- 在高风险或复杂任务中,始终保持对AI产出的监督和验证。
2.1 常用任务类型
通过问卷量化了工程师在日常使用 Claude 的任务分布:调试、代码理解和实现新特性为高频任务,设计/高层次规划相对较少。
核心要点
>> 日常使用占比最高:调试 55%、代码理解 42%、实现新特性 37%(按日常使用率)。
>> 高层设计/规划、前端/数据科学等任务的日常使用较少(这些通常保留给人类或较少场景下交给模型)。
经验 / 技巧
>> 优先把 Claude 用于“重复性高、可验证”的场景(例如单元修复、标准化重构、注释生成),把“taste/设计”相关任务留给人类主导以保护设计质量。
2.2 使用率与生产力变化
员工自报过去一年中 Claude 的使用从 28% 增至 59%,自评生产力提升从 +20% 到 +50%;同时产出量增加但部分任务时间未必减少(有分化)。
核心要点
>> 自报使用率与生产力出现显著上升;部分“power users”呈现 >100% 提升。
>> 时间与产出出现分化:总体“单位任务时间下降、产出量显著上升”,但也有部分人花更多时间调试与理解AI 生成的代码。
>> 自报数据有局限(回忆偏差、社交期望偏差);文章同时对比内部使用日志以缓和这些偏差。
经验 / 技巧
>> 在衡量 AI 价值时区分“时间/流程节省”与“产出数量增加”:组织应同时跟踪质量(bug rate、回滚)与产出,以避免只看“合并次数”导致误判。
2.3 Claude 带来的“新工作”
约 27% 的 Claude 辅助工作属于以前不会被做的工作,包括可视化、scale-out、清理低优先“papercut”等。
核心要点
>> Claude 帮助“修复 papercuts”(8.6% 的 Code 任务),这些原本会被搁置的小问题现在被系统性处理,从而提高工程体验与可维护性。
>> 并行试验能力(多版本同时尝试)显著提升探索性研究和创意迭代速度。
经验 / 技巧
>> 把 AI 用于“低成本实验和工具化”——用 AI 快速生成原型、仪表盘、小工具,随后人类评估可扩展性与设计。
2.4 “完全委派”能力的界限
尽管使用频繁,但大多数员工认为只有有限比例的工作可以“完全”不经人工监督地交给 Claude。
核心要点
>> 0–20% 的“可完全委派”占比反映出人类对高标准验证与高风险领域仍保持谨慎。
>> 对“完全委派”的解读存在差异(从“不需要任何验证”到“只需轻度复核”)。
经验 / 技巧
>> 制定分级委派策略:对任务按“风险—可验证性—价值”打分,低风险高可验证性任务可逐步放宽人工检查门槛;高风险任务保持严格人工复核。
3、深度访谈(Qualitative interviews)
通过深度访谈,本节揭示了工程师们在日常工作中如何与AI互动、其技能组合的变化、对编码工作的看法、职场社交动态的演变以及对职业未来的不确定性与适应策略。
核心要点:
- AI授权方法:工程师倾向于将以下类型的任务授权给Claude:
- 用户不熟悉但复杂度低的任务:如基础设施问题、不熟悉的Git或Linux操作。
- 易于验证的任务:验证成本远低于创建成本。
- 定义明确或自包含的任务:项目中相对独立的子模块。
- 代码质量要求不高的任务:如临时调试代码或研究代码。
- 重复或无聊的任务:越是无聊的任务,越倾向于交给Claude。
- 提示比执行更快的任务:但对于需要大量上下文的“冷启动”问题,人工操作可能更快。
- 信任与验证:
- 用户对Claude的信任度会逐步提升,从简单任务到复杂任务。
- 有人将其比作使用Google Maps,从不熟悉路线到日常通勤都依赖。
- 工程师在使用Claude时,有人选择在自己熟悉的领域加速工作,有人则用于拓展不熟悉领域,但都强调需要保持对产出的理解和判断力。
- 经验的重要性:有经验的工程师能识别AI提出的“聪明但危险”的解决方案。
- 保留给人类的任务:
- 高层次或战略性思考、需要组织上下文或“品味”的设计决策。
- 这些任务的生产力提升最少。
- 但随着模型改进,这些边界是“移动的目标”。
- 技能转型:
- 新能力:工程师变得更“全栈”,能处理此前不熟悉的领域(如后端工程师构建UI),加速原型开发、并行工作、减少繁琐任务、提升项目雄心。
- 动手实践减少:担忧技能退化,失去通过手动解决问题带来的附带学习(如阅读文档、构建系统模型)。
- 监督悖论:有效监督AI需要编码技能,而AI过度使用可能导致这些技能退化。
- 应对策略:有些工程师会刻意不使用AI来保持技能敏锐度。
- 对未来技能的看法:
- 软件工程可能向更高抽象层次发展,英语可能成为编程语言。
- 部分人认为这让他们能更关注产品和用户。
- 有人认为低级技能的流失是可接受的,因为它们不再是核心。
- 也有人认为技能侵蚀是不可避免的,且旧的工作方式不会再回来。
- 编码的乐趣与意义:
- 工程师对此看法不一:有人怀念亲手编码的“心流”体验,认为提示AI不那么有趣。
- 也有人接受这种权衡,认为生产力提升更重要。
- 另一些人则发现与Claude迭代更有趣,或更关注最终产出而非编码过程本身。
- 职场社交动态变化:
- Claude成为同事提问前的“第一站”,处理了80-90%的常规问题。
- 减少了对同事的依赖,但关键的20%仍需与人交流。
- 部分人协作模式未变,但也有人与Claude互动多于同事。
- 影响:减少了社交摩擦,但也导致了对人际互动和传统师徒关系减少的担忧。Claude可以为初级员工提供指导,减少了资深工程师的指导机会。
- 职业发展与不确定性:
- 角色转变:工程师的角色从编写代码转向管理AI系统,成为“AI代理的管理者”。
- 长期不确定性:普遍存在,许多人认为难以预测几年后的职业前景。
- 短期乐观与长期担忧:有人认为短期乐观,但长期担忧AI会取代一切。
- 适应策略:专注于更专业化的技能(如有效审查AI工作)、转向人际和战略性工作、利用Claude进行职业发展学习、保持高度适应性。
经验技巧:
- 有效授权:优先将低上下文、易验证、明确、低风险或重复无聊的任务交给AI。
- 建立信任:从简单任务开始,逐步增加对AI的授权,但始终保持批判性思维。
- 保留核心:将高层次思考、设计决策和需要人类“品味”的任务保留给自己。
- 技能维护:定期进行无AI实践,以防止核心技能退化,并培养对AI产出的有效监督能力。
- 适应变化:拥抱高层次抽象思维,关注产品和用户价值,而非纯粹的编码细节。
- 重塑协作:认识到AI会改变团队协作模式,探索新的沟通和指导方式。
- 终身学习:面对职业不确定性,培养高度适应性,并利用AI进行持续学习和技能提升。
3.1 AI 委派的策略与直觉
访谈显示工程师形成了“委派直觉”:倾向将低复杂度、低上下文或易于验证的任务交给 Claude,采取渐进信任策略。
核心要点
>> 委派依据三大原则:低上下文、易验证、模块化/自含。例如基础 infra 问题、局部重构更容易委派。
>> 信任是渐进建立的:从简单任务开始,逐步扩展到更复杂的工作。
经验 / 技巧
>> 在团队内部推广“渐进式试验”文化:从易验证的小任务建立模型可信度(build trust curve),并记录失败模式供团队学习。
3.2 技能分布的扩展与深度能力的担忧
Claude 让工程师更容易跨领域工作(变“full-stack”),但也有人担心深层技能(比如复杂架构设计、手工编码能力)会退化。
核心要点
>> 优势:个体能够触及更多任务 —— 前端、数据库、可视化等不再只属于专门团队。
>> 风险:长期依赖可能导致技能退化与评审能力下降,影响对 AI 输出的批判性把控。
经验 / 技巧
>> 设计“刻意练习窗口”(practice windows):定期安排无 AI 辅助的编程/设计任务、code review 或交叉导师制度,确保核心能力不萎缩。
3.3 编码工艺(craft)与工作意义的变化
部分人发现自己更享受“结果/产品”而非写代码的过程;另一些人仍怀念编码的工艺感。
核心要点
工作动机可能从“写代码本身”转向“解决问题与达成目标”;但对编码热情的变化在员工中并非统一。
经验 / 技巧
组织层面需关注工作成就感的多样来源:提供既能利用 AI 的任务,也保留能让人“沉浸编码”的项目以维持人才多样性。
3.4 职场社交与指导/辅导的变化
Claude 成为“第一问答对象”,导致人与人之间的即时互动、寻求帮助与导师-学徒关系出现减少的现象。
核心要点
结果:junior 向资深请教减少,可能影响知识传承与非正式学习渠道。
经验 / 技巧
主动创建“人际接触点”(office hours、pair-programming、代码走查会)作为补偿,确保 AI 不替代关键的人际教学场景。
3.5 职业前景与不确定性
访谈中既有对短期生产力提升的乐观,也有对长期被替代的焦虑,感受不一且带有根本不确定性。
核心要点
部分受访者乐观,认为工作会向更高层抽象、系统管理方向发展;部分人担心长期被替代或角色根本性萎缩。
经验 / 技巧
企业应提供明确的职业发展地图(role evolution paths)、再培训渠道与内部转岗机制以缓解不安并保留人才。
4、Claude Code 使用趋势(Claude Code usage trends)
本节通过对2025年2月和8月20万份Claude Code内部记录的分析,提供了客观数据,印证了调查和访谈中关于Claude使用复杂性增加、自主性提高、任务分布变化以及团队间差异的发现。基于内部工具日志(Claude Code),文章展示了模型在可自主完成操作数量、任务类型分布与团队差异上的变化,反映出模型能力提升带来的工作方式转变。
核心要点
>> 自主操作数从 ~10 次上升到 ~20 次(表示更少人类中断,模型能完成更复杂的工作流)。
>>复杂任务占比增长(例如设计/规划从 1%→10%,实现新功能从 14%→37%)。
>> “Papercut”修复占比 ~8.6%,显示模型在改善工程体验方面起作用。
>> 不同团队使用模式有差异:Pre-training 偏实验/特性迭代,Security 偏代码理解,非技术员工也能借助 Claude 做调试。
- 处理更复杂任务,减少监督:
- 任务复杂度提升:平均任务复杂度从3.2(基本编辑)提升到3.8(专家级任务),例如从“排查Python模块导入错误”到“实现和优化缓存系统”。
- 连续工具调用次数增加:Claude在无人干预下连续执行工具调用的次数增加了116%(从9.8次到21.2次),表明自主性增强。
- 人类交互回合减少:平均人类交互回合数减少了33%(从6.2次到4.1次),说明完成任务所需的人工输入减少。
- 任务分布:
- 显著变化:实现新功能(从14.3%增至36.9%)和代码设计/规划(从1.0%增至9.9%)的比例显著增加,表明Claude在更复杂任务上的能力提升。
- 整体分布:与自报数据大致吻合,最常见的是构建新功能、调试和代码理解。
- 修复“小麻烦”(Papercuts):
- 8.6%的Claude Code任务属于“小麻烦修复”,如重构代码以提高可维护性、创建性能可视化工具或终端快捷方式。
- 这些小修复累积起来能带来更大的生产力和效率提升,并减少日常工作的摩擦和挫败感。
- 团队间任务差异:
- 预训练团队:54.6%用于构建新功能(通常是运行额外实验)。
- 对齐与安全团队/后训练团队:最多用于前端开发(7.5%和7.4%),常用于创建数据可视化。
- 安全团队:48.9%用于代码理解,分析代码库的安全隐患。
- 非技术员工:51.5%用于调试(如网络问题、Git操作),12.7%用于数据科学,表明Claude能弥补技术知识差距。
- “全栈”能力增强:团队利用Claude拓展核心专业之外的能力,如预训练团队进行额外实验,非技术员工修复代码错误,研究人员利用Claude进行前端开发以可视化数据。
经验 / 技巧
利用使用日志识别高价值自动化点(例如经常出现的 papercut),并把这些点做成“小自动化包”,逐步降低日常维护成本。
- 信任AI的自主性:随着AI能力提升,可以逐步增加其自主处理复杂任务的范围。
- 关注高价值任务:将AI用于新功能实现和设计规划等更复杂的任务,释放人类创造力。
- 利用AI解决“小麻烦”:鼓励员工使用AI处理那些虽小但影响工作质量和效率的“纸屑问题”。
- 跨领域赋能:鼓励不同团队利用AI拓展其核心专业之外的能力,实现“全栈化”,弥补知识空白。
5、展望(Looking forward)与组织动作
认识到自己处于“早期采用者”的位置,强调要研究、试验并制定组织层面的实践(AI 流利度框架、再培训、跨团队协作等),并将在 2026 年公布更具体计划。
核心要点
更强模型带来显著收益同时提出对技术深度、协作模式、职业路径的新问题。
公司正在探索:如何维持技术专精、如何保留/重塑导师-学徒关系、如何支持职业发展与再培训、以及如何设计 AI-augmented 的最佳实践。
经验 / 技巧(面向组织)
制定AI 流利度(AI fluency)培训:把模型使用、验证流程、prompt engineering、风险评估纳入必修训练。
设计“混合工作合同”:对于某些岗位定义 AI-增强职责和人类独有职责,明确晋升/评价标准。
6、方法学与局限(Appendix / Limitations)
文章在 Appendix 明确了方法学细节与局限:样本选择方式(便利抽样与有目的抽样)、响应率偏差、非匿名回答可能导致社会期望偏差、以及研究仅代表 2025 年 8 月当时的模型能力。
存在选择偏差(对 Claude 更感兴趣或更有意见者更可能参与)。
自报生产力与记忆回溯存在不确定性;文章同时使用内部日志以求平衡。
研究时点是 Claude Sonnet 4 / Opus 4;随着模型快速迭代,结论可能随时间变化。
解读此类内部研究时,请同时参照匿名化调查、客观日志指标与第三方独立研究,以形成更稳健结论。