AI之LLMs：当 AI 成为常驻合作者—AI 让我们做更多，也让我们担心更多：Anthropic 的使用数据与体验洞察

AI之LLMs：当 AI 成为常驻合作者—AI 让我们做更多，也让我们担心更多：Anthropic 的使用数据与体验洞察—Claude 在岗位上的影响(产能、技能与协作的双刃剑)

导读：Anthropic的这项内部研究提供了一个独特而深入的视角，揭示了人工智能（特别是其自研的Claude）如何在其核心技术团队中引发一场深刻的工作变革。研究结果清晰地描绘了一幅充满机遇与挑战并存的图景。
在机遇方面，AI显著提升了软件开发人员的生产力，通过处理调试、代码理解等基础任务，以及实现新功能和设计规划等更复杂的工作，使员工能够以更少的时间投入获得更大的产出。Claude不仅加速了现有工作，还催生了新类型的工作，如修复“小麻烦”和进行此前因成本过高而无法开展的探索性项目。工程师们因此变得更加**“全栈”**，能够跨越专业领域，快速学习和迭代，提升了解决问题的广度。AI还改变了获取知识的方式，成为员工提问的“第一站”，加速了学习过程。
然而，这种变革也带来了显著的挑战和担忧。最突出的是对技能退化的担忧，即过度依赖AI可能导致工程师丧失亲手解决问题时获得的深入理解和附带学习，进而影响其有效监督AI产出的能力，形成“监督悖论”。此外，AI的介入也改变了职场社交动态，减少了同事间的日常互动和传统的师徒指导机会。更深层次的担忧在于职业未来的不确定性，许多工程师开始将自己的角色定义为“AI代理的管理者”，但对于长期而言，AI是否会最终取代人类工作，以及软件工程这一职业的最终形态，仍存在普遍的迷茫和矛盾心理。
文章强调，Anthropic作为AI构建者，其内部经验虽有特殊性，但可能预示着更广泛的社会转型。为了应对这些挑战，Anthropic正积极探索内部策略，包括促进团队协作、支持职业发展、建立AI增强型工作的最佳实践，并考虑结构性的角色演变和再培训方案。
总而言之，该研究表明，AI在提升生产力、拓展能力边界方面潜力巨大，但其对人类技能、协作模式和职业路径的深远影响不容忽视。未来的关键在于如何深思熟虑地驾驭这场转型，在享受AI带来的便利的同时，维护和发展人类的核心能力，并为不确定的未来做好准备。Anthropic的实践为其他组织提供了一个宝贵的“实验室”案例，展示了在AI时代，企业如何主动探索和适应工作模式的演变。
本研究通过对Anthropic内部工程师和研究人员的调查、访谈及Claude Code使用数据分析，深入探讨了AI（特别是Claude）如何从根本上改变软件开发人员的工作性质，带来了希望与担忧并存的显著变革。
AI如何重塑Anthropic的工作：
研究目的：考察AI在早期采用者（Anthropic员工）中的实际影响，以期为更广泛的社会转型提供借鉴。
研究方法：2025年8月对132名工程师和研究人员进行调查，53次深度定性访谈，并分析内部Claude Code使用数据。
主要发现概览：工程师工作效率显著提高，变得更“全栈”，学习和迭代速度加快，能够处理此前被忽视的任务。但同时也引发了对技术能力退化、有效监督AI产出、团队协作减少以及职业未来不确定性的担忧。
Anthropic的特殊性：作为AI构建公司，员工拥有尖端工具和稳定领域，其经验可能预示着其他行业的未来趋势。
核心挑战：在AI带来生产力提升的同时，如何维护技术专长、保持有意义的协作，以及为AI增强型职场中学习、指导和职业发展的新方法做准备。
展望未来：
早期成果：员工对Claude的使用大幅增加，不仅加速了现有工作，还促进了新代码库学习、减少了繁琐任务、拓展了新领域，并解决了此前被忽视的改进。
希望与不确定性：生产力提升和学习效益显著，但对软件工程工作的长期发展轨迹仍存在不确定性。
历史类比：AI转型可能类似于软件工程从低级到高级语言的演变，或从个人贡献者到管理者的角色转变。
当前局限：仍处于早期阶段，Anthropic作为早期采用者，其发现可能不完全适用于其他组织或背景。
Anthropic的未来行动：
与内部工程师、研究人员和领导层对话，解决机遇与挑战。
探讨团队协作、职业发展和AI增强型工作的最佳实践（如AI流畅性框架）。
将研究范围扩展到工程师之外，理解AI对组织内所有角色的影响。
支持外部组织（如CodePath）调整计算机科学课程以适应AI辅助的未来。
探索结构性方法，如组织内部的角色演变和再培训新路径。
Anthropic的定位：作为一个负责任的职场转型实验室，不仅研究AI如何改变工作，更要实验如何深思熟虑地驾驭这种转型。

当 AI 成为常驻合作者—AI 让我们做更多，也让我们担心更多：Anthropic 的使用数据与体验洞察—Claude 在岗位上的影响(产能、技能与协作的双刃剑)

1、关键发现（Key findings）

核心要点

经验 / 技巧

2、调查数据（Survey data）

2.1 常用任务类型

核心要点

经验 / 技巧

2.2 使用率与生产力变化

核心要点

经验 / 技巧

2.3 Claude 带来的“新工作”

核心要点

经验 / 技巧

2.4 “完全委派”能力的界限

核心要点

经验 / 技巧

3、深度访谈（Qualitative interviews）

3.1 AI 委派的策略与直觉

核心要点

经验 / 技巧

3.2 技能分布的扩展与深度能力的担忧

核心要点

经验 / 技巧

3.3 编码工艺（craft）与工作意义的变化

核心要点

经验 / 技巧

3.4 职场社交与指导/辅导的变化

核心要点

经验 / 技巧

3.5 职业前景与不确定性

核心要点

经验 / 技巧

4、Claude Code 使用趋势（Claude Code usage trends）

核心要点

经验 / 技巧

5、展望（Looking forward）与组织动作

核心要点

经验 / 技巧（面向组织）

6、方法学与局限（Appendix / Limitations）

当 AI 成为常驻合作者—AI 让我们做更多，也让我们担心更多：Anthropic 的使用数据与体验洞察—Claude 在岗位上的影响(产能、技能与协作的双刃剑)

地址

《How AI is transforming work at Anthropic》

https://www.anthropic.com/research/how-ai-is-transforming-work-at-anthropic

时间

2025年12月3日

作者

Anthropic

1、关键发现（Key findings）

文章在开篇总结了来自问卷、访谈和使用日志的主要结论：工程师通过 Claude 在调试、理解代码、实现新特性等方面获得显著生产力提升，同时工作内容变得更宽泛（“full-stack”），但也带来对深层技能萎缩、协作减少与职业不确定性的担忧。

核心要点

>>最常见用途是调试（debugging）与代码理解（code understanding）（日常使用比例最高）。

>> 自报数据：当前员工平均在 60% 的工作中使用 Claude，认为生产力平均提高约 50%（较去年 2–3 倍提升）。

>>约 27% 的 Claude 辅助工作是“之前不会做的”新工作（例如小工具、可视化、扩展实验等）。

>>大多数员工只会将 0–20% 的工作“完全委派”给 Claude（即仍需人类监督/验证）。

经验 / 技巧

把 Claude 当作 “常驻合作者” 而非“自动接手者”：适合用来快速把可验证、低风险、可拆分的子任务交给模型。

2、调查数据（Survey data）

本节详细阐述了对132名Anthropic工程师和研究人员的调查结果，揭示了Claude在编码任务中的具体应用、对生产力的影响、催生新工作的能力以及可完全授权工作的比例。

核心要点：

Claude在编码任务中的应用：
- 最常见的日常任务：调试（55%）、代码理解（42%）、实现新功能（37%）。
- 较少使用的任务：高级设计/规划、数据科学、前端开发（可能因其复杂性或并非核心任务）。
使用率与生产力：
- 使用率从12个月前的28%上升到目前的59%。
- 生产力提升从12个月前的20%上升到目前的50%。
- 14%的“超级用户”生产力提升超过100%。
- 生产力模式：多数任务类别中，时间投入略有减少，但产出量显著增加。
- 时间节省的复杂性：部分人因调试AI生成代码或理解AI代码而花费更多时间，但也有人因此能坚持此前会放弃的任务，或进行更彻底的测试和探索。
- 产出量增加：普遍且显著，是AI提升生产力的主要方式。
- 局限性：生产力难以精确测量，自报数据存在偏差（如高估），但员工通过战略性AI授权可能克服了外部研究中发现的生产力下降因素。
Claude催生新工作：
- 27%的Claude辅助工作是原先不会做的。
- 包括项目扩展、制作交互式数据仪表板等“锦上添花”的工具、文档和测试等繁琐工作，以及手动不划算的探索性工作。
- 工程师能修复更多“小麻烦”（papercuts），提升工作质量和效率。
- AI允许多版本并行探索，带来更多创造性。
可完全授权的工作比例：
- 超过一半的工程师表示只能“完全授权”0-20%的工作给Claude。
- 原因在于需要与Claude主动迭代协作，并验证其产出，尤其是在复杂或高风险任务中。

经验技巧：

将Claude用于调试、代码理解和实现新功能是高效的策略。
通过战略性地选择可授权任务，可以最大化AI的生产力效益。
利用AI处理“小麻烦”和探索性工作，可以提升整体工作质量和创新性。
在高风险或复杂任务中，始终保持对AI产出的监督和验证。

2.1 常用任务类型

通过问卷量化了工程师在日常使用 Claude 的任务分布：调试、代码理解和实现新特性为高频任务，设计/高层次规划相对较少。

核心要点

>> 日常使用占比最高：调试 55%、代码理解 42%、实现新特性 37%（按日常使用率）。

>> 高层设计/规划、前端/数据科学等任务的日常使用较少（这些通常保留给人类或较少场景下交给模型）。

经验 / 技巧

>> 优先把 Claude 用于“重复性高、可验证”的场景（例如单元修复、标准化重构、注释生成），把“taste/设计”相关任务留给人类主导以保护设计质量。

2.2 使用率与生产力变化

员工自报过去一年中 Claude 的使用从 28% 增至 59%，自评生产力提升从 +20% 到 +50%；同时产出量增加但部分任务时间未必减少（有分化）。

核心要点

>> 自报使用率与生产力出现显著上升；部分“power users”呈现 >100% 提升。

>> 时间与产出出现分化：总体“单位任务时间下降、产出量显著上升”，但也有部分人花更多时间调试与理解AI 生成的代码。

>> 自报数据有局限（回忆偏差、社交期望偏差）；文章同时对比内部使用日志以缓和这些偏差。

经验 / 技巧

>> 在衡量 AI 价值时区分“时间/流程节省”与“产出数量增加”：组织应同时跟踪质量（bug rate、回滚）与产出，以避免只看“合并次数”导致误判。

2.3 Claude 带来的“新工作”

约 27% 的 Claude 辅助工作属于以前不会被做的工作，包括可视化、scale-out、清理低优先“papercut”等。

核心要点

>> Claude 帮助“修复 papercuts”（8.6% 的 Code 任务），这些原本会被搁置的小问题现在被系统性处理，从而提高工程体验与可维护性。

>> 并行试验能力（多版本同时尝试）显著提升探索性研究和创意迭代速度。

经验 / 技巧

>> 把 AI 用于“低成本实验和工具化”——用 AI 快速生成原型、仪表盘、小工具，随后人类评估可扩展性与设计。

2.4 “完全委派”能力的界限

尽管使用频繁，但大多数员工认为只有有限比例的工作可以“完全”不经人工监督地交给 Claude。

核心要点

>> 0–20% 的“可完全委派”占比反映出人类对高标准验证与高风险领域仍保持谨慎。

>> 对“完全委派”的解读存在差异（从“不需要任何验证”到“只需轻度复核”）。

经验 / 技巧

>> 制定分级委派策略：对任务按“风险—可验证性—价值”打分，低风险高可验证性任务可逐步放宽人工检查门槛；高风险任务保持严格人工复核。

3、深度访谈（Qualitative interviews）

通过深度访谈，本节揭示了工程师们在日常工作中如何与AI互动、其技能组合的变化、对编码工作的看法、职场社交动态的演变以及对职业未来的不确定性与适应策略。

核心要点：

AI授权方法：工程师倾向于将以下类型的任务授权给Claude：
- 用户不熟悉但复杂度低的任务：如基础设施问题、不熟悉的Git或Linux操作。
- 易于验证的任务：验证成本远低于创建成本。
- 定义明确或自包含的任务：项目中相对独立的子模块。
- 代码质量要求不高的任务：如临时调试代码或研究代码。
- 重复或无聊的任务：越是无聊的任务，越倾向于交给Claude。
- 提示比执行更快的任务：但对于需要大量上下文的“冷启动”问题，人工操作可能更快。
信任与验证：
- 用户对Claude的信任度会逐步提升，从简单任务到复杂任务。
- 有人将其比作使用Google Maps，从不熟悉路线到日常通勤都依赖。
- 工程师在使用Claude时，有人选择在自己熟悉的领域加速工作，有人则用于拓展不熟悉领域，但都强调需要保持对产出的理解和判断力。
- 经验的重要性：有经验的工程师能识别AI提出的“聪明但危险”的解决方案。
保留给人类的任务：
- 高层次或战略性思考、需要组织上下文或“品味”的设计决策。
- 这些任务的生产力提升最少。
- 但随着模型改进，这些边界是“移动的目标”。
技能转型：
- 新能力：工程师变得更“全栈”，能处理此前不熟悉的领域（如后端工程师构建UI），加速原型开发、并行工作、减少繁琐任务、提升项目雄心。
- 动手实践减少：担忧技能退化，失去通过手动解决问题带来的附带学习（如阅读文档、构建系统模型）。
- 监督悖论：有效监督AI需要编码技能，而AI过度使用可能导致这些技能退化。
- 应对策略：有些工程师会刻意不使用AI来保持技能敏锐度。
- 对未来技能的看法：
  - 软件工程可能向更高抽象层次发展，英语可能成为编程语言。
  - 部分人认为这让他们能更关注产品和用户。
  - 有人认为低级技能的流失是可接受的，因为它们不再是核心。
  - 也有人认为技能侵蚀是不可避免的，且旧的工作方式不会再回来。
编码的乐趣与意义：
- 工程师对此看法不一：有人怀念亲手编码的“心流”体验，认为提示AI不那么有趣。
- 也有人接受这种权衡，认为生产力提升更重要。
- 另一些人则发现与Claude迭代更有趣，或更关注最终产出而非编码过程本身。
职场社交动态变化：
- Claude成为同事提问前的“第一站”，处理了80-90%的常规问题。
- 减少了对同事的依赖，但关键的20%仍需与人交流。
- 部分人协作模式未变，但也有人与Claude互动多于同事。
- 影响：减少了社交摩擦，但也导致了对人际互动和传统师徒关系减少的担忧。Claude可以为初级员工提供指导，减少了资深工程师的指导机会。
职业发展与不确定性：
- 角色转变：工程师的角色从编写代码转向管理AI系统，成为“AI代理的管理者”。
- 长期不确定性：普遍存在，许多人认为难以预测几年后的职业前景。
- 短期乐观与长期担忧：有人认为短期乐观，但长期担忧AI会取代一切。
- 适应策略：专注于更专业化的技能（如有效审查AI工作）、转向人际和战略性工作、利用Claude进行职业发展学习、保持高度适应性。

经验技巧：

有效授权：优先将低上下文、易验证、明确、低风险或重复无聊的任务交给AI。
建立信任：从简单任务开始，逐步增加对AI的授权，但始终保持批判性思维。
保留核心：将高层次思考、设计决策和需要人类“品味”的任务保留给自己。
技能维护：定期进行无AI实践，以防止核心技能退化，并培养对AI产出的有效监督能力。
适应变化：拥抱高层次抽象思维，关注产品和用户价值，而非纯粹的编码细节。
重塑协作：认识到AI会改变团队协作模式，探索新的沟通和指导方式。
终身学习：面对职业不确定性，培养高度适应性，并利用AI进行持续学习和技能提升。

3.1 AI 委派的策略与直觉

访谈显示工程师形成了“委派直觉”：倾向将低复杂度、低上下文或易于验证的任务交给 Claude，采取渐进信任策略。

核心要点

>> 委派依据三大原则：低上下文、易验证、模块化/自含。例如基础 infra 问题、局部重构更容易委派。

>> 信任是渐进建立的：从简单任务开始，逐步扩展到更复杂的工作。

经验 / 技巧

>> 在团队内部推广“渐进式试验”文化：从易验证的小任务建立模型可信度（build trust curve），并记录失败模式供团队学习。

3.2 技能分布的扩展与深度能力的担忧

Claude 让工程师更容易跨领域工作（变“full-stack”），但也有人担心深层技能（比如复杂架构设计、手工编码能力）会退化。

核心要点

>> 优势：个体能够触及更多任务 —— 前端、数据库、可视化等不再只属于专门团队。

>> 风险：长期依赖可能导致技能退化与评审能力下降，影响对 AI 输出的批判性把控。

经验 / 技巧

>> 设计“刻意练习窗口”（practice windows）：定期安排无 AI 辅助的编程/设计任务、code review 或交叉导师制度，确保核心能力不萎缩。

3.3 编码工艺（craft）与工作意义的变化

部分人发现自己更享受“结果/产品”而非写代码的过程；另一些人仍怀念编码的工艺感。

核心要点

工作动机可能从“写代码本身”转向“解决问题与达成目标”；但对编码热情的变化在员工中并非统一。

经验 / 技巧

组织层面需关注工作成就感的多样来源：提供既能利用 AI 的任务，也保留能让人“沉浸编码”的项目以维持人才多样性。

3.4 职场社交与指导/辅导的变化

Claude 成为“第一问答对象”，导致人与人之间的即时互动、寻求帮助与导师-学徒关系出现减少的现象。

核心要点

结果：junior 向资深请教减少，可能影响知识传承与非正式学习渠道。

经验 / 技巧

主动创建“人际接触点”（office hours、pair-programming、代码走查会）作为补偿，确保 AI 不替代关键的人际教学场景。

3.5 职业前景与不确定性

访谈中既有对短期生产力提升的乐观，也有对长期被替代的焦虑，感受不一且带有根本不确定性。

核心要点

部分受访者乐观，认为工作会向更高层抽象、系统管理方向发展；部分人担心长期被替代或角色根本性萎缩。

经验 / 技巧

企业应提供明确的职业发展地图（role evolution paths）、再培训渠道与内部转岗机制以缓解不安并保留人才。

4、Claude Code 使用趋势（Claude Code usage trends）

本节通过对2025年2月和8月20万份Claude Code内部记录的分析，提供了客观数据，印证了调查和访谈中关于Claude使用复杂性增加、自主性提高、任务分布变化以及团队间差异的发现。基于内部工具日志（Claude Code），文章展示了模型在可自主完成操作数量、任务类型分布与团队差异上的变化，反映出模型能力提升带来的工作方式转变。

核心要点

>> 自主操作数从 ~10 次上升到 ~20 次（表示更少人类中断，模型能完成更复杂的工作流）。
>>复杂任务占比增长（例如设计/规划从 1%→10%，实现新功能从 14%→37%）。
>> “Papercut”修复占比 ~8.6%，显示模型在改善工程体验方面起作用。
>> 不同团队使用模式有差异：Pre-training 偏实验/特性迭代，Security 偏代码理解，非技术员工也能借助 Claude 做调试。

处理更复杂任务，减少监督：
- 任务复杂度提升：平均任务复杂度从3.2（基本编辑）提升到3.8（专家级任务），例如从“排查Python模块导入错误”到“实现和优化缓存系统”。
- 连续工具调用次数增加：Claude在无人干预下连续执行工具调用的次数增加了116%（从9.8次到21.2次），表明自主性增强。
- 人类交互回合减少：平均人类交互回合数减少了33%（从6.2次到4.1次），说明完成任务所需的人工输入减少。
任务分布：
- 显著变化：实现新功能（从14.3%增至36.9%）和代码设计/规划（从1.0%增至9.9%）的比例显著增加，表明Claude在更复杂任务上的能力提升。
- 整体分布：与自报数据大致吻合，最常见的是构建新功能、调试和代码理解。
修复“小麻烦”（Papercuts）：
- 8.6%的Claude Code任务属于“小麻烦修复”，如重构代码以提高可维护性、创建性能可视化工具或终端快捷方式。
- 这些小修复累积起来能带来更大的生产力和效率提升，并减少日常工作的摩擦和挫败感。
团队间任务差异：
- 预训练团队：54.6%用于构建新功能（通常是运行额外实验）。
- 对齐与安全团队/后训练团队：最多用于前端开发（7.5%和7.4%），常用于创建数据可视化。
- 安全团队：48.9%用于代码理解，分析代码库的安全隐患。
- 非技术员工：51.5%用于调试（如网络问题、Git操作），12.7%用于数据科学，表明Claude能弥补技术知识差距。
- “全栈”能力增强：团队利用Claude拓展核心专业之外的能力，如预训练团队进行额外实验，非技术员工修复代码错误，研究人员利用Claude进行前端开发以可视化数据。

经验 / 技巧

利用使用日志识别高价值自动化点（例如经常出现的 papercut），并把这些点做成“小自动化包”，逐步降低日常维护成本。

信任AI的自主性：随着AI能力提升，可以逐步增加其自主处理复杂任务的范围。
关注高价值任务：将AI用于新功能实现和设计规划等更复杂的任务，释放人类创造力。
利用AI解决“小麻烦”：鼓励员工使用AI处理那些虽小但影响工作质量和效率的“纸屑问题”。
跨领域赋能：鼓励不同团队利用AI拓展其核心专业之外的能力，实现“全栈化”，弥补知识空白。

5、展望（Looking forward）与组织动作

认识到自己处于“早期采用者”的位置，强调要研究、试验并制定组织层面的实践（AI 流利度框架、再培训、跨团队协作等），并将在 2026 年公布更具体计划。

核心要点

更强模型带来显著收益同时提出对技术深度、协作模式、职业路径的新问题。

公司正在探索：如何维持技术专精、如何保留/重塑导师-学徒关系、如何支持职业发展与再培训、以及如何设计 AI-augmented 的最佳实践。

经验 / 技巧（面向组织）

制定AI 流利度（AI fluency）培训：把模型使用、验证流程、prompt engineering、风险评估纳入必修训练。

设计“混合工作合同”：对于某些岗位定义 AI-增强职责和人类独有职责，明确晋升/评价标准。

6、方法学与局限（Appendix / Limitations）

文章在 Appendix 明确了方法学细节与局限：样本选择方式（便利抽样与有目的抽样）、响应率偏差、非匿名回答可能导致社会期望偏差、以及研究仅代表 2025 年 8 月当时的模型能力。

存在选择偏差（对 Claude 更感兴趣或更有意见者更可能参与）。

自报生产力与记忆回溯存在不确定性；文章同时使用内部日志以求平衡。

研究时点是 Claude Sonnet 4 / Opus 4；随着模型快速迭代，结论可能随时间变化。

解读此类内部研究时，请同时参照匿名化调查、客观日志指标与第三方独立研究，以形成更稳健结论。

当 AI 成为常驻合作者—AI 让我们做更多，也让我们担心更多：Anthropic 的使用数据与体验洞察—Claude 在岗位上的影响(产能、技能与协作的双刃剑)

1、关键发现（Key findings）

核心要点

经验 / 技巧

2、调查数据（Survey data）

2.1 常用任务类型

核心要点

经验 / 技巧

2.2 使用率与生产力变化

核心要点

经验 / 技巧

2.3 Claude 带来的“新工作”

核心要点

经验 / 技巧

2.4 “完全委派”能力的界限

核心要点

经验 / 技巧

3、深度访谈（Qualitative interviews）

3.1 AI 委派的策略与直觉

核心要点

经验 / 技巧

3.2 技能分布的扩展与深度能力的担忧

核心要点

经验 / 技巧

3.3 编码工艺（craft）与工作意义的变化

核心要点

经验 / 技巧

3.4 职场社交与指导/辅导的变化

核心要点

经验 / 技巧

3.5 职业前景与不确定性

核心要点

经验 / 技巧

4、Claude Code 使用趋势（Claude Code usage trends）

核心要点

经验 / 技巧

5、展望（Looking forward）与组织动作

核心要点

经验 / 技巧（面向组织）

6、方法学与局限（Appendix / Limitations）

【LeetCode刷题】跳跃游戏

鸿蒙PC UI控件库 - PasswordInput 密码输入框详解

day37简单的神经网络@浙大疏锦行

【水果识别】基于机器视觉苹果和香蕉的成熟度和大小检测附Matlab代码

JAVA的平凡之路——此峰乃是最高峰JVM-附加小菜-04

【电力系统】电力系统优化与控制热液调度附Matlab代码和报告