AI经济指数报告,36%职业已渗透,仅4%被深度改造
Anthropic发布了「Anthropic经济指数」报告,全文38页全面分析了数百万匿名Claude对话,从中揭示了AI在各个职业的应用现状。
Anthropic认为在未来几年,AI对人们的工作将产生重大影响,最新报告旨在长期追踪AI对劳动力市场和经济的影响。
AI将自动化43%工作
-
AI的使用主要集中在软件开发和写作任务上,这两者占总使用量的近50%。 -
AI的使用范围更广泛,约有36%的职业在至少四分之一的相关任务中使用AI;在中等至高收入的工作中使用最为普遍。 -
在各类任务中,57%的使用表明AI在增强人类能力,而43%的使用表明在取代人类劳动,即工作自动化。
更值得一提的是,Cluade编码和数学占所有使用量1/3(37.2%)。
为什么发布「经济指数」?
为了推动更广泛的研究,Anthropic决定开源本次分析所使用的数据集,供研究人员在此基础上进一步探索和扩展。
因此,Anthropic诚挚邀请经济学家、政策专家及其他研究人员提供宝贵意见。
具体结果
对不同职业影响
新研究还将数据中的比例与各职业在整体劳动力市场中的出现率进行了比较,详细结果如下图所示。
职业内部AI使用程度
AI在经济中的应用分布:基于Claude.ai的真实使用数据。数据中的百分比表示与Claude的对话中涉及特定任务、职业及类别的比例。
正如预测的那样,数据中没有证据表明职业被完全自动化:相反,AI在经济中的许多任务中得到了广泛应用,对某些任务群体的影响比其他任务群体更大。
AI使用与薪资
而AI使用最广泛的职业主要集中在中等至较高薪资范围内,例如计算机程序员和文案撰写人。
年薪(x轴)与涉及该职业的对话百分比(y轴)的关系。一些具有代表性的职业被突出显示
自动化vs.增强
也就是说,在超过一半的情况下,AI并未取代人类完成任务,而是与人类协作,参与诸如验证(例如核对用户的工作)、学习(例如帮助用户获取新知识和技能)以及任务迭代(例如帮助用户进行头脑风暴或执行重复的生成性任务)等工作。
这表明了,在大多数职业中,人工智能的整合仍然是选择性的,而非全面性的。
批判性思维、写作、编程等技能在对话中出现频率较高,而设备维护、安装等手工技能则较为罕见。
前者在编码和技术任务方面表现出更多的使用量,而后者则更多用于创意写作和教育内容开发。
任务层级使用状况
-
IT、技术及相关任务占主导地位(对话量占比近50%) -
第二层是创意和文化工作,与艺术、文化和宗教文物创作和保护相关的任务(约占20%) -
商业管理、金融和客户服务运营构成第三大类别(约占5%) -
其余类别各自占比均不超过15% -
医疗服务和环境系统的代表性较低,各自占比不到5%
在中层级(图12),数据揭示了更细化的任务模式: 软件开发和网站维护是最普遍的活动(约占14%) 计算机系统编程和调试紧随其后(约占11%) -
系统管理、硬件/软件故障排除和文档发布流程(各占4-6%) -
市场营销/推广策略、网络优化、学术辅导和公关管理虽然出现,但频率较低(各约占2-3%) -
数据科学和机器学习应用(约占2%)
在基础层级(图13),可以看到高度具体的技术操作: 软件修改和错误修正活动占主导地位,其中以适应新硬件或改进性能为重点的任务出现最频繁 初始调试程序、系统管理和硬件/软件故障排除是下一组最常见的活动 文档编辑和程序分析任务出现频率较低,但仍构成对话的重要部分
数据分析方法:
将对话和职业关联
新论文基于对技术影响劳动力市场的长期研究,从工业革命时期的珍妮纺纱机到当今的汽车制造机器人。 关注AI(AI)的持续影响。新研究不调查人们的AI使用情况,也不尝试预测未来;相反,直接获取了AI实际使用的数据。
分析职业任务
新研究始于经济学文献中的重要洞见:有时候,关注职业任务而非职业本身,也有意义。 工作通常共享某些任务和技能:例如,视觉模式识别是设计师、摄影师、安检员和放射科医生共同完成的任务。 某些任务比其他任务更适合被新技术自动化或增强。 因此,预计AI会在不同职业中有选择地被采用,分析任务(而不仅仅是整体工作)将提供一个更全面的图景,展示AI如何融入经济。
使用Clio匹配AI使用与任务
这项研究得以实现,依靠的是Clio系统。在保护用户隐私的同时,它可以分析与Claude的对话。 新研究分析了约一百万次与Claude的对话(包括Free和Pro版本的对话),并按职业任务对对话进行分类。 美国劳工部维护着一个包含约20,000项具体工作任务的数据库,称为职业信息网络(O*NET)。
根据美国劳工部的分类选择任务,Clio将每次对话与最能代表对话中AI角色的O*NET任务进行匹配。 Clio系统将与Claude的对话(严格保密,位于下图顶部左侧)转化为职业任务(下图顶部中间),并进一步映射到O*NET提供的职业/职业类别(顶部右侧)。 随后,这些数据可以输入到多种分析中(下图底部一行)。 最后,按照O*NET的分类方案,将任务分组到它们最能代表的职业中,并将职业分组到一小组总体类别中:教育和图书馆、商业和金融等。
注意
新研究提供AI如何改变劳动力市场的独特视角。 然而,与所有研究一样,它也存在重要的局限性。以下是一些主要的注意事项:
1.任务用途不明确:无法确定使用Claude完成任务的人是否是为了工作。例如,向Claude寻求写作或编辑建议的人可能是为了工作,也可能是为了业余写作的小说。
2.响应使用方式不明确:不知道用户如何使用Claude的响应。例如,他们是否复制粘贴代码片段?他们是否核实响应还是不加批判地接受?
3.数据来源有限:仅分析了Claude.ai免费和专业版的数据,而非API、团队或企业用户的数据。
4. 任务分类误差:由于任务种类繁多,Clio可能会错误分类一些对话。
5.创意用途未涵盖:Claude无法生成图像(除通过代码间接生成外),因此创意用途在数据中未被引用。
6.编码用例可能过度代表:由于Claude被宣传为用于编码的顶尖模型,编码用例可能在数据中被过度代表。因此,我们不认为数据集中的用例代表了人工智能的普遍使用情况。
结论与未来
人工智能的使用正在迅速扩展,模型的能力也在不断提升。劳动力市场的面貌可能在短时间内发生显著变化。
因此,Anthropic将不断重复上述分析,以帮助跟踪可能发生的社会和经济变化,并定期发布结果和相关数据集。 这种纵向分析可以为提供关于AI和就业市场的新见解。 例如,可以监测职业内部AI使用深度的变化。如果人工智能仅用于特定任务,且只有少数职业在大多数任务中使用人工智能,那么未来可能是大多数现有职业演变而非消失。 还可以监测自动化与增强的比例,了解自动化在哪些领域变得更为普遍。 注意新研究只是对AI模型Claude的对话数据分析,并没有提供政策建议。 如何做好为AI对劳动力市场的影响的准备,不能仅从研究中直接得出,而是需要结合证据、价值观和广泛的经验。
参考资料:https://assets.anthropic.com/m/2e23255f1e84ca97/original/Economic_Tasks_AI_Paper.pdf
https://www.anthropic.com/news/the-anthropic-economic-index
-