数字世界的全球技能和能力框架

数据科学 DATS

运用数学、统计学、数据挖掘和预测建模技术,从数据中获得洞见、预测行为和产生价值。

指导说明

数据科学通常用于分析高容量、高速度和高多样性的数据(数字、符号、文本、声音和图像)。

活动可能包括但不限于:

  • 利用专门的编程语言、工具和技术,整合数学、统计与概率建模的方法
  • 采购和准备分析数据
  • 识别、验证和利用由不同范围的流程所生成的内部和外部数据集
  • 形成具有前瞻性、预测性、实时性、基于模型的洞察力,创造价值并推动有效决策
  • 寻找、选择、获取和摄取数据来源,
  • 对数据进行集成和清理,使其适合使用目的
  • 使用模型和分析沙盒开发假设并探索数据
  • 随着时间的推移,改进需求、验证、培训和发展模型,以便挖掘更加深刻的见解、做出预测或生成建议。
  • 使用先进的分析技术,包括但不限于数据/文本挖掘、机器学习、模式匹配、预测、可视化、语义分析、情感分析、网络和聚类分析、多元统计、图解分析、仿真、复杂事件处理、神经网络。

该技能的责任级别

2 3 4 5 6 7

数据科学: 级别 1

这种技能通常不会在这种责任和问责制水平上被观察到或实践。

数据科学: 级别 2

在指导下,将指定的数据科学技术应用于数据。使用在标准软件框架和工具中实现的算法,分析和报告结果,并纠正简单的问题。

数据科学: 级别 3

使用专门的编程技术,将现有的数据科学技术应用于新的问题和数据集。从现有数据源中选择数据并准备数据科学模型使用的数据。评估数据科学模型的结果和性能。确定并实现培训和改进模型及其所用数据的机会。发布模型的输出并予以报告,以便满足客户的需求,遵从商定的标准。

数据科学: 级别 4

梳理所描述的问题和数据集,以便评估数据科学和分析解决方案的有效性。应用一系列数据科学技术,并使用专门的编程语言。了解并应用特定于行业的规则和指南,并预测建模的风险及其他影响。选择、获取并整合数据进行分析。开发数据假设与方法,并评估分析模型。根据项目结果和综合研究,对具体技术的有效性提出建议。协助数据科学解决方案的开发、评估、监测与部署。

数据科学: 级别 5

规划并推动数据科学与分析解决方案发展的所有阶段。提供专家建议,评估需要解决的问题和数据科学解决方案的需求。确定要使用或获取的数据源。指定并应用适当的数据科学技术和专门的编程语言。回顾数据科学技术与工具的优势与价值,并提出改进建议。协助制定、评估、监测和部署数据科学解决方案的政策、标准和指南。

数据科学: 级别 6

引领数据科学和分析的引入和使用,以便推动创新和商业价值。为数据科学和分析制定组织政策、标准和指南。针对数据科学和分析技术、方法和工具的引入与使用,设定方向,引领发展。引领组织数据科学和分析能力的发展。规划和领导复杂的战略性大型数据科学计划,进而生成洞见、创造价值和推动决策。

数据科学: 级别 7

指导创建和审查全企业范围的跨职能方法与文化,进而从数据科学和分析中创造价值。推动识别、评估和采用数据科学与分析能力,进而改善组织绩效。引领提供组织的数据科学和分析能力。确保数据科学与分析的战略应用融入到组织的治理和领导中。将商业策略、企业转型、数据科学和分析策略结合起来。