数据科学 DATS
运用数学、统计学、数据挖掘和预测建模技术,从数据中获得洞见、预测行为和产生价值。
指导说明
数据科学通常用于分析高容量、高速度和高多样性的数据(数字、符号、文本、声音和图像)。
活动可能包括但不限于:
- 利用专门的编程语言、工具和技术,整合数学、统计与概率建模的方法
- 采购和准备分析数据
- 识别、验证和利用由不同范围的流程所生成的内部和外部数据集
- 形成具有前瞻性、预测性、实时性、基于模型的洞察力,创造价值并推动有效决策
- 寻找、选择、获取和摄取数据来源,
- 对数据进行集成和清理,使其适合使用目的
- 使用模型和分析沙盒开发假设并探索数据
- 随着时间的推移,改进需求、验证、培训和发展模型,以便挖掘更加深刻的见解、做出预测或生成建议。
- 使用先进的分析技术,包括但不限于:数据/文本挖掘、机器学习、模式匹配、预测、可视化、语义分析、情感分析、网络和聚类分析、多元统计、图解分析、仿真、复杂事件处理和神经网络。
了解此技能的责任级别
在未定义较低级别的情况下...
- 没有定义具体的任务和职责,因为该技能需要比这些级别的通常预期的更高的自主性、影响力和决策复杂性。您可以使用本质语句来了解与这些级别相关的一般职责。
如果未定义更高的级别...
- 职责和问责制没有定义,因为这些更高层次涉及战略领导和更广泛的组织影响力,超出了这一特定技能的范围。请参阅本质陈述。
发展技能并展示与该技能相关的责任
定义的级别显示了技能和责任的增量进展。
在未定义较低级别的情况下...
您可以通过以下方式发展您的知识并支持在该领域负有责任的其他人:
- 学习与此技能相关的关键概念和原则及其对您的角色的影响
- 执行相关技能(请参阅相关的 SFIA 技能)
- 支持他人执行更高级别的任务和活动
如果未定义更高的级别...
- 你可以通过发展更适合更高层次组织领导的相关技能来取得进步。
单击以了解为什么 SFIA 技能没有在所有 7 个级别中定义。
显示/隐藏额外的描述和级别。
该技能的责任级别
2 | 3 | 4 | 5 | 6 |
数据科学: 级别 2
在例行监督下,将指定的数据科学技术应用于数据。使用标准软件框架和工具中包含的算法分析和报告结果并解决简单问题。
数据科学: 级别 3
使用专门的编程技术将标准数据科学技术应用于新问题和数据集。确定并选择适当的数据源,并准备数据科学模型要使用的数据。评估数据科学模型的结果和性能。确定并实施训练和改进模型及其使用的数据的机会。发布和报告模型输出,以满足客户需求并符合商定的标准。
数据科学: 级别 4
梳理问题和数据集,以便评估数据科学解决方案的有效性。应用多种数据科学技术,并使用专门的编程语言。了解并应用特定于行业和业务的规则和指南,并预测建模的风险及其他影响。选择、获取并整合数据进行分析。制定假设并评估数据科学模型。根据分析结果和研究,对具体技术的有效性提出建议。协助数据科学解决方案的开发、评估、监测与部署。
数据科学: 级别 5
规划、协调并推动数据科学解决方案发展的所有阶段。提供专家建议,评估需要解决的问题和数据科学解决方案的需求。确定要使用或获取的数据源并解释原因。指定并应用适当的数据科学技术和专门的编程语言。批判性地回顾数据科学技术与工具的优势与价值,并提出改进建议。协助制定、评估、监测和部署数据科学解决方案的政策、标准和指南。
数据科学: 级别 6
支持和引领数据科学的引入和使用,以便推动创新和商业价值。为数据科学制定组织政策、标准、指南和方法,并推进其使用和遵循。针对数据科学技术、方法和工具的引入与使用,设定方向,引领发展。引领数据科学组织能力的发展。规划和领导复杂的战略性大型数据科学计划,进而生成洞见、创造价值和推动决策。