数据矿工的博客

您现在的位置是:首页 > 数据分析方法 > 正文

数据分析方法

数据治理的八大核心域

admin2022-07-29数据分析方法191
数据治理是指将数据作为组织资产围绕数据全生命周期而展开的相关管控活动、绩效和风险管理工作的集合,以保障数据及其应用过程中的运营合规、风险可控和价值实现。数据治理体系是指从组织架构、管理制度、IT应用技

数据治理是指将数据作为组织资产围绕数据全生命周期而展开的相关管控活动、绩效和风险管理工作的集合,以保障数据及其应用过程中的运营合规、风险可控和价值实现。

数据治理体系是指从组织架构、管理制度、IT应用技术、绩效考核等多个维度对组织的数据架构、元数据、数据质量、数据标准、数据安全、数据生命周期等各方面进行全面的梳理、建设并持续改进的体系。

数据治理的八大核心域

1 数据架构管理

数据模型是数据构架中重要一部分,包括概念数据模型、逻辑数据模型和物理数据模型,是数据治理的关键、重点。理想的数据模型应该具有非冗余、稳定、一致、易用等特征。逻辑数据模型能涵盖整个组织的业务范围,以一种清晰的表达方式记录跟踪组织的重要数据元素及其变动,并利用它们之间各种可能的限制条件和关系来表达重要的业务规则。数据模型必须在设计过程中保持统一的业务定义。为了满足将来不同的应用分析需要,逻辑数据模型的设计应该能够支持最小粒度的详细数据的存储,以支持各种可能的分析查询。同时保障逻辑数据模型能够最大程度上减少冗余,并保障结构具有足够的灵活性和扩展性。物理数据模型是逻辑数据模型在数据库中的具体实现,是数据库系统中实际数据的定义或主机文件系统中的文件结构定义,内容包括数据库内所有的表、视图、字段及其相关主键和外键的定义,以及系统内数据流向及系统间的数据交换关系。

2 元数据管理

元数据是关于数据的数据,描述了数据定义和属性。主要包括业务元数据、技术元数据和管理元数据。元数据管理的目的是厘清元数据之间的关系与脉络,规范元数据设计、实现和运维的全生命周期过程。有效的元数据管理为技术与业务之间搭建了桥梁,为系统建设、运维、业务操作、管理分析和数据管控等工作的开展提供重要指导。元数据管理的内容主要包括元数据获取、元数据存储、元数据维护(变更维护、版本维护)、元数据分析(血缘分析、影响分析、实体差异分析、实体关联分析、指标一致性分析、数据地图展示)、元数据质量管理与考核等内容。

 

3 数据标准管理

数据标准是组织建立的一套符合自身实际,涵盖定义、操作、应用多层次数据的标准化体系。数据治理对标准的需求可以划分为三类,即基础类数据标准、指标类数据标准和专有类数据标准。基础类数据是指组织日常业务开展过程中所产生的具有共同业务特性的基础性数据。基础数据可分为客户、资产、协议、地域、产品、交易、渠道、机构、财务、营销等主题。指标类数据是指为满足组织内部管理需要及外部监管要求,在基础性数据基础上按一定统计、分析规则加工后的可定量化的数据。专有类数据标准是指公司架构下子公司在业务经营及管理分析中所涉及的特有数据。

 

4 数据质量管理

数据质量不高将影响数据应用程度。数据质量管理包含对数据的绝对质量管理、过程质量管理。绝对质量即数据的准确性、完整性、一致性等是数据本身应具有的属性。过程质量即使用质量、存储质量和传输质量。

高质量的行业数据至少应满足以下要求:

一是准备性,在转换、分析、存储、传输、应用流程中不存在错误;

二是完整性,数据库应用或要求的所有记录、字段都存在;

三是一致性,体现在整个数据库的定义和维护方面,确保数据在使用的整个过程中是一致的;

四是时效性,衡量指标是在指定的数据与真实的业务情况同步的时间容忍度内,即指定的更新频度内,及时被刷新的数据的百分比;

五是可靠性,提供数据的数据源必须能够可靠稳定地提供数据。

数据质量管理的规划和实施应至少包括以下内容:

一是数据质量管控体系的建立,包括数据质量的评估体系,定期评估数据质量状况;

二是在部门各个应用系统中的落实,包括每个应用系统中的数据质量检查等;

三是在最开始建立数据质量管理系统的时候,借助数据治理平台上,通过建立数据质量管理的规则来集中化地建立数据质量管理系统,发现问题并持续改进;

四是数据质量管理与业务稽核的结合,通过业务规则的稽核来发现数据质量深层次的问题,将数据质量与业务一线结合起来,使业务人员对数据质量问题有更加清晰和明确的认识。

完善的数据质量管理是保障各项数据治理工作能够得到有效落实,达到数据准确、完整的目标,并能够提供有效的增值服务的重要基础。

 

5 主数据管理

主数据管理要做的就是从各部门的多个业务系统中整合最核心的、最需要共享的数据(主数据),集中进行数据的清洗和丰富,并且以服务的方式把统一的、完整的、准确的、具有权威性的主数据传送给组织范围内需要使用这些数据的操作型应用系统和分析型应用系统。

主数据管理的信息流应为:

1)某个业务系统触发对主数据的改动;

2)主数据管理系统将整合之后完整、准确的主数据传送给所有有关的应用系统

3)主数据管理系统为决策支持和数据仓库系统提供准确的数据源。

因此对于主数据管理要考虑运用主数据管理系统实现,主数据管理系统的建设,要从建设初期就考虑整体的平台框架和技术实现。

 

6 数据安全管理

由于组织的重要且敏感信息大部分集中在应用系统中,数据安全更是至关重要。如何保障数据不被泄露和非法访问,是非常关键的问题。数据安全管理主要解决的就是数据在保存、使用和交换过程中的安全问题。

数据安全管理主要体现在以下六个方面:

一是数据使用的安全性,包括基础数据的保存、访问和权限管理;

二是数据隐私问题,系统中采集的敏感信息在下游分析系统和内部管理系统中,是否要进行加密,以避免数据被非法访问;

三是访问权限统一管理,包括单点登录问题及用户名、数据和应用的访问授权统一管理;

四是数据安全审计,为数据修改、使用等环节设置审计方法,事后进行审计和责任追究;

五是制度及流程建立,逐步建立数据安全性的管理办法、系统开发规范、数据隐私管理办法及相应的应用系统规范、在管理决策和分析类系统中的审计管理办法等;

六是应用系统权限的访问控制,建立集团级权限管理系统,增加数字水印等技术在应用系统中的使用。

7 数据生命周期管理

数据生命周期管理一般包括数据生成及传输、数据存储、数据处理及应用、数据销毁四个方面。

(1)数据生成及传输

数据应该能够按照数据质量标准和发展需要产生,应采取措施保证数据的准确性和完整性,业务系统上线前应该进行必要的安全测试,以保证上述措施的有效性。对于手工流程中产生的数据在相关制度中明确要求,并通过事中复核、事后检查等手段保证其准确性和完整性。数据传输过程中需要考虑保密性和完整性的问题,对不同种类的数据分别采取不同的措施防止数据泄漏或数据被篡改。

(2)数据存储

这个阶段除了关注保密性、完整性之外,更要关心数据的可用性,对于大部分数据应采取分级存储的方式,不仅存储在本地磁盘上,还应该在磁带上,甚至远程复制到磁盘阵列中,或者采用光盘库进行存储。对于存储备份的数据要定期进行测试,确保其可访问其数据完整。数据的备份恢复策略应该由数据的责任部门或责任人负责制定,信息化管理部门可以给予相应的支持。同时还需要注意因为部门需要或故障处理的需要,可能对数据进行修改,必须在数据管理办法中明确数据修改的申请审批流程,审慎对待后台数据修改。

(3)数据处理和应用

信息化相关部门需要对数据进行分析处理,以挖掘出对于管理及业务开展有价值的信息,为保证过程中数据的安全性,一般应采用联机处理,系统只输出分析处理的结果。但是实际中,因为相关数据分析系统建设不到位,需要从数据库中提取数据后再对数据进行必要的分析处理,在这个过程中就需要关注数据提取操作是否可能对数据库造成破坏、提取出的数据在交付给分析处理人员的过程中其安全性是否会降低、数据分析处理的环境安全性等。

(4)数据销毁

这个阶段主要涉及数据的保密性。应明确数据销毁的流程,采用必要的工具,数据的销毁应该有完整的记录。尤其是对于需要送出外部修理的存储设备,送修之前应该对数据进行可靠的销毁。

 

8 数据服务管理

数据整合归集最终目的就是要服务于各机构部门、人员等,能更准确更快更方便的服务是数据服务管理的目标。

数据服务管理是指针对内部积累多年的数据,研究如何能够充分利用这些数据,分析行业业务流程优化业务流程。数据使用的方式通常包括对数据的深度加工和分析,包括通过各种报表、工具来分析运营层面的问题,还包括通过数据挖掘等工具对数据进行深度加工,从而更好的管理者服务。通过建立统一的数据服务平台来满足针对跨部门、跨系统的数据应用。通过统一的数据服务平台来统一数据源,变多源为单源,加快数据流转速度,提升数据服务的效率。

 


发表评论

评论列表

  • 这篇文章还没有收到评论,赶紧来抢沙发吧~
展开