数据沿袭记录了数据通过企业的关技工具IT系统的过程,展示了数据如何在它们之间移动,法和并在此过程中针对不同用途进行转换。什数术最它使用元数据(关于数据的据沿佳数据)使最终用户和数据管理专业人员能够跟踪数据资产的历史,并获取有关其业务意义或技术属性的袭相信息。
例如,关技工具数据沿袭记录可以帮助数据科学家、法和其他数据分析师和业务用户了解他们使用的什数术最数据,并确保这些数据与他们的据沿佳信息需求相关。数据沿袭在数据治理、袭相主数据管理和法规遵从计划中也发挥着重要作用。关技工具在这些举措的法和其他方面,它简化了两个关键的数据治理程序:分析数据质量问题的根本原因和数据集更改的影响。
数据沿袭信息主要是从操作系统(在处理数据时)收集,以及从数据仓库和数据湖收集-这里存储数据集用于BI和分析应用程序。除了详细的文档之外,还可以创建数据流图和图表,以提供映射到业务流程的数据沿袭的可视化视图。为了简化最终用户对沿袭信息的访问,它通常被合并到数据目录中,其中列出了数据资产和与之相关的元数据。
有关数据沿袭的信息对于数据管理和分析工作至关重要。沿袭详细信息可以帮助企业有效地管理和使用数据。如果无法访问这些详细信息,企业将很难充分利用数据的潜在商业价值。
以下是数据沿袭提供的好处:
更准确和有用的分析。通过让分析团队和业务用户了解数据的来源及其含义,数据沿袭提高了他们的能力,让他们更快查找BI和数据科学使用所需数据。这会带来更好的分析结果,并使数据分析工作更有可能提供有意义的信息来推动业务决策。
更好的数据治理。数据沿袭还有助于跟踪数据和执行治理过程的其他关键部分。它可以帮助数据治理经理和团队成员确保数据有效、干净和一致,并且得到妥善保护、管理和使用。
更严格的数据安全和隐私保护。企业可以使用数据沿袭信息来识别需要特别强安全性的敏感数据。它还可用于根据安全和数据隐私策略设置不同级别的用户访问权限,并评估潜在的数据风险,作为企业风险管理策略的一部分。
提高法规合规性。数据沿袭提供更好的安全保护,这可以帮助企业确保他们遵守数据隐私法和其他法规。有据可查的数据沿袭还可以更轻松地进行内部合规审计和合规级别报告。
简化数据管理。除了数据质量改进之外,数据沿袭还促进了各种其他数据管理任务。示例包括管理数据迁移、打破数据孤岛以及检测和解决数据集中的差距。
数据沿袭还与数据分类和数据出处这两个数据管理流程密切相关。以下让我们看看它们是什么以及它们与数据沿袭的区别和关系。
数据治理的本质是创建企业数据政策,并确保人们遵守这些政策。这样的政策可以跨越意图,包括关于数据保护、验证和使用的指令。数据治理经理和数据管理员必须收集业务用户的数据需求,并与决策数据治理委员会的成员合作,就通用数据定义达成一致,指定数据质量指标并制定政策和相关程序。
然而,在定义数据治理策略和部署它们之间存在差距,弥合此差距是一个巨大的挑战。这就是数据沿袭的用武之地。它记录了数据源和流,使治理团队能够监控数据如何在系统中移动以及如何修改和使用。沿袭信息可帮助他们确保适当的数据安全和访问控制到位,并根据治理策略存储、维护和使用数据。
数据沿袭还可以简化与治理相关的特定任务。例如,如果没有办法确定数据错误是从哪里引入系统,那么数据管理员和数据质量分析师就很难识别和修复它们。这会产生后果:如果没有发现数据缺陷,企业可能会受到不一致或不准确的分析结果的困扰,从而导致错误的业务决策。
在数据错误的根本原因分析中,沿袭记录提供了可视性,让企业可了解数据集所经历的处理阶段顺序。企业可在每个阶段检查质量级别,以找出数据错误的来源。从第一次发现错误的地方开始向后工作,数据管理员可以检查数据是否符合早期的预期或当时是否包含错误。通过查明数据在进入时合规但在退出时存在缺陷的阶段,参与数据治理计划的工作人员可以消除错误的根本原因,而不仅仅是纠正不良数据。
在执行影响分析以掌握源数据格式和结构更改引起的问题时,数据沿袭也很有用,这是当今日益动态的数据环境中的常见问题。
当数据发生变化时,下游可能会产生意想不到的后果。通过从数据创建或收集点开始工作,数据管理者可以依靠数据沿袭文档来帮助跟踪数据依赖关系,并识别受更改影响的处理阶段。然后可以重新设计这些阶段以适应变化,并确保数据在不同系统中保持一致。
企业可以使用各种技术来收集和记录数据沿袭信息。它们不一定是相互排斥的,企业可能会使用不止一种沿袭技术,具体取决于其应用程序需求和数据环境的性质。可用的方法包括:
另一种方法是完全手动的:采访业务用户、BI 分析师、数据科学家、数据管理员、数据集成开发人员和其他工作人员,了解数据如何在系统中移动以及如何被使用和修改。收集的信息可用于绘制数据流和转换,也许可以作为数据沿袭计划的起点,然后再部署更自动化的技术。
以下是一些最佳做法,可帮助保持数据沿袭过程正常进行,并确保它提供有关数据集的准确和有用的信息:
手动收集元数据和记录数据沿袭需要大量资源投资。这也容易出错,并可能会导致大问题,尤其是在企业越来越依赖数据分析来推动业务运营的情况下。因此,为了更好地完成数据治理工作,应该寻找工具来管理数据沿袭表示,并在整个企业中自动映射它们。
如果你决定推进技术评估流程以进行可能的购买,你应该寻找可以执行以下操作的数据沿袭工具:
为数据工程师和分析团队提供自助式数据准备软件的供应商(例如DataRobot和Alteryx的Trifacta部门)也支持数据沿袭功能,各种BI和分析工具供应商也支持在其上运行的应用程序中使用的分析工具。
责任编辑:赵宁宁 来源: TechTarget中国 数据沿袭数据(责任编辑:知识)
曝华为今年Mate60 RS保时捷版或取消 有其它高端版本 -
华为Mate60标准版悄然开售!12+512GB售价5999元 -
iQOO Z7 Pro蓝湖配色图放出 外观很清新 8月31日发布 -
北交所开市在即!11月13日进行通关测试 首批星宿股达81家
华为或在刻意隐藏麒麟9000S GPU信息 发布会有惊喜? -