在数据分析领域,有几个流行语虽然很重要,但由于它们的复杂性,它们的定义很差。这些术语,比如“大数据”,云计算,”和“数据驱动”对外行来说可能很晦涩。成功的关键之一数据分析职业然而,通过在早期清晰地定义这些术语来建立一个坚实的知识基础。
学习数据分析的语言将增强您的理解,并使您能够将这些知识用于您的优势。一旦你理解了“数据驱动”这个短语的定义,你就可以开始把它应用到你的决策和作为数据分析师的职业生涯中。
“数据驱动”意味着什么?
也许今天最常见的流行语之一是“大数据”。但什么是“大数据”呢?该术语通常用于描述信息的量级和复杂性。如果从中提取了大量信息,即使是少量的内容也可以被认为是“大数据”。
下载我们的免费指南进入分析
从行业最受欢迎的职位到当今炙手可热的数据技能,你需要知道的指南。
那么“数据驱动”是什么意思呢?这个术语描述了一个决策过程,包括收集数据,从数据中提取模式和事实,并利用这些事实做出影响决策的推论。
数据驱动决策(DDDM)是根据实际数据而不是仅仅凭直觉或观察来做出组织决策的过程。
如今,每个行业都以数据驱动为目标。没有任何公司、团体或组织说:“我们不要使用这些数据;仅凭我们的直觉就能做出可靠的决定。”大多数专业人士都明白,如果没有数据偏见和错误的假设(以及其他问题),就会影响判断,导致糟糕的决策。然而,在一个最近的调查在美国,58%的受访者表示,他们的公司至少有一半的常规商业决策是基于直觉或直觉,而不是数据。
那么,您如何确保您所做的决策是基于数据的,没有偏见,并专注于能够增强组织能力的明确问题呢?
如何做出数据驱动的决策
为了有效地利用数据,专业人员必须实现以下目标:
1.明确你的使命。
一个全面的数据分析师非常了解业务,并具有敏锐的组织敏锐度。问问你自己在你所处的行业和竞争激烈的市场中存在什么问题。彻底地识别和理解它们。建立这些基础知识将使您以后能够更好地利用数据进行推断。
在开始收集数据之前,您应该首先确定您想要回答的业务问题,以实现您的组织目标。通过确定您需要知道的精确问题来为您的策略提供信息,您将能够简化数据收集过程并避免浪费资源。
2.识别数据源。
将您将从中提取数据的来源放在一起。你可能需要协调来自不同数据库、网络反馈表单甚至社交媒体的信息。
协调各种数据源似乎很简单,但在每个数据集之间找到公共变量可能是一个非常困难的问题。可以很容易地满足于将数据仅用于当前目的的当前目标,但明智的做法是确定这些数据是否也可以用于未来的其他项目。如果是这样,您应该努力开发一种策略,以在其他场景中也可访问的方式表示数据。
3.清理和整理数据。
令人惊讶的是,80%数据分析师有20%的时间用于清理和组织数据,只有20%的时间用于实际执行分析。这个所谓的“80/20规则”说明了在您尝试解释这些信息对您的组织可能意味着什么之前,拥有干净、有序的信息的重要性。
术语“数据清理”是指通过删除或纠正不正确、不完整或不相关的数据来准备原始数据以供分析的过程。要做到这一点,首先要构建表来组织和编目您所找到的内容。创建一个数据字典——一个对每个变量进行编目的表,并将它们转换为它们在这个特定项目上下文中对您的意义。这些信息还可能包括数据类型和其他处理因素。
4.进行统计分析。
一旦彻底清理了数据,就可以开始使用统计模型分析信息了。在这个阶段,您将开始构建模型来测试数据,并回答您在此过程早期确定的业务问题。测试不同的模型,如线性回归、决策树、随机森林建模等,可以帮助您确定哪种方法最适合您的数据集。
在这里,您还需要决定如何呈现信息以回答手头的问题。有三种不同的方式来展示你的发现:
- 描述性信息:就是事实。
- 推论信息:事实,加上对这些事实在特定项目背景下所表明的含义的解释。
- 预测信息:基于事实的推断和基于你的推理的进一步行动的建议。
明确信息将如何最有效地呈现将有助于你在解释数据时保持条理。
5.得出结论。
数据驱动决策的最后一步即将得出结论。问问自己,“你从这些统计数据中了解到了什么新信息?”尽管有压力去发现一些全新的东西,一个很好的开始是问自己一些你已经知道或自认为知道答案的问题。
许多公司经常对他们的产品或市场做出假设。例如,他们可能相信“这个产品有市场”,或者“这就是我们的客户想要的”。但在寻找新的信息之前,首先要对现有的假设进行测试。证明这些假设是正确的将为你的工作打下基础。或者,反驳这些假设可以让你消除任何错误的说法,也许在不知不觉中,对你的公司产生了负面影响。请记住,一个特殊的数据驱动决策通常产生的问题多于答案。
从分析中得出的结论将最终帮助您的组织做出更明智的决策,并推动战略向前发展。然而,重要的是要记住,如果这些发现没有得到有效的展示,它们实际上是无用的。因此,数据分析师必须熟练掌握数据讲故事尽可能有效地与主要利益相关者沟通他们的发现。
数据驱动决策与组织成功
顺便说一句,上面列出的大多数步骤都不会生成统计信息。这些有效利用数据的大部分步骤反而鼓励新手数据分析师在他们的角色中变得全面。这个过程帮助专业人员不仅能够分析数据,而且能够从整体角度理解数据,并根据数据提供见解。
乔尔·施瓦兹他补充说,值得一问的是,“是谁?不是在我的行业中使用数据驱动的决策?’因为最成功的公司几乎都是这样。他继续说:
以Netflix为例。该公司最初是一家基于邮件的DVD共享业务,基于数据驱动的决策,发展成为互联网流媒体——成为当今最成功的公司之一。如果没有数据,Netflix就没有基础来做出这样一个巨大而有影响力的决定。此外,如果没有这个决定,公司就不会以现在的速度和方向蓬勃发展。
亚马逊是另一个尖锐的例子。从最初的一家在线书店发展成为一个巨大的在线中心,几乎可以提供人们想要或需要的任何产品。是什么驱使他们做出如此重大的决定?数据。毫不奇怪,如此重大(且成功)的品牌重塑举措是基于数据收集和由此得出的推论。
如果没有数据驱动的决策方法,Netflix仍将是一种过时的电影内容邮寄模式,亚马逊将是一个简单的在线书店。最重要的是,这种数据驱动的方法将所有其他方法挤出市场。世界正在变得数据驱动,不做出数据驱动的决定将是愚蠢的。
相关文章
安全与弹性研究理学硕士你能做什么?
统计学家做什么?角色、责任和职业道路
什么是数据分析的统计建模?