考虑从事数据分析?一个实践者的角度

行业的建议分析

Jean-Patrick Tsang海湾咨询总裁强调数据的权力和影响力。


看看你的周围:世界各地充斥着数据,决策权力比你可能会实现。

例如,把乳房。汽车的原因出现在短短几分钟内是因为历史数据建立了人们最容易打车在任何给定的时间。现在,如果你认为分配给你的车是最接近的一个,再想想。分配算法不仅考虑距离,而且司机和目的地的形象。

当你买一个机票,预定酒店房间,或者租一辆车,你支付的价格是由数据分析算法意味着卖方的利润最大化。当你遵循医生的秩序和药物,更有可能你会得到更好的。这是因为药物经历了一个或多个临床试验来生成必要的数据来证实药物的临床要求。


下载我们的免费闯入分析指南

指导你需要知道什么,从行业最受欢迎的职位今天的受欢迎的数据的能力。

立即下载


数据驱动的决策是在网络世界更加引人注目。定制搜索结果根据搜索每个人在过去完成。跟随你的讨厌的横幅,填满你的收件箱的垃圾邮件,和恼人的广告在其他YouTube视频都是干预旨在提高你的购买,由于数据分析。当然,他们还不成熟,但不会很久的,直到他们的预测达到”少数派报告”水平。

数据爆炸在过去十年里,丝毫没有减弱的迹象,这意味着对数据分析的需求将继续飙升。这是真的在所有领域,从金融、医疗、住房和电子商务,社交媒体。这就是为什么现在是一个很好的开始从事数据分析,有什么更好的方式开始,而不是从一个有信誉的机构研究生学位吗?

说你有一个重要的商业决定做一个如此重要的决定雇个人来帮助你思考。行政助理为您安排见面对你三位候选人:

  • 一个候选人是一个风度翩翩,聪明,理解问题。他或她真正想帮助,但不幸的是没有你想要的技术背景运行模拟。
  • 候选人B确实是一个统计向导和绝对可以运行您的模拟等等。候选人B甚至建议一些额外的假设检验分析,你没有完全理解。他或她是一个好的倾听者,但似乎只对数据感兴趣的一部分,你的问题。
  • 候选人C有很好的掌握统计和清楚地理解你想实现的细节。候选人C不仅可以运行您的模拟,而且解释结果和你想象表达每一个决策的影响。

现在,谁会雇佣吗?建议:是那个人。

如果你仍然不确定数据分析是否适合你,有一个宝藏的信息在网上,你可以看看。范围从短视频的内容可汗学院长时间在线课程Udacity,Coursera,Udemy,edX。还提供了一个数据分析训练营东北部,水平你可以兼职,通过参与网上和地面类。

数据分析的例子

我自己的道路使我数据分析。我运行一个咨询公司,海湾咨询,这样做在过去的25年,我非常喜欢。我最喜欢的是有创造力的机会。我感谢我的客户让我去发明新的方法来解决问题。

在第一个项目之一,我们部署的遗传算法来确定哪些测试床边设备应该支持的概率最大化医生什么订单可以在设备上进行。医生通常订单之间的电池的测试,其中包含一个和20个测试。如果一个测试命令不支持床边装置,它必须运行在中央实验室,这意味着一个重要的时间延迟。运行一个测试在中央实验室,事实证明,产生相同的延迟运行所有的测试在中央实验室,所以设备必须支持所有的测试医生为了相关的请求。设备我们想出了命中率为42%,而当时最好的设备在市场上约25%。

新技术与新数据源。患者的立场声明数据出现约2001,带来了不同的范式。我们很幸运成为首批被暴露于这种新类型的数据。我马上意识到患者的立场数据有助于识别关键意见领袖(KOL)。事实上,数据描述了一个病人从一个医生到另一个之间就像一只蜜蜂跳花。蜜蜂是病人和花朵,医生。病人的ID是加密符合健康保险流通与责任法案规定。医生的ID,另一方面,是完全暴露出来,对目标至关重要。现在我们开发的技术标准的KOL识别和影响范围分析,主要以外的研究。

在另一个项目,我们部署了引力模型来评估医院的销售潜力。我们使用一个通用版本的牛顿的Gravitation-a普遍规律模型,该模型允许我们评估医院的销售潜力,敏感的存在在附近其他医院。凭直觉,模型占一个病人去医院之间的选择我们感兴趣或另一个医院。

在另一个项目中,我们必须确定哪些账户购买我们的客户的测试设备的好目标。事实证明账户刚财务拨款国立卫生研究院(NIH)可能的客户。所以,我们继续分析摘要成功的提交给美国国立卫生研究院拨款提案。我们部署的文本分析发现某些词的存在,如“报废老鼠,”高度预测的目标。多亏了这个项目,我们非常受客户的欢迎。

大约10年前,谷歌惊讶世界通过预测流感趋势与精度比在美国疾病控制和预防中心(CDC)。虽然预测在随后几年的,这让我们的客户想知道我们可以使用搜索数据来预测药物处方量到世界各地。我们建立了一个模型在大都市统计区(MSA)的水平,它使用人们输入搜索引擎作为输入和药物的处方量作为输出。我们很快意识到一个有趣的事实是搜索词集群在两个需要:访问医生之前和之后购买的药物。我们校准模型为美国,然后应用到世界各地的主要城市。模型达到预期,提供很好的估计。

在这一点上,如果你不是100%的确定,数据分析是路要走,抬头仰望天空就像开普勒第谷·布拉赫和做了一些400年前。布拉赫知道质量数据的价值,花了他的大部分生活收集它。开普勒的数据进行分析,给了我们行星运动定律,我们大多数人仍然在学校学习。没有布拉赫的数据,开普勒,尽管他天才,就不会完成他所做的。

这里有两个很好的教训。首先,良好的数据是至关重要的,良好的数据分析。如果你的数据不干净,擦洗。第二,提供一个建模环境,允许数据揭示其更为深刻的真理。你越熟练,越快的数据将会打开。和数据应该不愿合作,然后我将告诉你一个秘密:酷刑的数据足够的承认。

下载我们的免费闯入分析指南