400-6158-050全国咨询热线:
当前位置:主页 > 移动互联网 >

非结构化数据可以分为两个主要部分:捕获的

文章出处:未知 网责任编辑:admin作者:admin 人气:发表时间:2018-05-23 23:48

  时时彩官网如何透过“大数据”的一般性数据,瞄准最有用的信息,并指出这些信息能如何帮助公司得到新见解

  大数据指的是那些只能通过日益尖端复杂的工具进行处理和分析的大数据集。即使我们只关注以客户为导向的数据,其数据范围也几乎不会减少。

  所以,我和我的同事们就新建了一种分类法,帮助我们透过“大数据”的一般性数据,瞄准最有用的信息,并指出这些信息能如何帮助公司得到新见解。

  为什么这些数据如此重要?这是因为数字化产生的数据量常常超出我们存储、处理,以及利用他们的能力范围。

  可以不用轻信我的话,但是正如著名的统计学家内特·希尔(Nate Silver)说的那样,每一天的每一秒,我们产生的数据量都三倍于美国国会图书馆产生的所有数据量。这些数据中大多是不相关的无用信息,所以除非不懂技术的商务人士明确地知道收集到的是什么数据以及如何实际应用它,否则他们会被大量的数据淹没。

  外部收集的数据可以分为两大类:结构化数据和非结构化数据。大多数的商务人士对结构化数据比较熟悉。它可以分为五种主要类型,即创建型数据(created)、激发型数据(provoked)、交易型数据(transacted)、汇编型数据(compiled)和实验型数据(experimental)。

  创建型数据包括过时的市场研究调查和消费者普查。另外一种“创建型数据”的来源,则是人们通过在线注册(或线下注册)俱乐部和客户忠诚计划——他们都是自愿提供自己的信息。这类数据被称为”创建型数据”,是因为如果我们不利用一些机制去问别人问题、收集他们回答的话,这类数据就不存在。

  激发型数据是通过给人们表达自己观点的机会来收集到的数据。最有名的一类激发型数据就是评级和评论:从一星到五星,给一家餐厅评星;对挂在零售商网站、电子商务网站上的商品作评论。当你访问“尖叫”(Yelp,美国的一家点评网站)或者“亚马逊”(Amazon)并发表评论的时候,你就在身体力行地壮大这类数据。

  交易型数据是我们每次点击网站或网页条幅图像广告时产生的数据,它包括网上购物、检查收银机时产生的数据。通过交易型数据,我们可以准确地知道我们何时何地购买了何种商品。将交易型数据与其他信息配对(如天气),我们就可以获得更多的见解(譬如,我们可以知道当台风将要来临的时候,人们会在沃尔玛购买更多的果酱馅饼)。

  汇编型数据来源于公司的大型数据库,比如埃克斯(Axcion)和益百利(Experian),他们涉及到每个美国家庭。他们收集你的信用评分、你的居住地、你的购买经历、你用自己名字注册购买的汽车等等信息。这些数据库以名字和地址作为通用识别码,为营销公司挖掘信息和匹配其他数据提供海量资讯。

  实验型数据实际上混合了创建型数据和交易型数据。它包括设计实验让不同的客户群体受到不同的市场对待(这是实验型数据的已创建部分),然后在现实生活中观察其不同结果(这是实验型数据的交易性方面)。

  现在我们来讨论非结构化数据。非结构化数据不能简单地通过数值等级、点击率、计算机IP地址、cookie小量信息或条码来分类。当然,非结构化数据真正的爆发点是其数据量的激增。

  让我们设想一下,当你用Instagram软件上传照片的时候,你就在全世界范围内增加了非结构化数据的量。非结构化数据可以分为两个主要部分:捕获的数据和用户生成的数据。

  捕获的数据是指被动地从个人行为中获得的数据,如你输入搜索的条目、通过手机GPS定位系统生成的位置数据等。在这些情况下,你并没有意识到自己在生成自己的信息。

  用户生成的数据包括YouTube上上传的视频、通过SharePoint软件进行电话呼叫、办公、门户网站制作;对新闻媒体网站上的文章评论表达自己的观点、写一个博客条目;或者在Twitter上发表自己的观点。

  大多数用户生成的数据不是归因于具体的个体行为。用户生成的数据可以用来为产品设计和沟通提供背景环境,但是不能将其作为直接目标。

此文关键字: