如何收集大数据

如何收集大数据
现在谈论大数据已经没有新意了,形形色色的产品、平台和公司都贴满大数据标签,但大数据却并没有掀起预期飓风,甚至还被冠以“伪命题”污名。
本末倒置,数据采集才是大数据产业的基石。都在说大数据应用、大数据价值挖掘,却不想,没有数据何来应用、价值一说。就好比不开采石油,一味想得到汽油。当然,石油开采并不容易,各行各业包括政府部门的信息化建设都是封闭式进行,海量数据被封在不同软件系统,数据源多种多样,数据量大、更新快。

操作方法

  • 01

    一、软件接口方式 各个软件厂商提供数据接口,实现数据采集汇聚。 实现过程: · 协调多方软件厂商工程师到场,了解所有系统业务流程以及数据库相关的表结构设计等,细节推敲,确定可行性方案; · 编码 · 测试、调试阶段 · 交付使用 接口对接方式的数据可靠性与价值较高,一般不存在数据重复的情况;数据通过接口实时传输,满足数据实时性的要求。 接口对接方式的缺点是接口开发费用高;协调各个软件厂商,协调难度大、投入人力大;扩展性不高,如:由于业务需要各软件系统开发出新的业务模块,其和大数据平台之间的数据接口也需做相应修改和变动,甚至要推翻以前的所有数据接口编码,工作量大、耗时长。

  • 02

    二、开放数据库方式 实现数据的采集汇聚,开放数据库是最直接的一种方式。 两个系统分别有各自的数据库,同类型的数据库之间是比较方便的: 1. 如果两个数据库在同一个服务器上,只要用户名设置的没有问题,就可以直接相互访问,需要在from后将其数据库名称及表的架构所有者带上即可。select * from DATABASE1.dbo.table1 2. 如果两个系统的数据库不在一个服务器上,建议采用链接服务器的形式处理,或者使用openset和opendatasource的方式,这个需要对数据库的访问进行外围服务器的配置。 而不同类型的数据库之间的连接就比较麻烦,需要做很多设置才能生效,这里不做详细说明。 开放数据库方式可以直接从目标数据库中获取需要的数据,准确性高,实时性也能得到保证,是最直接、便捷的一种方式。 但开放数据库方式也需要协调各个软件厂商开放数据库,难度大;一个平台如果同时连接多个软件厂商的数据库,并实时获取数据,这对平台性能也是巨大挑战。不过,出于安全性考虑,软件厂商一般不会开放自己的数据库。

  • 03

    三、基于底层数据交换的数据直接采集方式 通过获取软件系统的底层数据交换、软件客户端和数据库之间的网络流量包,基于底层IO请求与网络分析等技术,采集目标软件产生的所有数据,将数据转换与重新结构化,输出到新的数据库,供软件系统调用。 技术特点如下: 1. 无需原软件厂商配合; 2. 实时数据采集,数据端到端的响应速度达秒级; 3. 兼容性强,可采集汇聚Windows平台各种软件系统数据; 4. 输出结构化数据,作为数据挖掘、大数据分析应用的基础; 5. 自动建立数据间关联,实施周期短、简单高效; 6. 支持自动导入历史数据,通过I/O人工智能自动将数据写入目标软件; 7. 配置简单、实施周期短。 基于底层数据交换的数据直接采集方式,摆脱对软件厂商的依赖,不需要软件厂商配合,不仅需要投入大量的时间、精力与资金,不用担心系统开发团队解体、源代码丢失等原因导致系统数据采集成死局。 直接从各式各样的软件系统中开采数据,源源不断获取精准、实时的数据,自动建立数据关联,输出利用率极高的结构化数据,让不同系统的数据源有序、安全、可控的联动流通,提供决策支持、提高运营效率、产生经济价值。

方法/步骤2

  • 01

    1、公开信息及整理比如统计局的数据、公司自己发布的年报、其他市场机构的研究报告、或者根据公开的零散信息整理;

  • 02

    2、购买的数据库市场上有很多产品化的数据库,比如Bloomberg、OneSource、Wind等等,这个一般是以公司的名义买入口,不光咨询公司还有很多高等院校及研究机构也买了;

  • 03

    3、自己的数据库自己维护的数据库有,但是比较少,一是专业的数据公司差不多能想到的都做了,二是自己做数据库其实是一件很麻烦的事情。在有些数据是外界无法得到的情况下有可能自己维护一个小型的数据库;

  • 04

    4、咨询行业专家当然是有偿的,这个在项目中应该蛮常见的。有些行业专家会专门收集和销售数据,想要的基本能买到。

  • 05

    5、发问卷有时候为了单独的项目也会收集很特别的数据,如果外界实在没有但是项目上没有不行就只有自己做了,比如自己发发问卷之类的,但是这类数据需求要控制工作量,因为除非数据本身是交付内容之一,要不然不能为了个中间件花费太多时间和精力;

  • 06

    6、客户有些数据就是来源于客户,甚至是咨询公司的产品。举个例子,比如HR咨询公司的行业工资数据、四大的一些数据库等等,这些数据的采集需要比较强的专业性或者时间积累,很大一部分是通过调查客户的HR收集来的数据进行统计的。

(0)

相关推荐

  • 如何防止大数据泄露隐私(大数据时代如何保护个人隐私)

    在看文章前,先来思考一个小问题--你的手机多长时间新换一次?根据阿信的观察,大部分人更换手机的频率少则一两年,多则在三四年左右.由于用久的手机更容易卡顿或出现故障给使用者带来不便,因此更换新手机是非常 ...

  • 大数据有什么重要的作用

    现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大数据就是这个高科技时代的产物. 操作方法 01 数据的收集方式有很多方法,可以根据人们上网主要浏览的网 ...

  • 大数据技术学习路线指南:[1]大数据是什么

    大数据技术作为决策神器,日益在社会治理和企业管理中起到不容忽视的作用,美国,欧盟都已经将大数据研究和使用列入国家发展的战略,类似谷歌,微软,,亚马逊等巨型企业也同样把大数据技术视为生命线以及未来发展的 ...

  • 大数据的应用与弊端

    随着互联网时代的到来,也诞生出了很多领域,现在大家最关心的是大数据领域,那到底什么是大数据,大数据可以应用在哪些领域和行业呢?大数据的应用有没有什么弊端呢?下面问您详细解答 操作方法 01 大数据(b ...

  • 大数据时代,大数据概念,大数据分析是什么意思?

    世界包含很多难以想象数字化信息变得更多更快......从商业到科学,从政府到艺术,这种影响无处不在,科学家和计算机工程师们给这种现象创造了一个新名词:"大数据". 大数据里面包含很 ...

  • 什么是大数据?大数据能做什么?

    想必现在很多人都听说过大数据,那什么是大数据?大数据能做什么?下面小编为大家解读什么是大数据. 操作方法 01 大数据,顾名思义,指的就是一个很大的数据的集合体,具体指在无法在可承受的时间范围内用常规 ...

  • 大数据云计算是什么?大数据与云计算的关系?

    很多朋友不知道大数据云计算到底是什么,下面来简单介绍一下. 操作方法 01 从本质上来说的话,云计算实际上就是通过计算能力将一些小颗粒度的服务提供给用户来进行服务,并且收取一定的费用. 02 大数据的 ...

  • 大数据精准营销|如何牢牢抓住用户的心?

    营销如何像谈恋爱一样,让消费者能够一见钟情.二见倾心.三定终生,实现产品与用户多维度的契合呢? 操作方法 01 人类所有的知识可以分为三个大类:自然科学.社会科学和人文科学.一直以来,营销的科学性正是 ...

  • 详细介绍10个典型的大数据案例

    在听Gartner的分析师Doug Laney用55分钟讲述55个大数据应用案例之前,你可能对于大数据是否落地还心存疑虑.Laney的演讲如同莎士比亚的全集一样,不过可能"缺乏娱乐性而更具信 ...