大发展时间尚短,对其的定义可谓“百家争 鸣”,各有其说,却尚无一致而权威的定义。结合现有的资料,大数据可作为数据集存在,通常涉 及不少于2种的数据形式,为使大数据更好地发挥作用,需 借助新型的处理模式。大数据包含“海量数据”数据规模 大的特点,而并不局限于此。虽无明确而一致的定义,然 而大数据的4V特征却得到各方面较为一致的认可。所谓4V特征,即Volume(规模大), Variety(种类多),Velocity(处理速度高效),Value(价值密度低)的特征。
1 大数据及大数据处理概论
当前互联网繁荣发展,网络上可检索到数以亿计、 千亿计的数据信息,如此巨大的数据量,即为大数据。大 数据的最早提出是在九十世纪末1880年左右的一次人口普 查中,在二十世纪基本没有变化,进入二十一世纪尤其是 2009年开始爆发式增长。大数据涵盖的范围十分广泛,并 不局限于网络中的信息或是人口普查中所涉及的信息,还 包含社会各领域、日常生活中的诸多信息,如来自工业、 电力、电子等多方面的各色信息。
大数据拥有非常巨大的数据量,而徒有数据并非大数 据成功的关键,其关键在于对大数据所具的海量的数据进 行处理,选择出合适的数据或信息投入使用,以创造更大 的价值,此过程即大数据的处理。对大数据良好的处理, 使大数据更具备价值,大数据的处理包含多种技术,如数 据挖掘电网、大规模并行处理或分布式数据库、云计算等 均为大数据的主要处理技术。大数据将发展成为一种“资 产”,并将贯穿于各个领域行业,其处理技术将不断地进 行升级,以为其增创价值。
2 大数据的主要特点分析
2.1 大数据具有极大的数据量。所谓大数据,其首要 特点便是数据之“大”,能够分析的数据至少应在100TB 之上。大数据的此项特点主要源自二个方面:其一,信息 时代,网络已经步入千家万户,网络使用者增多,因而获 取数据的途径就越便利。其二,与过去传统的以对单位或 对象收集数据方式相比,如今可谓人人有网,而没有以往
的种种限制,因而可利用的数据大为增多。
2.2大数据具有多样的类型。传统的数据往往多为结 构化数据,是原始数据的抽象化,类型较为单一。而大数 据下的数据常为非结构化数据,储存更为复杂,涉及的领 域较多,规模又很大,处理起来也更为不易。至今,非结 构化数据已经更为普遍,接近结构化数据的三倍之多,增 长速度也高达结构化数据的10到50倍不等。随数据的不断 扩充,数据已具有越来越多的类型,这是大数据的优势, 同时也是其所面临的挑战。
2.3大数据具有快速的处理能力。因大数据大而类型 多的特点,就要求其具备快速处理数据的能力。与传统模 式不同,当前的数据的产生与收集都愈发容易,数据增长 的频率显而易见。一方面,并非全部数据均可直接使用, 另一方面,数据没有停止增长,因此就需要大数据具有快 速而高效处理的能力。
2.4大数据具有较低的价值密度。大数据多为非结构 化数据,其特点之一即为较低的价值密度。非结构化数据 未经程式化的处理,多为保持本质的原始数据。结构化数 据往往是经抽象化的数据,多为可用数据,而原始数据未 被处理,包含所有有用或无用的信息,因而其价值密度是
相对较低的。
3 大数据处理的重要意义
3.1大数据处理为市场营销提供便利。市场营销是指 迎合于市场的营销,反之只有迎合了市场才能获利于市 场。市场营销首先要做到迎合市场,同时应将成本最低 化、效率最高化,而大数据处理即是达到市场营销目的的 便利方式之一。企业利用大数据处理,对市场进行分析, 得出营销中的利润点与市场中的潜在价值,从而提供更多 客户所需的商品,因而获利。
3.2大数据处理为个性化提供可能。随生活水平的提 高,人们的生活更为富有,已经从最初的温饱需求上升为 了对物质更高的追求,也有了更多对个性化的追求。传统 的商业模式通常为用户在对商品的浏览与比较中找到其所 购买的商品,而大数据处理模式下,是通过对用户的数据 分析来发现用户的习惯性需求或潜在需求,从而为用户推
荐更为精准且更具个性化的商品。
4 大数据处理对电子商务的影响
4.1大数据处理使电子商务的运营方式数据化。在大 数据的影响下,电子商务领域很大程度上改变了传统的运 营模式,现今更多哦地以数据方式为主导,贯穿于企业运 营中的采购、营销以及财务等过程。大数据处理使电商企 业数据化运营,使企业能够通过数据分析出顾客的需求, 并以此对日后的经营提前做预测,从而使成本最小化、利 润最大化。例如,亚马逊企业的分别为FDFC和FC的两种 数据化运营模式,前者主要用于预测热销商品,而后者则 用于小众商品的分析。
4.2大数据处理使行业应用得以垂直整合。垂直整合 可以理解为一种方法,以将公司的投入与产出的比例提高 或者降低到某种程度。垂直整合与价值链模型紧密联系, 可指公司、供应商与经销商三者之间价值链的整合程度, 而当公司将另外二者的价值链整合至其价值链之中,即是 完全垂直整合。电商领域对大数据处理的应用,使得企业 自身对供应商与营销商的整合能力不断增强,其间的资源 得到更好的共享,企业与用户的关系越来越近,也就获得
4.3 大数据处理使电子商务数据资产化。随着信息时 代的发展与进步,数据或大数据作为信息时代的产物将占 据越发重要的地位。有相关学者分析表示,数据化竞争将 引领未来的商业竞争,而企业制胜的关键将以其对数据的 掌握来衡量。企业将越发重视数据,将会有越来越多有关 数据的业务相应而生,如对数据分析、可视化的业务和众 包模式等。大数据在不久后的将来将发展成为一项产业, 将为企业创造更多的利益。
5 结束语
大数据是IT行业的创新与革命,其发现与发展与云计 算、物联网有同等的重要颠覆性价值。自发现而来,大数 据一直是IT行业的热点,有着居高不下的关注点,并带来 巨额的利益。有许多学者及企业家对大数据进行预言,称 大数据未来将与石油、矿产、土地和资本一样,具有无限 的财富价值和竞争价值。电子商务作为当今时代的新型商 务模式,与大数据处理有非常紧密的联系,且在今后二者 之间的联系将更为密切,可以说大数据的处理能力之优劣 直接与市场占有率成正比关系。医院信息化系统的建设,突破以往的医院信息化过程中各个 先建立一个整合的基础架构平台,然后在其上建立一个统医院各自为政形成信息孤岛的弊端,使其与在社区建立的以 一的医院信息集成平台,实现各应用系统的互联互通,最居民电子健康档案为核心的社区居民电子健康档案系统实行 终实现统一、集成的资源管理的发展路径。有效对接。同时不同机构的诊断和治疗也可以通过统一的平 3.4 业务平台虚拟化。虚拟化、云是未来的趋势。如果台查看,这样可以提高疾病医治的效率和准确度,并节省费 医院所有设备(包括核心交换机、服务器、存储等)都进行用。着力与各级医疗机构建立远程数据通道,将不同医疗机 虚拟化,医院机房耗电量、机房空间、维护成本等均会大幅构,不同医疗机构的所有医生,为一个患者提供全生命周期 度降低,而系统整体稳定性却会大幅提升。同时区域卫生信
健康与疾病的所有相关服务。从而实现医疗卫生信息化从医 息化的实现在很大程度上还要依赖云计算技术,医院信息系
院信息化走向区域卫生信息化的过度。 统大数据的深入挖掘和分析可以对医学科研产生重大影响。
3.3 一体化和集成化。以后医院信息化的建设重点逐 4 结束语
渐转移到电子病例的建立和普及上,而构建电子病例系统 以上是我们从事医院信息化工作中获得的一些经验及
的前提是实现RIS、PACS及HIS等系统的无缝连接和信息 设想,我们一直关注我国医院信息化的进程和发展,并研
共享,同时实现一体化的访问和控制,IT基础架构的整合 究和分析了国内医院信息化的现状,希望我们的文章能抛
是关键,同时也是实现数据管理和利用的基础。可以采用 砖引玉,启发人们进一步做好医院的信息化工作。