1、生态环境大数据应用
环保业务系统大数据、大数据类型多元、模型算法复杂,因此利用大数据分析的手段对环境大数据资源开发,可以成为解决环保管理问题的钥匙。而近年来,“互联网+”为解决环境管理问题创造了诸多便利条件。政府决策部门通过互联网,可以实现环境大数据、信息等要素互通共享,从而推动环境问题得到整体有效解决。公众舆论借助互联网将对企业排污形成巨大压力,督促其有效治污,从而推动环境改善因素由单一政府向全社会延伸。
对环保行政主管部门而言,环境大数据的应用更加强调大数据获取后的分析预测和价值挖掘。借助物联网技术,把传感器和装备嵌入到各种环境监控对象中,通过云计算技术将环保领域的各物联网设备整合起来,实现人类社会与环境业务系统的整合,以更加精确和动态的方式实现环境管理和决策的“智慧”。
对企业而言,随着“互联网+生态环境大数据”的蓬勃发展以及各界对于“互联网+”对于“大数据”的关注与重视,环境大数据变革对于排污企业就意味着违法排污将有更多双眼睛盯着,更多紧箍咒压着,污染付出的代价将会越来越沉重。而对于环保企业而言,将助力企业加快产业转型升级,打开更大市场空间,迎来产业可持续发展黄金期。
“互联网+生态环保大数据”也将提升公众服务能力,通过大数据整理计算采集来的社交信息大数据、公众互动大数据等,可以帮助环保部门进行公众服务的水平化设计和碎片化扩散。可以借助社交媒体中公开的海量大数据,通过大数据信息交叉验证技术、分析大数据内容之间的关联度等,进而面向社会化用户开展精细化服务,为公众提供更多便利,产生更大价值。
2、环境大数据中心
环境大数据中心集污染源和环境质量大数据整合、大数据集成、大数据交换、大数据管理、大数据分析、大数据协同共享功能于一体,将分散的各类环境大数据统一集成,提高了大数据的标准化水平和大数据的可用性,按照大数据资源规划设计的大数据标准规范以及大数据模型进行统一组织,依据国家有关技术规范和环境信息行业技术标准分类体系构建的大数据集,对各类业务系统的大数据进行分类和梳理,按照不同的专题和用途进行分类存储和使用,同时可以完成大数据的共享和交换工作,解决各部门、各业务系统之间大数据无法共享的问题,即解决“大数据孤岛”现象,为环境管理者和决策者提供可靠、及时、全面的环境信息,从而为环境管理科学决策奠定坚实基础。
3、关于中国大数据生态系统的基础问题思考
【1】建立良性生态环境的目标
针对国家安全、社会经济等领域的大数据化生存与竞争的需求,我们需要切实解决网络化大数据社会与现实社会缺乏有机融合、互动以及协调机制的难题,形成大数据感知、管理、分析与应用服务的新一代信息技术架构和良性增益的闭环生态系统,达到大幅度提高大数据消费指数、大数据安全指数,降低大数据能耗指数等目标。我们认为,建立良性的大数据生态系统是有效应对大数据挑战关键问题,需要科技界、产业界以及政府部门在国家政策的引导下共同努力,通过转变认识、消除壁垒、建立平台,突破技术瓶颈等途径,建立可持续、和谐的大数据生态系统。
【2】评价先行,提出考量大数据生态的三大指数,包括大数据消费指数、大数据能效指数、大数据安全指数。
1)大数据消费指数:
大数据消费指数是指使用或者消费的大数据占产生的大数据的比例,旨在衡量大数据消费的能力。当前由大数据引发的新产品、新服务、新业态大量涌现,不断激发新的消费需求,成为日益活跃的消费热点。然而,大数据消费指数受到多方面发展状态的制约,包括大数据开放和互通程度、大数据分析技术、智能访问终端的普及、大数据服务基础设施的建设、大数据服务新兴产业的发展等等。当前大数据消费指数低,美国NSA声称只是扫描1.6%的全球网络流量(约29.21PB),分析其中0.025%的大数据来支持其分析和决策。我国大数据消费面临基础设施支撑能力有待提升、产品和服务创新能力弱、市场准入门槛高、行业壁垒严重、机制不适应等问题,亟需采取措施予以解决。
2)大数据能效指数:
大数据能效指数是指大数据处理中的价值能耗比例,是衡量大数据价值获取的绿色指数。当前面对大数据,通常采取基于大数据中心的粗放式的分析处理和价值提炼方式,导致大数据能效低下。一方面,由于缺乏适应大数据的计算模式,往往采取集中式全量处理方式,导致大数据处理效率低,获取单位价值所需的大数据规模非常庞大,形成了大数据价值密度低的现象;另一方面,为了适应大数据爆炸式的增长,大数据中心存储系统的容量、扩展能力、传输瓶颈等方面面临巨大挑战,直接结果就是大数据中心的能耗越来越大。有关调查显示在过去5年全球大数据中心的能耗增长率是56%,我国对大数据中心流量处理能力的需求增长更快,大数据中心能耗的问题就更加突出。目前国内大数据中心的PUE平均值基本都在2.5以上,与欧美地区的PUE(能源使用效率)普遍值1.8以下还存在着较大的差距。且目前其全球的大数据中心50%是完全用自然冷却的,前十大数据中心的PUE都在1.2以下。因此大数据能效指数是在大数据发展中必须面对的,关乎国家能源消耗的重要指数。
3)大数据安全指数:
大数据安全指数包括了大数据从创建、传输、存储到分析的全生命周期的安全指标,旨在衡量大数据安全、隐私保护等方面的能力。大数据安全是一个囊括个人,企业和国家的全方位的大数据安全体系。从个人层面,大数据对于隐私将是一个重大挑战,哈佛大学近期的一项研究显示,只要知道一个人的年龄、性别和邮编,从公开的大数据库中便可识别出该人87%的身份。对于企业,大数据作为一种资产,其安全保护问题十分重要,随着大数据的不断增加,对大数据存储的物理安全性要求会越来越高,从而对大数据的多副本与容灾机制提出更高的要求。而在国家层面,来自外部的威胁在大数据时代显然比以往更加突出和危险。举世瞩目的“维基解密”和“棱镜”事件生动昭示着大数据的严酷挑战。“维基解密”几次泄露美国军事外交等机密,规模之大,影响之广,震惊全球。“棱镜”事件向全世界曝光出网络空间国家与个人,国家与国家之间的安全对抗。因此评估大数据安全指数,有利于推动大数据安全体系的完善,提升国家、社会和个人的信息安全。
1.如何建立支撑大数据密集型科学发现新范式的基础设施:这包括了建立一系列通用的工具,以支撑从大数据采集、验证到管理、分析和长期保存等整个流程,支持跨工具、跨项目、跨领域的大数据共享与整合,将是支持大数据密集型科学发现的基础问题。
2.如何建立大数据全生命周期的计算模型:研究以大数据为中心的新型计算架构,将计算推送到大数据从获取、存储、处理、交换到服务的全生命周期的各个部分,研究大数据全生命周期中不同计算之间的关联、互动和共享机制,在提高大数据消费能力的同时有效降低大数据计算能耗,形成大数据安全体系,这是大数据计算的关键问题。
3.如何完成大数据资产化和形成大数据资产流转体系:亟需建立大数据资产化的基本标准,让不同机构、不同领域的大数据形成规范化资产;建立大数据资产访问、连接和共享机制,搭建大数据资产交易平台,形成大数据流转的层次化体系结构;研究大数据资产的所有权、使用权以及价值评估体系,通过市场化模式保障大数据资产流转的可行性。
4、环境影响评价审批系统
环境影响评价审批系统主要用于建设项目环境影响评价文件审批所需文件、表格的填报和上传。系统主要功能包括系统登录、企业信息填报、业务申请、办理状态查询等,可实现环境影响评价工作全部业务流程的信息化管理,实时掌握项目环境影响评价工作进展情况,及时将环评结果向社会进行公布,有效把握环评过程各环节中责任主体,监督环评机构的评价工作。
5、建设项目“三同时”监管系统
“三同时”监管系统主要实现从项目设计、施工、试运行、投产到项目验收的全过程管理,实现对整个项目管理的全面监控。可实现审批查询,包括公示、公告查询,提供项目审批状态查询(受理、审查、公示、批复办结或否决)。实现项目竣工验收批复查询(即受理、审查、公示、批复办结或否决)。”三同时”监管系统由企业端与环保局端组成,由企业发起“三同时”制度执行报告、验收申请等内容,环保局对报告进行管理、实行监督检查并记录,对企业竣工验收申请审查,符合条件的予以批准。最终实现对“三同时”制度执行及验收的全过程动态管理。