一、大数据时代已来临:
目前以云存储为代表的公共存储服务模式已初现端倪,将可能在未来5-10年成为主流 存储模式之一。类似于水电气公共服务,存储平台服务化意味着现有的存储系统面临新的挑战。存储按需服务的公共模式将引入用户应用的多样性、异构性和个性化、用户访问的高并发性和动态性、以及数据自身的复杂性等特点,导致大数据时代的趋势和特征凸现。大数据电子商务在现实世界中有着非常广泛的分布和应用,包括医疗信息、视频监控、移动设备、智能设备、非传统 IT
设备、传统IT 非传统应用以及特定行业需求等。如在零售业中,对大数据电子商务的分析越来越受重视。沃尔玛在全球有8400家门店,每周有20亿笔客户交易数据,沃尔玛公司很早就开始从日常交易记录析出关联交易,在2004年卡特里娜飓风来袭前,沃尔玛就从手电筒和电池的销售中成功分析出馅饼即将热销。随着计算机和存储成本的下降,中小型零售企业也能够利用IT技术对收集的大量数据分析,开展商务智能应用。再如,在医疗健康领域,由于电子医疗记录时代的来临、医疗图像技术进步、基因研究以及制药工程中对于大型数据库的应用,大规模复杂数据在医疗机构中变得很普遍。通过对大量病人的各类数据进行数据挖掘分析,有助于更有效地找出疾病成因,进而提供针对性地预防、诊断和治疗措施。美国著名的综合管理式医疗财团Kaiser Permanente,拥有超过8百万会员、36 家医院以及超过400家医疗机构,各部门需要在同一时间分析众多因素,包括治疗、人口统计资料(如年龄、性别等)、实验室结果、处方、诊断、医疗保险计划以及付款记录等,综合这些不同的信息,以便决策系统向医护人员提供完整的病人历史,选择最佳的医护办法。
二、潜在商机李开复的12月3日的更新的微博针对大数据电子商务时代进行了预测【:大数据电子商务的可能应用领域】
1. 保险业:收集汽车驾驶数据制定个性化保险政策价等;
2. 零售商:基于全市场数据的商品推销策略分析等;
3. 金融业:利用历史数据分析诈骗等;
4.医疗保障:通过健康数据提高病人护理条件等;
5.制造业:估算保修费用,检测零部件问题等。
针对大数据时代的进行深度分析挖掘,将能创造巨大商机,目前各大电子商务网站如淘宝网,
繁多的产品让人无从抉择,用户能做的就是反复对比同类产品的优缺点,过往买家的评论来决定自己的选择,但是这对用户来说是极其痛苦的,如果后台能对海量的用户行为数据进行快速分析,推荐出用户阶段性最需要最适合的产品,将能极大的促进商家的销售额。
目前推荐做得较好的网站有亚马逊和当当网等,能针对用户需要,动态的给与极其准
确的推荐信息,推荐结果准确,推荐更新度极快。
三、大数据时代信息推荐相关技术
推荐技术:主流的推荐算法有基于物品相似度的推荐和基于用户相似度的推荐。目前各大电商网站普遍采用的是基于物品的相似度推荐,但是如何将准确度量用户的兴趣仍然是个难题;基于用户相似度推荐主要用在新闻等用户远少于物品的网站,如新闻评论类网站。 并行计算技术:为了提高用户服务质量,后台采用Hadoop的mapreduce技术进行分布式并行计算是主流趋势,但是该技术存在严重的单点故障和性能瓶颈,目前国内外各大研究所都在针对hadoop存储平台和mapreduce技术进行优化研究,最新锐的研究技术产品是MapR“构建一个 HDFS 的私有替代品,这个替代品比当前的开源版本快三倍,自带快照功能,而且支持无Namenode单点故障(SPOF),并且在API上和兼容,所以可以考虑将其作替代方案。”)
四、大数据时代信息推荐相关网站介绍
9 点优品:该网站用户定位做最有品质的购物推荐,经本人分析网站主要针对100 以上品牌商品进行推荐,有较多针对摄影爱好控的权威推荐,优质正品推荐是
该网站的最大优点,网站对产品的价格、销量、质量三方关注,同时附带个人评价,有一定的参考价值,另外有个“我勒个趣”的趣味推荐,主要发布新奇特推荐信息,比较吸引眼球。网站缺点在于关联推荐做得不够好,如推荐榨汁机的关联推荐中三款哟两款是体恤刀,目测推荐技术采用的只是分类关联推荐,粒度太大,有待改进;另外网站缺乏网友交互功能。逛:该网站定位女性逛街推荐品,主打推荐的产品很便宜,如小
饰品小零食,网站采用图片瀑布流的推荐模式,很适合女生浏览,但缺点是推荐的描述信
息量小,难以判断推荐产品的优劣。什么值得买:该网站最大特点是交互做得很好,有网友对推荐信息的二度评价,帮助用户做出判断,但缺也很明显,产品推荐缺乏层次,高中低端都有,且混杂在一起,难以去按价格分类选择。 惠惠:该网站是网易旗下购物推荐网站,主打推荐是购物返现活动,页面交互体验很好,但是对于返现操作对很多用户还是太陌生,如果想要发展,建议先做普及。否则用户群体只能是网购资深达人,不适合普通用户。
五、大数据时代信息推荐的未来
以上大数据时代推荐信息目前都是人工运营,运营强度极大,且具有个人偏好,对运营人员来说极辛苦,对用户来说,随机性较大;如果能将传统的推荐算法与人工推荐有机结合,在后来采取 MapR计算框架,结合前台推荐算法和人工推荐结果,将极大的推动这一产业的未来发展。