intel眼中的大数据
TB级的数据是大数据?还是结构化和非结构化的数据是大数据?intel眼中的大数据不仅仅局限于此,intel认为,大数据是处理大数据的工具。大数据不仅关乎数据,还是处理的工具,大数据含有的商业价值比一般的数据大很多。世界上任何国家地区都认识到了数据能改变他们现有的业务模式。
Intel不但在芯片市场业内领先,intel也开始关注Hadoop以及一些软件。Hadoop和软件的结合可以更好的利用大数据所带来的商业机会。几年以前,intel与中国合作伙伴的合作模式就有所转变,Intel公司高级副总裁Boyd Davis介绍说,” 现在大数据能够使得中国移动这样的公司更加接近于他们的用户,并且为用户提供更好的服务。”
大数据的行业应用
大数据在智慧城市领域影响巨大。中国正在快速的发展中,智慧城市利用一些图像的控制和监控的视频来提升交通流量和顺畅度,比如重庆就利用了监控的数据提升公共安全和交通的便利性;大数据另外一个很有作为的地方就是医疗健康领域,传统的治疗癌症的药品对于癌症患者无济于事时,利用大数据<此处内容被屏蔽>癌症基因组的秘密可以揭开癌症的面纱。
然而从谷歌到雅虎,Hadoop作为一个开源性的大数据应用工具,不可能完全解决所有大数据的问题,Hadoop本身也不是一个所谓的解决方案。在传统的产业中,很多人使用Hadoop让IT更加简化,并发挥非常大的潜力,使IT更容易部署,成本更低,并且应用到更广泛的领域当中。
intel在各个领域当中对Hadoop进行改进。Boyd Davis介绍说,“当今的Hadoop是一种批处理工具,并提供无限的价值。但是intel现在要把Hadoop打造成下一个平台,使其能够更广泛的应用和获得更大的能力。”
大数据面临现实挑战
大数据的发展并不是一帆风顺的,在安全、实时响应、环境的负载度、实现业务价值途径等方面都存在很多挑战。很多公司一开始都是考虑要存储什么样的数据,以及如何从这些数据分析当中得到什么样的价值?这是大部分公司所想的问题。
实际上,很多公司还需要对处理的时间上进行更高层次的要求。因为对于用户来说,对于高度集成或者私有的封闭方案可能会更快的解决问题,大数据的长期价值也在于此。
随着intel加入到Hadoop的生态系统中,intel完全投入到开源中去。针对非常复杂的问题,intel可以在硬件层增强平台的安全性,共同驱动新项目。
“intel的至强处理器不但能够提高计算、联网和储存能力,还能使得Hadoop的用户集群能够更容易部署,尤其是在存储控制方面,保证用户知道他们的数据位置和有效介入。” Boyd Davis说到。至强处理器和标准Hadoop在分发版的情况下处理速度能增强50%,交换率提高50%,硬盘提高40%,系统四个小时之内批处理的量能够在7分钟内处理1TB数据。
intel通过Hadoop平台的支持,能够使更多的公司更好的利用数据。目前可以针对文本搜索的数据来进行全文本的搜索和语义分析,运行在FDS顶层,并且能基于文本搜索进行业务价值的提升。
Boyd Davis进一步说到,Intel在各方面推进开源,而Hadoop不但是一个商业软件,也是开源的来源。开源软件是一个开放工具,但是对于Intel来说是开发开源的软件,Hadoop不但能够带来很大的价值和现金流,而且能够推进整个行业的平台的能力。所以说intel希望能够围绕着开源的平台增强整个生态系统的能力。