JSON

Hadoop技术博文的文章列表,第23页

字号+ 作者:H5之家 来源:H5之家 2017-05-13 16:03 我要评论( )

Hadoop技术博文的文章列表,第23页

  最近由Reynold Xin给Spark开发者发布的一封邮件透露,Spark社区很有可能会跳过Spark 1.7版本的发布,而直接转向Spark 2.x。   如果Spark 2.x发布,那么它将:   (1)、Spark编译将默认使用Scala 2.11,但是还是会支持Scala 2.10。   (2)、移除对Hadoop 1.x的支持。不过也有可能移除对Hadoop 2.2以下版本的支持,

READ MORE

  Shanghai Apache Spark Meetup第九次聚会,Intel 携手 饿了么于6月18日下午13:00-17:00,在上海市普陀区金沙江路1518弄2号近铁城市广场饿了么公司5楼会议室(榴莲酥+螺狮粉)举行。欢迎大家前来参加! 会议主题 开场/Opening Keynote: 毕洪宇,饿了么数据运营部副总监   毕洪宇个人介绍:饿了么数据运营部副总监。本科和研究生都是同济大学。

READ MORE

  《Spark 2.0技术预览:更容易、更快速、更智能》文章中简单地介绍了Spark 2.0带来的新技术等。Spark 2.0是ApacheSpark的下一个主要版本。此版本在架构抽象、API以及平台的类库方面带来了很大的变化,为该框架明年的发展奠定了方向,所以了解Spark 2.0的一些特性对我们能够使用它有着非常重要的作用。本博客将对Spark2.0进行一序列的介绍(参见Spark 2.

READ MORE

Spark 2.0技术预览:更容易、更快速、更智能

Spark 2.0技术预览:更容易、更快速、更智能

  在过去的几个月时间里,我们一直忙于我们所爱的大数据开源软件的下一个主要版本开发工作:ApacheSpark2.0。Spark1.0已经出现了2年时间,在此期间,我们听到了赞美以及投诉。Spark 2.0的开发基于我们过去两年学到的:用户所喜爱的我们加倍投入;用户抱怨的我们努力提高。本文将总结Spark 2.0的三大主题:更容易、更快速、更智能。更深入的介绍将会在后面博客进行介绍。   我们

READ MORE

首发丨360开源的类Redis存储系统:Pika

首发丨360开源的类Redis存储系统:Pika

编者按:本文由陈宗志在高可用架构群分享,转载请注明来自高可用架构「 ArchNotes 」。 陈宗志,360公司基础架构组高级存储研发工程师, 负责设计实现了 bada, pika, floyd 等一系列存储相关的产品, 开发设计团队内部的基础库 pink, mario 等等。 Pika 是 360 DBA 和基础架构组联合开发的类 Redis 存储系统,完全支持 Redis 协议,用户不需要修改

READ MORE

Scala模式匹配和函数组合

函数组合 让我们来创建两个函数 1 scala>def f(s: String)= "f(" + s +")" 2 f: (String)java.lang.String 3 4 scala>def g(s: String)= "g(" + s +")" 5 g: (String)java.lang.String compose方法 compose组合其他函数形成一个新的函数f(g(x

READ MORE

关于大数据的常见误解

我时常听创业者说自己的公司每天会生产/记录很多的数据,虽然他们暂时还没想明白怎么用这些数据,但把这些数据都先存起来了。他们经常还说,通过这些数据他们的产品/服务将得到很大的提升,仿佛这些数据就是公司的救世主一样。我不想讨论这种观点正确与否,但想在这里解释两个关于大数据的常见误解: 一、数据不等于信息 经常有人把数据和信息当作同义词来用。其实不然,数据指的是一个原始的数据点(无论是通过数字,文字,图

READ MORE

最新可访问Google的Hosts文件[2016年04月26日更新

  本hosts文件于2016年04月07日更新:(1)、如果之前的hosts文件还有效可以不更新;(2)、由于大家使用的带宽种类,地区等不一样,被墙的程度不一样,所以有些地区使用本Hosts文件可能无用。(3)、光靠修改Hosts文件是无法观看youtube的视频。 下载地址: 链接: 密码: jrpp

READ MORE

R、Python、Scala 和 Java,到底该使用哪一种大数据编程语言

  有一个大数据项目,你知道问题领域(problem domain),也知道使用什么基础设施,甚至可能已决定使用哪种框架来处理所有这些数据,但是有一个决定迟迟未能做出:我该选择哪种语言?(或者可能更有针对性的问题是,我该迫使我的所有开发人员和数据科学家非要用哪种语言?)这个问题不会推迟太久,迟早要定夺。   当然,没有什么阻止得了你使用其他机制(比如XSLT转换)来处理大数据工作。但通常来说,如今

READ MORE

构建大数据生态需要哪些核心技术?

构建大数据生态需要哪些核心技术?

机器学习 &金融投资 作为金融投资领域的实践者,通联数据在投研管理业务场景中有较多的经验可以分享,尤其是在信息搜集、分析判断、投资决策和后续跟踪方面,将大数据吸收并用于投资活动的“小数据”。 而完成这一系列动作就需要一个分析能力特别强的平台,平台架构底层聚合多行业的数据,包括财务数据和社交数据等等,但是我们更为关注的是这个投研平台的机器学习技术框架,因为这样一个框架基本上展现出了其技术的组成部分

READ MORE

十问大数据安全分析

1大数据安全分析的核心目标是什么? 找到隐藏在数据背后的安全真相。 数据之间存在着关联,传统分析无法将海量数据汇总,但是大数据技术能够应对海量数据的分析需求。通过大数据基础能够挖掘出APT攻击、内网隐秘通道、异常用户行为等安全事件。在此基础上可建设为安全决策支持系统,为安全决策提供数据支撑。 2 国内外大数据安全分析发展现状如何? 目前国外比较成熟的大数据安全分析主要通过采用大数据技术采集网络流量

READ MORE

Spark会把数据都载入到内存么

 

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
网友点评