『 Spark 』5. 这些年,你不能错过的 spark 学习资源
admin
2023-07-31 01:45:28
0

原文链接:『 Spark 』5. 这些年,你不能错过的 spark 学习资源

写在前面

本系列是综合了自己在学习spark过程中的理解记录 + 对参考文章中的一些理解 + 个人实践spark过程中的一些心得而来。写这样一个系列仅仅是为了梳理个人学习spark的笔记记录,所以一切以能够理解为主,没有必要的细节就不会记录了,而且文中有时候会出现英文原版文档,只要不影响理解,都不翻译了。若想深入了解,最好阅读参考文章和官方文档。

其次,本系列是基于目前最新的 spark 1.6.0 系列开始的,spark 目前的更新速度很快,记录一下版本好还是必要的。
最后,如果各位觉得内容有误,欢迎留言备注,所有留言 24 小时内必定回复,非常感谢。
Tips: 如果插图看起来不明显,可以:1. 放大网页;2. 新标签中打开图片,查看原图哦。

1. 书籍

  • Learning Spark

  • Mastering Apache Spark

2. 网站

  • official site

  • user mailing list

  • spark channel on youtube

  • spark summit

  • meetup

  • spark third party packages

  • databricks blog

  • databricks docs.html)

  • databricks training/Introduction%20(README).html)

  • cloudera blog about spark

  • https://0x0fff.com

  • http://techsuppdiva.github.io/

  • csdn spark 知识库

  • 过往记忆

3. 文章,博客

  • RDD论文英文版

  • RDD论文中文版

  • An Architecture for Fast and General Data Processing on Large Clusters

  • How-to: Tune Your Apache Spark Jobs (Part 1)

  • How-to: Tune Your Apache Spark Jobs (Part 2)

  • 借助 Redis ,让 Spark 提速 45 倍!

  • 量化派基于Hadoop、Spark、Storm的大数据风控架构

  • 基于Spark的异构分布式深度学习平台

  • 你对Hadoop和Spark生态圈了解有几许?

  • Hadoop vs Spark

  • 雅虎开源CaffeOnSpark:基于Hadoop/Spark的分布式深度学习

  • 2016 上海第二次 spark meetup: 1. spark_meetup.pdf

  • 2016 上海第二次 spark meetup: 2. Flink_ An unified stream engine.pdf

  • 2016 上海第二次 spark meetup: 3. Spark在计算广告领域的应用实践.pdf

  • 2016 上海第二次 spark meetup: 4. splunk_spark.pdf

  • 基于Spark的医疗和金融大数据

4. 视频

  • YouTube: what is apache spark

  • Introduction to Spark Architecture

  • Top 5 Mistakes When Writing Spark Applications

  • slide Top 5 mistakes when writing Spark applications

  • Tuning and Debugging Apache Spark

  • slide Tuning and Debugging Apache Spark

  • A Deeper Understanding of Spark Internals – Aaron Davidson (Databricks)

  • slide A Deeper Understanding of Spark Internals – Aaron Davidson (Databricks)

  • Building, Debugging, and Tuning Spark Machine Learning Pipelines – Joseph Bradley (Databricks)

  • slide Building, Debugging, and Tuning Spark Machine Learning Pipelines

  • Spark DataFrames Simple and Fast Analysis of Structured Data – Michael Armbrust (Databricks)

  • slide Spark DataFrames Simple and Fast Analysis of Structured Data – Michael Armbrust (Databricks)

  • Spark Tuning for Enterprise System Administrators

  • slide Spark Tuning for Enterprise System Administrators

  • Structuring Spark: DataFrames, Datasets, and Streaming

  • slide Structuring Spark: DataFrames, Datasets, and Streaming

  • Spark in Production: Lessons from 100+ Production Users

  • slide Spark in Production: Lessons from 100+ Production Users

  • Production Spark and Tachyon use Cases

  • slide Production Spark and Tachyon use Cases

  • SparkUI Visualization

  • slide SparkUI Visualization

  • Everyday I\’m Shuffling – Tips for Writing Better Spark Programs, Strata San Jose 2015

  • slide Everyday I\’m Shuffling – Tips for Writing Better Spark Programs, Strata San Jose 2015

  • Large Scale Distributed Machine Learning on Apache Spark

  • Securing your Spark Applications

  • slide Securing your Spark Applications

  • Building a REST Job Server for Interactive Spark as a Service

  • slide Building a REST Job Server for Interactive Spark as a Service

  • Exploiting GPUs for Columnar DataFrame Operations

  • slide Exploiting GPUs for Columnar DataFrame Operations

  • Easy JSON Data Manipulation in Spark – Yin Huai (Databricks)

  • slide Easy JSON Data Manipulation in Spark – Yin Huai (Databricks)

  • Sparkling: Speculative Partition of Data for Spark Applications – Peilong Li

  • slide Sparkling: Speculative Partition of Data for Spark Applications – Peilong Li

  • Advanced Spark Internals and Tuning – Reynold Xin

  • slide Advanced Spark Internals and Tuning – Reynold Xin

  • The Future of Real Time in Spark

  • The Future of Real Time in Spark

5. next

上面的资源我都会不断更新的,里面 80% 以上的都是我亲自看过并且觉得有价值的,可不是胡乱收集一通的,推荐欣赏哦。

6. 打开微信,扫一扫,点一点,棒棒的,^_^

本系列文章链接

  • 『 Spark 』1. spark 简介

  • 『 Spark 』2. spark 基本概念解析

  • 『 Spark 』3. spark 编程模式

  • 『 Spark 』4. spark 之 RDD

  • 『 Spark 』5. 这些年,你不能错过的 spark 学习资源

  • 『 Spark 』6. 深入研究 spark 运行原理之 job, stage, task

  • 『 Spark 』7. 使用 Spark DataFrame 进行大数据分析

  • 『 Spark 』8. 实战案例 | Spark 在金融领域的应用 | 日内走势预测

  • 『 Spark 』9. 搭建 IPython + Notebook + Spark 开发环境

相关内容

热门资讯

Mobi、epub格式电子书如... 在wps里全局设置里有一个文件关联,打开,勾选电子书文件选项就可以了。
定时清理删除C:\Progra... C:\Program Files (x86)下面很多scoped_dir开头的文件夹 写个批处理 定...
scoped_dir32_70... 一台虚拟机C盘总是莫名奇妙的空间用完,导致很多软件没法再运行。经过仔细检查发现是C:\Program...
500 行 Python 代码... 语法分析器描述了一个句子的语法结构,用来帮助其他的应用进行推理。自然语言引入了很多意外的歧义,以我们...
小程序支付时提示:appid和... [Q]小程序支付时提示:appid和mch_id不匹配 [A]小程序和微信支付没有进行关联,访问“小...
pycparser 是一个用... `pycparser` 是一个用 Python 编写的 C 语言解析器。它可以用来解析 C 代码并构...
微信小程序使用slider实现... 众所周知哈,微信小程序里面的音频播放是没有进度条的,但最近有个项目呢,客户要求音频要有进度条控制,所...
65536是2的几次方 计算2... 65536是2的16次方:65536=2⁶ 65536是256的2次方:65536=256 6553...
Apache Doris 2.... 亲爱的社区小伙伴们,我们很高兴地向大家宣布,Apache Doris 2.0.0 版本已于...
项目管理和工程管理的区别 项目管理 项目管理,顾名思义就是专注于开发和完成项目的管理,以实现目标并满足成功标准和项目要求。 工...