前言
本系列文章将对《Spark - The Definitive Guide - Big data processing made simple》进行翻译,参照其他译本,取名为:《Spark权威指南》,翻译工作全程由我个人独自翻译,属于对照式翻译,有助于读者理解,如有不当或错误之处,欢迎不吝指出,方便你我他,我将标注出在原文标注出@纠正者和纠正内容。所有文件都是免费开源的,无权售卖出版,请勿二次转载售卖。查看本网站请使用全局科学上网!
本书英文版出版信息
2018年2月第一版
翻译进度
Part I. Gentle Overview of Big Data and Spark
Part II. Structured APIs—DataFrames, SQL, and Datasets
- 翻译:《Spark权威指南》第4章:结构化API概览
- 翻译:《Spark权威指南》第5章:基本结构化的操作
- 翻译:《Spark权威指南》第6章:处理不同的数据类型
- 翻译:《Spark权威指南》第7章:聚合
- 翻译:《Spark权威指南》第8章:连接
- 翻译:《Spark权威指南》第9章:数据源
- 翻译:《Spark权威指南》第10章:Spark SQL
- 翻译:《Spark权威指南》第11章:Dataset
Part III. Low-Level APIs
Part IV. Production Application
- 翻译:《Spark权威指南》第15章:Spark如何在集群上的运行
- 翻译:《Spark权威指南》第16章:开发Spark应用程序
- 翻译:《Spark权威指南》第17章:部署Spark应用程序
- 翻译:《Spark权威指南》第18章:监控和调试
- 翻译:《Spark权威指南》第19章:性能调优
Part V. Streaming
- 翻译:《Spark权威指南》第20章:流处理基础
- 翻译:《Spark权威指南》 第21章 结构化流基础
- 翻译:《Spark权威指南》第22章:事件时间和状态处理
- 翻译:《Spark权威指南》第23章:生产环境中的结构化流
Part VI. Advanced Analytics and Machine Learning
- 翻译:《Spark权威指南》第24章:高级分析和机器学习概述
- 翻译:《Spark权威指南》第25章:预处理与特征工程
- 翻译:《Spark权威指南》第26章:分类
- 翻译:《Spark权威指南》第27章:回归
- 翻译:《Spark权威指南》第28章:推荐
- 翻译:《Spark权威指南》第29章:无监督学习
还有第1,2,30章未翻译,近期太忙,择日翻译。
本书的勘误
Errata | O’Reilly Mediawww.oreilly.com
捐助者
衷心感谢以下给我打赏的人士,孤独一个人的努力,能收到打赏倍感认可!如果你愿意打赏我,在打赏的时候麻烦注明“Spark权威指南的翻译”。感谢以下人士的支持(排名不分先后,按照时间顺序):
编号 | 资助者 (为了保护隐私做了一定程度的匿名处理) |
资助日期 |
---|---|---|
1 | 梦*梦 | 2019.09.08 |
2 | j*g | 2020.05.13 |
3 | *然 | 2020.05.26 |
4 | *水 | 2020.06.09 |
5 | #*u | 2020.10.22 |
6 | _*j | 2022.04.04 |