Data Structure & Algorithm
- 海量数据处理算法—BitMap
- Bloom Filter
- 跳表SkipList
- 日志结构的合并树(The Log-Structured Merge-Tree)
- Succinct on Apache Spark: Queries on Compressed RDDs
- Succinct RDDs in Apache Spark
- 缓存算法
- 一致性哈希算法(Consistent Hashing)
Programming Language
Java
- 深入理解JVM(1): Java内存区域划分
- 深入理解JVM(2): Java堆中对象创建、布局、访问全过程
- 深入理解JVM(3): 虚拟机类加载机制
- 深入理解JVM(4): Java垃圾收集(GC)
- 深入理解JVM(5): Java垃圾收集器
- 深入理解JVM(6): Java对象内存分配策略
Scala
Python
Shell
SQL
Technology Architecture
Data Government
Service Government
Resource Management
Workflow & Scheduling
Data Exchange
Data Integration
Data Cleaning
Data Fusion
Statistics & Analysis
File Storage
Data Storage
- 消息队列设计精要
- HBase Shell Commands
- 基于HBase的海量GIS数据分布式处理实践
- Tuning G1GC For Your HBase Cluster
- 日志:每个软件工程师都应该知道的有关实时数据的统一抽象
- TAO: Facebook’s Distributed Data Store for the Social Graph
Batch Computing
Stream Computing
Graph Computing
Interaction Analysis
NLP(Natural Language Processing)
Machine Learning
Deep Learning
Communication
Cluster
Distributed
- 从ACID到CAP到BASE
- 2PC到3PC到Paxos到Raft到ISR
- 复制、分片和路由
- 副本更新策略
- 负载均衡算法及手段
- RWN及Quorum与强一致性
- 分布式系统互斥性与幂等性问题的分析与解决
- 分布式队列编程优化篇
- 分布式队列编程:模型、实战
- Apache Twill 入门
- MTDDL——美团点评分布式数据访问层中间件