查看原文
其他

大数据技术与架构,19年文章精选

群主王知无 大数据技术与架构 2021-10-21

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!

暴走大数据点击右侧关注,暴走大数据!


今天是2019年最后一天。

2019年全年“大数据技术与架构”累计发送文章300篇+。原创120篇,原创率40%。

在此做一个总结,选取了阅读率最高,转发率最高,点赞率最高的文章100篇奉献给大家。

点击标题,直接阅读


半年精选:

《大数据技术与架构,2019半年文章精选》

Flink相关:

《菜鸟供应链实时技术架构演进》
趣头条实战 | 基于Flink+ClickHouse构建实时数据平台》
《Apache Flink新场景 | OLAP引擎》
《说说Flink DataStream的八种物理分区逻辑》
《State Processor API:如何读取,写入和修改 Flink 应用程序的状态》
《Flink滑动窗口原理与细粒度滑动窗口的性能问题》
《基于Flink快速开发实时TopN》
《使用 Apache Flink 开发实时 ETL》
Flink Source/Sink探究与实践:RocketMQ数据写入HBase》
Spark/Flink广播实现作业配置动态更新》
Flink全链路延迟的测量方式》
Flink原理 | Flink中的数据抽象及数据交换过程》
Flink SQL Window源码全解析》
《Flink DataStream维度表Join的简单方案》
《Apache Flink的内存管理》
《Flink1.9整合Kafka实战》
《Apache Flink在小米的发展和应用》
基于Kafka+Flink+Redis的电商大屏实时计算案例
《Flink实战 | 贝壳找房基于Flink的实时平台建设》
用Flink取代Spark Streaming!知乎实时数仓架构演进
Flink实时数仓 | 美团点评实战》
《来将可留姓名?Flink最强学习资源合集!

《数据不撒谎,Flink-Kafka性能压测全记录》

《菜鸟在物流场景中基于Flink的流计算实践》
《基于Flink构建实时数据仓库》
Flink/Spark 如何实现动态更新作业配置》
Spark相关:

《Spark 动态资源分配(Dynamic Resource Allocation) 解析》

《Apache Spark在海致大数据平台中的优化实践》

《Spark SQL读数据库时不支持某些数据类型的问题》

《Spark难点 | Join的实现原理》

Spark Checkpoint的运行原理和源码实现》

《阿里云Spark Shuffle的优化》

《使用Kafka+Spark+Cassandra构建实时处理引擎》

《基于HBase和Spark构建企业级数据处理平台》

《SparkSQL在字节跳动的应用实践和优化实战》

《Kafka+Spark Streaming管理offset的几种方法》

《独孤九剑-Spark面试80连击(上)》

《独孤九剑-Spark面试80连击(下)》

Spark调优 | Spark SQL参数调优》

《Spark中几种ShuffleWriter的区别你都知道吗?

Kafka相关:

Kafka的分区数与多线程消费探讨

Kafka源码阅读最最最简单的入门方法

《Apache Kafka 2.4.0 发布 | 求求你别更了~》

Kafka几个常见的错误

关于Pulsar与Kafka的一些比较和思考

Kafka 已落伍,转角遇见 Pulsar!》

数据平台/中台相关:

企业级数据中台建设指南

高屋建瓴 | 阿里巴巴大数据之路》

你需要的不是实时数仓 | 你需要的是一款强大的OLAP数据库(上)》

《你需要的不是实时数仓 | 你需要的是一款强大的OLAP数据库(下)》

数据湖(Data Lake)-剑指下一代数据仓库

《你需要懂一点ClickHouse的基础知识》

战斗民族开源 | ClickHouse万亿数据双中心的设计与实践

《持续进化 | 阿里巴巴服务化架构演进》

OneData建设探索之路:SaaS收银运营数仓建设

后端 | 微服务架构,静态数据通用缓存机制

阿里云E-MapReduce探秘,快速构建可扩展的高性能大数据平台(技术部分)》

今日头条在消息服务平台和容灾体系建设方面的实践与思考

《日均5亿查询量的京东订单中心,为什么舍MySQL用ES?

《数据资产管理在腾讯游戏的实践》

阿里云Redis技术架构演进》

滴滴敏捷数据中台实践

Elasticsearch在日志分析领域应用和运维实践

快手HBase在千亿级用户特征数据分析中的应用与实践

美团起源数据治理平台的建设与实践

大数据平台演进之路 | 淘宝 & 滴滴 & 美团

腾讯基于 Flink 的实时流计算平台演进之路

其他:
青出于蓝 | 比Redis快5倍的KeyDB
Druid SQL和Security在美团点评的实践
Redis单线程?别逗了,Redis6.0多线程重磅来袭!
Hive/HiveSQL常用优化方法全面总结》
面试相关:
Flink面试通关手册
全网第一份 | Flink学习面试灵魂40问,看看你能答上来几个》
全网第一 | Flink学习面试灵魂40问答案,文末有福利》
助力秋招-独孤九剑破剑式 | 10家企业面试真题》
《15个多线程相关的面试题》
只有2G内存,在10G数据量怎样找到中位数
Spark面对OOM问题的解决方法及优化总结
一个简单的问题 | 分布式副本一致性
分布式开放消息系统(RocketMQ)的原理与实践》
下次我问你MySQL优化你要这么回答》
做数据开发就不需要了解G1了么?》
Google布隆过滤器与Redis布隆过滤器详解
消息可靠性、重复消息、消息积压、利用消息实现分布式事务
这个面试问题很难么 | 如何处理大数据中的数据倾斜
面试注意点 | Spark&Flink的区别拾遗
Redis选13亿个Key,4个field还是1亿个Key,13亿*4个field
千万级别高并发"秒杀"架构设计
解密 Redis 助力双 11 背后电商秒杀系统
100w条数据 | 插入Mysql你要用多长时间
《助力秋招-独孤九剑荡剑式 | Java语言&基础面试题》
LEFT JOIN的时候应该用ON还是WHERE
面试别人说他熟悉Flink,结果我问了他Flink是如何实现exactly-once的
《一道真实的阿里面试题 | 如何保证消息队列的高可用》
面试系列:十个海量数据处理方法大总结》
个人感悟:
不要给自己设限》
《国庆碎碎念 | 回答几个经常被私信的问题》
一份优秀的简历该长成什么样
周末分享 | 2019年最好的演讲:别让任何人打乱你的人生节奏》
周末分享-我见过最高级的聪明是靠谱》


总结:

2019年,感谢大家一路陪伴。300个日日夜夜,如果你写过原创文章,你一定会懂。

坚持比努力更可怕。

读者学到东西,认可"大数据技术与架构"的价值,职业生涯因此受益。

这才是我坚持写文章的初衷。

2020年再见。


文章不错?点个【在看】吧! 👇

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存