查看原文
其他

全网第一份 | Flink学习面试灵魂40问,看看你能答上来几个?

The following article is from 暴走大数据 Author 群主王知无

大数据技术与架构点击右侧关注,大数据开发领域最强公众号!

暴走大数据点击右侧关注,暴走大数据!
来源:王知无
作者:王知无


By 暴走大数据


场景描述:这是一份Flink学习面试指北。看看你能通过这?


关键词:Flink 学习 面试
《大数据技术与架构》和《暴走大数据》读者拥有本文的优先阅读权。

转载请联系作者本人。

答案将在下期给出。 

概念和基础篇

  • 简单介绍一下Flink

  • Flink相比传统的Spark Streaming有什么区别?和Spark中的structured streaming 相比呢?Flink相比ss和storm有什么优势?

  • Flink的组件栈是怎么样的?

  • Flink的基础编程模型了解吗?

  • 说说Flink架构中的角色和作用?

  • 说说Flink中常用的算子?用过哪些?

  • Flink中的分区策略有哪几种?

  • Flink的并行度有了解吗?Flink中设置并行度需要注意什么?

  • Flink支持哪几种重启策略?分别如何配置?

  • Flink的分布式缓存有什么作用?如何使用?

  • Flink中的广播变量,使用广播变量需要注意什么事项?

  • Flink中对窗口的支持包括哪几种?说说他们的使用场景

  • Flink 中的 State Backends是什么?有什么作用?分成哪几类?说说他们各自的优缺点?

  • Flink中的时间种类有哪些?各自介绍一下?

  • WaterMark是什么?是用来解决什么问题?如何生成水印?水印的原理是什么?

  • Flink的table和SQL熟悉吗?Table API和SQL中TableEnvironment这个类有什么作用?

  • Flink如何实现SQL解析的呢?


 

进阶篇

  • Flink是如何做到批处理与流处理统一的?

  • Flink中的数据传输模式是怎么样的?

  • Flink的容错机制知道吗?

  • Flink中的分布式快照机制是怎么样的?

  • Flink是如何实现Exactly-once的?

  • Flink的Kafka-connector是如何做到向下兼容的呢?

  • Flink中的内存管理是如何做的?

  • Flink中的序列化是如何做的?

  • Flink中的RPC框架选型是怎么样的?

  • Flink在使用Window时出现数据倾斜,你有什么解决办法?

  • Flink SQL在使用Groupby时出现热点数据,如何处理?

  • 现在我有Flink任务,delay极高,请问你有什么调优策略?

  • Flink是如何处理反压的?和Spark有什么区别?Storm呢?

  • Operator Chains(算子链)这个概念你了解吗?Flink是如何优化的?什么情况下Operator才会chain在一起?


 

源码篇



  • 讲讲一个Flink job提交的整个流程吗?

  • 讲讲一个Flink job调度和执行的流程吗?

  • Flink所谓"三层图"结构是哪几个"图"?它们之间是什么关系?他们之间是如何转化的?

  • JobManger和TaskManager分别在集群中扮演了什么角色,说说它们都做了些什么?

  • 简单说说Flink数据的抽象和数据的交换过程

  • Flink的分布式快照机制是如何实现的? 

  • Flink的反压是如何实现的?

  • 说说FlinkSQL是如何转化的?了解逻辑计划和和物理计划吗?FlinkSQL的维表JOIN是如何做的?了解Async IO吗?解决了什么问题?


答案将在下期逐步揭晓。
欢迎点赞+收藏
欢迎转发至朋友圈
: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存