当前位置: 首页>行业 >

焦点滚动:大数据Flink进阶(三):Flink核心特性

来源: 腾讯云 | 时间: 2023-03-19 20:21:54 |

Flink核心特性

Flink具有先进的架构理念,拥有诸多的优秀特性以及完善的编程接口,Flink的优势有以下几点:

一、批流一体化

Flink可以在底层用同样的数据抽象和计算模型来进行批处理和流处理。事实上,Flink在设计理念上没有刻意强调批处理和流处理,而更多的强调数据的有界和无界,这就意味着Flink能够满足企业业务需求,无需用两种甚至多种框架分别实现批处理和流处理,这大大降低了架构设计、开发、运维的复杂度,可以节省大量的人力成本。

二、同时支持高吞吐、低延迟、高性能

Flink是目前开源社区中唯一一套集高吞吐、低延迟、高性能三者于一身的分布式流式数据处理框架。像Apache Spark也只能兼顾高吞吐和高性能特性,主要因为在SparkStreaming流式计算中无


(资料图片仅供参考)

法做到低延迟保障;而流式计算框架Apache Storm只能支持低延迟和高性能特性,但是无法满足高吞吐的要求。而满足高吞吐、低延迟、高性能这三个目标对分布式流式计算框架来说是非常重要的。

三、支持事件时间(Event Time)概念

在流式计算领域中,窗口计算的地位举足轻重,但目前大多数框架窗口计算采用的都是系统时间(Process Time),也是事件传输到计算框架处理时,系统主机的当前时间。Flink能够支持基于事件时间(Event Time)语义进行窗口计算,也就是使用事件产生的时间,这种基于事件驱动的机制使得事件即使乱序到达,流系统也能够计算出精确的结果,保持了事件原本产生时的时序性,尽可能避免网络传输或硬件系统的影响。

四、支持有状态计算

Flink在1.4版本中实现了状态管理,所谓状态就是在流式计算过程中将算子的中间结果数据保存在内存或者文件系统中,等下一个事件进入算子后可以从之前的状态中获取中间结果中计算当前的结果, 从而无须每次都基于全部的原始数据来统计结果,这种方式极大地提升了系统的性能,并降低了数据计算过程的资源消耗。对于数据量大且运算逻辑非常复杂的流式计算场景,有状态计算发挥了非常重要的作用。

五、支持高度灵活的窗口(Window)操作

在流处理应用中,数据是连续不断的,需要通过窗口的方式对流数据进行一定范围的聚合计算,例如统计在过去的1分钟内有多少用户点击某一网页,在这种情况下,我们必须定义一个窗口,用来收集最近一分钟内的数据,并对这个窗口内的数据进行再计算。Flink将窗口划分为基于Time、Count、Session,以及Data-driven等类型的窗口操作,窗口可以用灵活的触发条件定制化来达到对复杂的流传输模式的支持,用户可以定义不同的窗口触发机制来满足不同的需求。

六、基于轻量级分布式快照(Snapshot)实现的容错

Flink能够分布式运行在上千个节点上,将一个大型计算任务的流程拆解成小的计算过程,然后将task分布到并行节点上进行处理。在任务执行过程中,能够自动发现事件处理过程中的错误而导致数据不一致的问题,比如:节点宕机、网路传输问题,或是由于用户因为升级或修复问题而导致计算服务重启等。在这些情况下,通过基于分布式快照技术的Checkpoints,将执行过程中的状态信息进行持久化存储,一旦任务出现异常停止,Flink就能够从Checkpoints中进行任务的自动恢复,以确保数据在处理过程中的一致性(Exactly-Once)。

七、基于JVM实现独立的内存管理

内存管理是所有计算框架需要重点考虑的部分,尤其对于计算量比较大的计算场景,数据在内存中该如何进行管理显得至关重要。针对内存管理,Flink实现了自身管理内存的机制,尽可能减少JVM GC 对系统的影响。另外,Flink通过序列化/反序列化方法将所有的数据对象转换成二进制在内存中存储,降低数据存储的大小的同时,能够更加有效地对内存空间进行利用,降低GC带来的性能下降或任务异常的风险,因此Flink较其他分布式处理的框架会显得更加稳定,不会因为JVM GC等问题而影响整个应用的运行。

八、Save Points (保存点)

对于7*24小时运行的流式应用,数据源源不断地接入,在一段时间内应用的终止有可能导致数据的丢失或者计算结果的不准确,例如进行集群版本的升级、停机运维操作等操作。值得一提的是, Flink通过Save Points技术将任务执行的快照保存在存储介质上,当任务重启的时候可以直接从事先保存的Save Points恢复原有的计算状态,使得任务继续按照停机之前的状态运行,Save Points技术可以让用户更好地管理和运维实时流式应用。

九、多层级API

Flink为用户提供了多个层级API,用户可以根据自身对于表达力和易用性的需求来选择,不同的API 层级可以混用以实现复杂的业务逻辑。

关键词:

 

热文推荐

焦点滚动:大数据Flink进阶(三):Flink核心特性

Flink具有先进的架构理念,拥有诸多的优秀特性以及完善的编程接口,Flink的优势有以下几点:

2023-03-19

北方国际: 股票交易异常波动公告

北方国际:股票交易异常波动公告

2023-03-19

www.alipay.com官网登录_www xuelecn com登录|世界独家

1、dddddddddddddddddddddddddddddddddddddddd。本文就为大家分享到这里,希望小伙伴

2023-03-19

43岁殷桃出席活动,白色西装搭配阔腿裤,精致优雅气质出众!_今日播报

殷桃是气质女神,不仅演技精湛,穿搭也很出彩,尤其是出席活动的时候,更是会好好打扮一番,漂亮的礼服或者精致的西装,都是她常常挑选的单品

2023-03-19

当前焦点!野营帐篷什么材质的好_野营帐篷什么牌子好

1、国产品牌就两个值得入手:牧高笛,牧高笛的冷山2是很经典的一款,是全国驴友中最普及的。2、价格300多,质量过硬,防水

2023-03-19

马拉松跑全程是多少_说一说马拉松跑全程是多少的简介-世界微头条

夏弥来为大家解答以下的问题,马拉松跑全程是多少,说一说马拉松跑全程是多少的简介,现在让我们一起来看看吧!1、马拉松(Ma

2023-03-19

跨界狂飙典范,看冠珠瓷砖如何借势315打造产品品质IP 看点

今年315的品牌真是太会玩了,好利来二公子开劳斯莱斯摆摊卖蛋糕,为品牌一夜收割2000万视频观看量;周大福牵手奥特曼、蜡笔小新、柯南等动漫IP

2023-03-18

实时:闫怀礼怎样死的_闫怀礼

1、是的。2、  2009年4月12日上午,央视版《西游记》中沙僧扮演者闫怀礼因肺部感染在北京去世。3、享年73岁。4、

2023-03-18

全球热点!总台大湾区音乐会幕后:为什么从南沙这些地方看湾区融合发展?

“在这春意盎然的日子里,我们相聚在广州港南沙港区四期全自动化码头,感受这日夜奔忙的迎来送往,高歌这闪亮如炬的时代梦想。”“隔海相望,

2023-03-18

地价差至少10余倍 中山为何力推“商住改工”?-环球速递

地价差至少10余倍中山为何力推“商住改工”?,地价,工业园,中山市,工业用地,商住改工,住宅用地

2023-03-18

小学二年级周记100字_周记100字暑假日常

1、这周是暑假的第一周,一开始,我还没有从紧张的期末考试中回过神来,不用早起去学校了反而觉得浑身不舒服,整天无精打采的。

2023-03-18

重点聚焦!在梦中哼着她曾经最爱的歌谣我们的悲伤无处可逃_在梦中哼着她曾经最爱的歌谣

1、在梦中哼着她曾经最爱的歌谣2、是由诗人凉演唱的江海不渡你3、江海不渡你-诗人凉4、词:诗人凉5、曲:南雨笙6

2023-03-18

世界头条:俄媒:俄防长呈请向拦截美军无人机的苏-27飞行员颁发“国家奖”

参考消息网3月17日报道据塔斯社莫斯科3月17日报道,俄罗斯国防部17日告诉记者,俄防长绍伊古呈请向阻止美军MQ-9“死

2023-03-17

【全球时快讯】宝地矿业: 公司股票交易异常波动公告

宝地矿业:公司股票交易异常波动公告

2023-03-17

首次约会女生穿搭攻略

一、根据约会地点选择着装在约会之前,可以先询问男生有没有计划好的地点,根据约会的地点,选择合适的衣服。➤如果是去进行户外,或是密室逃

2023-03-17

3亿人被TA折磨?这种病越来越年轻化,真相是什么?

最近,有关失眠的话题又冲上了热搜央视曾报道我国有超过3亿人存在睡眠障碍而随着科学研究的不断深入睡眠越来越被证实与身体健康

2023-03-17

软路由是什么_软路由的解释 新要闻

1、软路由是指使用桌面或服务器供应商配合某种软件形成的路由解决方案。主要依靠软件的设置来实现路由器的功能,其软硬件是独立

2023-03-17

【世界新视野】刚作案归来撞上警察,一男子迎来“七进宫”

该男子选择凌晨作案,全身上下只露出一双眼睛,身份信息极难确认,民警没有因此放弃,通过进一步调查,发现犯罪嫌疑人作案时手法娴熟、肆无忌

2023-03-17

安然若素的素是什么意思_安然若素

1、此时,彼时,阳光微淡,岁月静好,安然若素的意思是:这时、那时,不管是过去还是现在,阳光微弱,生活平安宁静为好,现在

2023-03-17

环球短讯!福尔摩斯和华生什么关系_华生你发现了盲点什么梗

1、华生发现盲点原句是“华生,你发现了盲点。2、”出自《夏洛克·福尔摩斯》中侦探夏洛克经常对他的伙伴华生说的话。3、所有

2023-03-17

资讯

北京推出14条秋游文化线路

金秋时节,北京市文化和旅游局以赏银杏品文化为主题,推出14条“叶落的季节——漫步北京赏银杏品文化主题线路”,邀市民和游客以步行、骑行

2021-10-27     
基因编辑发力 培育高质量人源化供体猪

此次人体试验,仅仅验证了基因编辑猪克服异种器官移植的超急性排斥反应,还需解决延迟性排斥反应、消耗性血栓等问题。但通过这次试验,能更

2021-10-27     
中国经济高质量发展步伐稳健 长期向好基本面未变

在全球疫情走势和经济走势趋于复杂的背景下,中国经济巨轮将驶向何方,举世关注。2020年10月26日至29日,党的十九届五中全会在京举行,明确

2021-10-27     
南美解放者杯决赛允许近4.5万观众入场

南美洲足联主席多明格斯25日与今年解放者杯决赛对阵的两支俱乐部负责人会晤,宣布决赛现场观众人数增加到球场容量的75%,即近4 5万人。今年

2021-10-27     
22年从警生涯 面对荣誉他说不要给我报功

9月24日,时任安徽省安庆市公安局迎江分局刑警大队大要案中队中队长周磊因在工作中激烈搏斗引发心源性猝死,倒在了工作岗位上,经医院抢救

2021-10-27     
走近冬奥|五棵松体育中心场馆“黑科技”全面上岗 助力冬

“相约北京”冰球国内测试活动将于2021年11月7日至10日在五棵松体育中心场馆举行,在疫情防控方面,场馆引入了诸多“黑科技”,为防疫安全

2021-10-27