-
分布式文件系统调研
文件、块和对象是三种以不同的方式来保存、整理和呈现数据的存储格式。这些格式各有各的功能和限制。文件存储会以文件和文件夹的层次结构来整理和呈现数据;块存储会将数据拆分到任意划分且大小...
发布时间:2022-02-19分类: 浏览:250评论:0
-
Flink检查点机制与状态管理
为了使 Flink 的状态具有良好的容错性,Flink 提供了检查点机制 (CheckPoints) 。通过检查点机制,Flink 定期在数据流上生成 checkpoint bar...
发布时间:2022-02-19分类: 浏览:239评论:0
-
Kafka服务端之KafkaController
[TOC] 在上一节对副本机制的实现进行了分析,其中提到Broker能够处理来自KafkaController的LeaderAndIsrRequest、StopReplicaReq...
发布时间:2022-02-19分类: 浏览:281评论:0
-
SQL练习题二十-建模&报表
这篇博客用来回顾和梳理一下数据仓库中的常用主题建模架构,面向分析的架构以及集成主题报表,我已经把这些报表上传至GitHub上了,有兴趣的可以看一下 地址:https://githu...
发布时间:2022-02-19分类: 浏览:220评论:0
-
《模型思维》之做多模型思考者
查理.芒格的多元思维模型思维方式应该说这几年在国内获得了很大的认同,就像谚语说的那样,拿着锤子的人眼中看到的都是钉子。在这个复杂的世界里,如何摆脱局限,提高我们解决问题的能力,而不...
发布时间:2022-02-19分类: 浏览:261评论:0
-
如何利用Bert处理长文本
预训练模型Bert能处理最大序列长度为512,当面对长文本(文档级别)时候,通常是采用text truncation或者sliding window方式,让输入模型的序列长度符合预...
发布时间:2022-02-19分类: 浏览:234评论:0
-
4. Disruptor高级应用
发布时间:2022-02-19分类: 浏览:238评论:0
-
工具:数据分析(思维、技巧)
三种核心思维:结构化(金字塔模型、核心论点、结构拆解、MECE、验证)、公式化(加减乘除)、业务化(区别现象/结果、往往有考虑不到的地方)
发布时间:2022-02-19分类: 浏览:204评论:0
-
基于R的线性混合效应模型分析
发布时间:2022-02-19分类: 浏览:267评论:0
-
Flink Kafka Doris实战demo
发布时间:2022-02-19分类: 浏览:221评论:0