BoostKit干货店｜同样硬件，Ceph存储性能提升10倍

在华为全联接2021上，鲲鹏应用使能套件BoostKit(以下简称“鲲鹏BoostKit”)正式升级为2.0，提供 “数据亲和”加速组件，对数据全处理流程进行负载优化，从而大幅提升应用性能。本期由华为计算产品线算法专家陈泽晖和何智文向大家展示鲲鹏BoostKit 2.0分布式存储全局缓存(Global Cache)特性如何做到数据存储和处理的倍数级加速能力。在摩尔定律的驱使下，计算能力倍数级增长，

鲲鹏小助手

30人浏览 · 2021-12-21 06:48:09

鲲鹏小助手 · 2021-12-21 06:48:09 发布

在摩尔定律的驱使下，计算能力倍数级增长，但数据传输速度过慢导致大量计算资源浪费，也限制了系统性能发挥。例如，在金融行业，银行逐步采用AI技术对客户信息、远程开户录像、客服中心语音、企业资料等数据进行挖掘与利用，对海量文件的读写会占用大量计算资源，导致业务处理效率降低。

(原生Ceph IO请求的处理路径长，导致IO时延高，用户数据读写时间长)

鲲鹏BoostKit分布式存储全局缓存应运而生，通过缓存前后台分离、IO聚合、智能预取三大创新技术实现典型读写场景IOPS提升10倍，IO时延降低90%，意味着同样时间内银行处理的交易笔数提升10倍，而且每笔交易处理时长降低90%！

(测试模型：4K IO，7:3混合随机读写；硬件配置：256GB内存，25GE网络，每节点12 * 8TB SATA HDD，2 * 3.2TB NVMe SSD)

下面带你1分钟get三大创新技术：

1. 缓存前后台分离——缩短数据处理路径：降低IO请求的线程数量，上层应用只需要将数据写入到缓存池或从缓存池中读取即可响应用户请求。

(在数据写入场景，数据到写缓存后就可以给上层应用返回数据写入成功，无需与后台Ceph存储集群等分布式存储软件交互，用户业务应用无感知)

2. 智能预取——读加速：将数据提前加载至读缓存，实现80%以上缓存命中率和2倍以上读性能加速。

(基于IO数据统计，智能分析IO模型特征，实现缓存命中率大幅提升)

3. IO聚合——写加速：技术通过批量数据聚合，实现全周期随机写入转顺序写入，实现满带宽性能。

(在缓存中把各种大小的数据块聚合成以8M为单位的大数据块，从随机小IO转变成顺序大IO写入后端Ceph等分布式存储集群)

此外，BoostKit全局缓存面向鲲鹏生态，结合硬件特点开展软硬协同优化，如CPU亲和、NUMA亲和等，进一步达到“数据亲和”，在不增加硬件成本的前提下，全局缓存面向全命中和真实业务负载提供2~10倍端到端读写性能加速能力。

鲲鹏社区

鲲鹏展翅立根铸魂深耕行业数字化

更多推荐

KubeOS : 面向云原生场景的容器操作系统

在云原生场景下，容器和 Kubernetes 在开发、测试、生产中的应用越来越广泛，传统的操作系统往往会带来安全性、运维开销、OS 版本等方面的问题，容器操作系统即容器 OS 是针对云原生场景设计的一种轻量化操作系统。本次分享首先介绍容器 OS 的理念，然后分享在 openEuler 社区孵化的容器操作系统 KubeOS 的设计思路和解决的问题，最后深入介绍 KubeOS 的架构、功能和使用。本文

鲲鹏社区

openGauss2.0.0极简版安装指南

openGauss 2.0.0 版本中(2021.03.31发布)新增了极简版软件包，相对企业版安装流程更简单快捷，更加适合高校学生或者个人功能测试的场景，该软件包中不含OM工具，采用脚本就可以实现一键式安装部署。本文通过使用极简版进行安装部署，为大家做一个示范。软件包：登录openGauss官网，选择2.0.0版本对应平台极简版安装包。包含上一版本(1.1.0版本)要求的软件依赖包，新增open

鲲鹏社区

openGauss内核分析（三)：SQL解析

在传统数据库中SQL引擎一般指对用户输入的SQL语句进行解析、优化的软件模块。SQL的解析过程主要分为：词法分析Lexical Analysis：将用户输入的SQL语句拆解成单词(Token)序列，并识别出关键字、标识、常量等。语法分析Syntax Analysis：分析器对词法分析器解析出来的单词(Token)序列在语法上是否满足SQL语法规则。语义分析Semantic Analysis：语义分