运维说明

组件运维

系统组件

BDOS Core

BDOS Core 是 BDOS基座层核心子系统

辐射范围为:集群全员共用
安装/配置调整权限仅系统管理员可以维护

其下应用清单

BDOS Infra

BDOS Infra 是BDOS基座基础设施层子系统

辐射范围为:集群全员共用
安装/配置调整权限仅系统管理员可以维护

其下应用清单

BDOS Obs 是BDOS PaaS层可观测性子系统

BDOS Obs是BDOS基座可观测性子系统

辐射范围为:集群全员共用
安装/配置调整权限仅系统管理员可以维护

其下应用清单

大数据组件

HDFS

Hadoop Distributed File System,简称 HDFS,是一个分布式文件系统,它是Apache Hadoop的核心存储模块

辐射范围为:集群全员共用
安装/配置调整权限仅系统管理员可以维护

其下应用清单

MinIO

MinIO是一个开源的分布式对象存储服务器,可以用来存储和访问大规模的非结构化数据,如图片、视频、日志和备份等。支持高可用性和自动扩展,在Kubernetes中,MinIO 通常作为一个独立的服务来运行,可以通过 PVC(Persistent Volume Claim)将数据持久化到云盘或本地存储中

辐射范围为:集群全员共用
安装/配置调整权限仅系统管理员可以维护

其下应用清单

Hive

Apache Hive 是一个建立在Hadoop架构之上的数据仓库。它能够提供数据的精炼,查询和分析

辐射范围为:集群全员共用 + 指定安全组
安装/配置调整权限:系统管理员 + 安全组管理员

其下应用清单

Click

ClickHouse是一个开源的列式存储数据库管理系统,具有高度的可伸缩性和性能。它支持多种数据格式和查询语言,可以轻松处理海量数据,广泛用于大数据领域的数据分析和处理任务。还具有快速的数据插入和查询速度

辐射范围为:集群全员共用
安装/配置调整权限:系统管理员

其下应用清单

Spark

Spark 是一个开源集群运算框架,相对于Hadoop的MapReduce会在执行完工作后将中介资料存放到磁盘中,Spark使用了存储器内运算技术,能在资料尚未写入硬盘时即在存储器内分析运算。

辐射范围为:集群全员共用 + 指定安全组
安装/配置调整权限:系统管理员 + 安全组管理员

其下应用清单

Volcano

Volcano 是基于Kubernetes的容器批量计算平台,主要用于高性能计算场景。它提供了Kubernetes目前缺少的一套机制,这些机制通常是机器学习大数据应用、科学计算、特效渲染等多种高性能工作负载所需的。

辐射范围为:集群全员共用
安装/配置调整权限:系统管理员

其下应用清单

Kafka

Kafka 是一个开源流处理平台,由Scala和Java编写。该项目的目标是为处理实时数据提供一个统一、高吞吐、低延迟的平台。其持久化层本质上是一个“按照分布式事务日志架构的大规模发布/订阅消息队列”,这使它作为企业级基础设施来处理流式数据非常有价值

辐射范围为:集群全员共用
安装/配置调整权限仅系统管理员可以维护

其下应用清单

Flink是一个流处理和批处理框架,支持事件驱动、基于时间的窗口操作和精确一次语义处理。Flink还提供了易于使用的API和丰富的工具生态系统,可用于大规模数据处理、机器学习、图形处理等场景

辐射范围为:集群全员共用
安装/配置调整权限仅系统管理员可以维护

其下应用清单

开发工具

Hue

Hue (Hadoop User Experience) 是一个开源的Apache Hadoop UI系统,通过使用Hue,可以在浏览器端的Web控制台上与Hadoop集群进行交互,来分析处理数据,例如操作HDFS上的数据,运行MapReduce Job,执行Hive的SQL语句,浏览HBase数据库等等

辐射范围为:集群全员共用
安装/配置调整权限仅系统管理员可以维护

其下应用清单

Superset

Superset 是由开源的数据分析与可视化平台,该工具主要特点是可自助分析、自定义仪表盘、分析结果可视化(导出)、用户/角色权限控制,还集成了一个SQL编辑器,可以进行SQL编辑查询对结果集进行保存可视化等

辐射范围为:集群全员共用 + 指定安全组
安装/配置调整权限:系统管理员 + 安全组管理员

其下应用清单

安全认证

Ranger

Ranger是一个开源的企业级安全管理解决方案,提供细粒度的数据安全和访问控制,为企业应用程序和数据提供了安全性和合规性保障。它支持多种数据存储和计算框架,支持对数据进行细粒度的访问控制和策略管理,可以根据用户身份、资源类型、时间、位置等条件对访问进行限制。此外,Ranger还提供了审计和监视功能,可以对用户行为和安全事件进行跟踪和报告

辐射范围为:集群全员共用
安装/配置调整权限仅系统管理员可以维护

其下应用清单

Keycloak

Keycloak是一个开源的身份和访问管理系统,它提供了一个单点登录(SSO)解决方案,可以为Web应用程序和RESTful Web服务提供身份验证和授权。Keycloak基于OAuth 2.0和OpenID Connect协议,支持多种身份验证方法。同时提供了一系列管理工具,可以用来管理用户、角色、授权、客户端和实体(如组织和部门)。它还提供了REST API和基于事件的钩子机制,可以方便地扩展和集成到现有的应用程序中

辐射范围为:集群全员共用
安装/配置调整权限仅系统管理员可以维护

其下应用清单

Kerberos

Kerberos是一种计算机网络认证协议,旨在提供网络中的安全认证服务。它通过客户端/服务器模型实现认证,并使用加密技术确保通信的机密性。Kerberos通常用于企业环境中的单点登录(SSO)系统中,用于验证用户身份并提供安全访问网络资源的能力

辐射范围为:集群全员共用
安装/配置调整权限仅系统管理员可以维护

其下应用清单

集群运维

集群Kerberos开关

Kubernetes通常需要与Kerberos集成来实现身份验证和授权。在以下几种场景下,可能需要将Kerberos禁用来进行测试:

需要注意的是,在生产环境中禁用Kerberos可能会导致安全风险,因此在进行测试之前,需要确保已经在测试环境中正确地配置了Kerberos,以便在必要时可以随时重新启用。

在KDP中涉及Kerberos的核心大数据组件

影响范围

测试内容

以下分两种情况对 KDP中进行 Kerberos 的开关的运维操作

情况1:新集群首次安装

上述修改完成后即可执行正常发布

情况2:已经存在集群做Kerberos开关的变更

组件运维权限说明

注意:以下组件的高级权限操作仅限于系统管理员,如果集群使用中分配了使用权限/账号,需要在完成后进行回收

组件 影响内容
K8s API 所有组件的安全性
Mysql Dataops及核心大数据安全性
Kerberos KDC数据安全
OnlineWeb 所有租户页面操作权限
RangerWeb 核心大数据组件用户权限数据
HDFS数据存储 HDFS数据
MinIO 影响以下数据监控/日志数据存储KDC和PGsql数据库备份
PGsql Dataops核心组件:Data Service
ClickHouse Dataops核心组件:Account Service
Zookeeper 通过Lens forward出地址后,可以对节点上的数据做操作
ElasticSearch 通过Lens forward出地址后,可以对节点上的数据做操作
Redis 通过Lens forward出地址后,可以对节点上的数据做操作