SelectDB Cloud
管理指南
WebUI
集成

集成

通过 WebUI 提供的集成功能,您可以将主流数据源中的数据导入到 SelectDB 仓库中,或者建立映射到外部数据源,方便后续访问其中数据。

新建集成

WebUI 目前支持新建两种集成,分别是 Stage 集成(对象存储)、样例数据。

对象存储

通过新建对象存储集成,您可以与对象存储中的数据建立连接 。通过集成 + Copy Into 命令,您可以将对象存储中的数据导入到仓库。

在新建对象存储集成时,您需要输入以下内容:

  • 集成名 :与数据库对象命名规则一致,最多 64 个字符,可以使用字母、数字、下划线。

  • 注释 :集成的注释。

  • Bucket :您需要集成的存储桶。

  • 默认文件路径 :存储桶中要访问的文件路径,SelectDB 只会访问您填写的路径下的文件,如果不填写,则默认整个桶的数据均可访问。

  • 访问授权 :允许 SelectDB 访问您的存储桶的方式。分为 Access key 与 跨账号授权,我们推荐使用 跨账号授权 来获得更好的安全性。有关跨账号授权的指引,可以参考下文介绍。

  • 高级配置 :下详。

高级配置

分为文件类型导入配置 。这些是您在导入集成的数据时可能会用到的参数,您可以在这里设置,也可以在导入时另行指定,如果您没有设置也没有在导入时指定,系统将以默认配置执行该集成的导入任务。

文件配置

  • 文件类型 :对象存储中文件的格式类型,目前支持csvjsonorcparquet。默认为系统根据文件名后缀推断。
  • 压缩方式 :对象存储中文件的压缩类型,目前支持gz,bz2,lz4,lzo,deflate。默认为系统根据文件名后缀推断。
  • 列分隔符 :对象存储中文件的列分隔符,默认\t
  • 行分隔符 :对象存储中文件的行分隔符,默认\n
  • 文件大小 :导入对象存储中文件时的导入大小限制,默认为不限制。
导入配置

  • 遇到错误 :导入对象存储中的文件时,当数据质量不合格时的错误处理方式,分为三种:继续导入、中止导入、错误数据比例不超过一定值时继续导入。
  • 严格模式 :对于导入过程中的列类型转换进行严格过滤,错误格式的数据将被过滤。默认为关闭。

样例数据

新建样例数据集成,会自动创建对象存储集成,并导入样例数据到数据库中。因此,您需要选择集群来完成新建过程。

TPCH、GitHub Event、SSB-FLAT 样例数据的数据大小有以下选择:sf1(1GB)、sf10(10GB)、sf100(100GB),可通过下拉菜单进行选择。注意,测试仓库只能选择导入 sf1(1GB)的样例数据。

Clickbench 只有 sf100(100GB)的选项,我们推荐您使用较大的集群导入 ClickBench 样例数据。

您可以在样例数据集成的详情页,查看样例数据导入进度。

跨云账户授权

数据集成支持访问对象存储服务中的数据,您可以通过跨账号授权,授予 SelectDB 云账户访问您云厂商账户下对象存储的权限,以便 WebUI 通过集成功能,将您在对象存储中的数据导入到 SelectDB 仓库中。

因为不同云厂商,跨账户授权的操作各不相同,为方便大家操作,现将跨账户授权的具体步骤整理如下,供大家参考。

阿里云

请通过以下步骤完成创建跨账户角色创建与授权:

  1. 访问RAM 访问控制,选择角色菜单,点击创建角色按钮。

  1. 选择可信实体类型中选择阿里云账号,并点击下一步按钮。

  1. 配置角色名称,在选择信任的云账号选择其他云账号并填入 SelectDB 阿里云账号,并点击完成按钮。

  1. 接下来,点击为角色授权

  1. 我们建议您授予角色对象存储服务(OSS)读写权限,点击确定按钮完成授权。

  1. 点击角色列表中的角色名进入详情,将RAM 角色名称ARN复制到 SelectDB Cloud 集成等功能页面中。

腾讯云

请通过以下步骤完成创建跨账户角色创建与授权:

  1. 访问访问管理,选择角色菜单,点击新建角色按钮。

  1. 选择角色载体中选择腾讯云账户

  1. 云账号类型选择其他主账号,并在账号ID填入SelectDB 腾讯云ID,在外部ID勾选开启校验并填入外部ID点击 下一步

  1. 我们建议您在配置角色策略中,为角色授予对象存储(COS)读写权限,点击下一步

  1. 您可以按照需要添加角色标签,这是非强制的,点击下一步。

  1. 配置角色名称,并点击完成按钮。

  1. 点击角色列表中的角色名进入详情,将角色名称RoleArn复制到 SelectDB Cloud 集成等功能页面中。

华为云

请通过以下步骤完成创建跨账户角色创建与授权:

  1. 访问统一身份认证服务,选择角色菜单,点击创建委托按钮。

  1. 配置委托名称,在委托类型中选择普通账号,在委托的账号填入 selectdbcloud,并点击下一步

  2. 对委托进行授权,我们建议您授予委托对象存储服务(OBS)OBS OperateAccess权限,这个权限涵盖了读写与删除,但 SelectDB 只会按照用户的要求读取、写入数据。 您也可以使用自定义权限,授予 SelectDB 最小范围访问权限。

以下为 JSON 格式的授权内容,供大家参考。

{
    "Version": "1.1",
    "Statement": [
        {
            "Effect": "Allow",
            "Action": [
                "obs:object:GetObject",
                "obs:bucket:GetBucketLocation",
                "obs:bucket:HeadBucket",
                "obs:bucket:ListAllMyBuckets",
                "obs:bucket:ListBucket",
                "obs:object:GetObjectVersion",
                "obs:object:PutObject"
                
            ]
        }
    ]
}
  1. 选择授权的范围,并点击确定完成创建。

  1. 在角色列表页,鼠标悬浮在角色名上,将提示信息中第一行的委托名称您的云账号名称复制到 SelectDB Cloud 集成等功能页面中。

© 2023 北京飞轮数据科技有限公司 京ICP备2022004029号 | Apache、Apache Doris 以及相关开源项目名称均为 Apache 基金会商标