以URL作为源地址的数据迁移至COS

最近更新时间: 2024-10-17 17:10:00

实践背景

对于用户想要使用 URL 列表作为数据源地址进行数据迁移。对象存储 COS 支持线上迁移方式:

迁移方式 说明
COS Migration COS Migration 是一个集成了 COS 数据迁移功能的一体化工具。用户只需要通过简单的配置操作,便可将数据快速迁移至 COS 中。

注意:

目前 COS 暂不支持含有鉴权信息的 URL 数据进行迁移。

迁移实践

COS Migration

迁移操作步骤如下:

  1. 安装 Java 环境。
  2. 安装 COS Migration 工具。
  3. 修改配置文件。
  4. 启动工具。

具体的操作方法,请参见 COS Migration 工具 文档。

操作技巧

下面介绍如何配置 COS Migration 能最大程度提高迁移速度:

  1. 根据自身网络环境调整区分大小文件的阈值和迁移并发度,实现大文件分块,小文件并发传输的最佳迁移方式。调整工具执行时间和设立带宽限制,保证自身业务运行不受迁移数据带宽占用影响。上述调整可在配置文件 config.ini 中[common]分节,修改如下参数进行调整:

    参数名称 参数说明
    smallFileThreshold 小文件阈值参数,大于等于这个阈值使用分块上传,默认设置为5MB。
    bigFileExecutorNum 大文件并发度,默认值为8。
    如果是通过外网来连接 COS,且带宽较小,请减小该并发度。
    smallFileExecutorNum 小文件并发度,默认值为64。
    如果是通过外网来连接 COS,且带宽较小,请减小该并发度。
    executeTimeWindow 该参数定义迁移工具每天执行的时间段,其他时间则会进入休眠状态,休眠状态暂停迁移并会保留迁移进度,直到下一个时间窗口自动继续执行。
  2. 采用分布式并行传输可以进一步加快迁移速度。用户可以考虑使用多台机器安装 COS Migration 并分别执行不同源数据的迁移任务。