本地数据迁移至COS

最近更新时间: 2024-06-12 15:06:00

实践场景

对于拥有本地 IDC 的用户,对象存储 COS 在不同迁移类型上支持以下迁移方式,帮助用户将本地 IDC 的海量数据快速迁移至对象存储 COS。

迁移方式 说明
COS Migration(线上迁移) COS Migration 是一个集成了 COS 数据迁移功能的一体化工具。用户只需要通过简单的配置操作,便可将数据快速迁移至 COS 中。

用户可依据数据迁移量、IDC 出口带宽、IDC 空闲机位资源、可接受的迁移完成时间等因素来考虑如何选择迁移方式。下图展示的是使用线上迁移时预估的时间消耗,可以看出,若此次迁移周期超过10天或者迁移数据量超过50TB,我们不建议您选择线上迁移。

注意:

1MB 以下的小文件数量较多、磁盘 IO 性能不足等也会影响到数据的迁移进度。

迁移实践

COS Migration

迁移操作步骤如下:

  1. 安装 Java 环境。
  2. 安装 COS Migration 工具。
  3. 修改配置文件。
  4. 启动工具。

具体的操作方法,请参见 COS Migration 工具 文档。

操作技巧

下面介绍如何配置 COS Migration 能最大程度提高迁移速度:

  1. 根据自身网络环境调整区分大小文件的阈值和迁移并发度,实现大文件分块,小文件并发传输的最佳迁移方式。调整工具执行时间和设立带宽限制,保证自身业务运行不受迁移数据带宽占用影响。上述调整可在配置文件 config.ini 中[common]分节,修改如下参数进行调整:

    参数名称 参数说明
    smallFileThreshold 小文件阈值参数,大于等于这个阈值使用分块上传,默认设置为5MB。
    bigFileExecutorNum 大文件并发度,默认值为8。
    如果是通过外网来连接 COS,且带宽较小,请减小该并发度。
    smallFileExecutorNum 小文件并发度,默认值为64。
    如果是通过外网来连接 COS,且带宽较小,请减小该并发度。
    executeTimeWindow 该参数定义迁移工具每天执行的时间段,其他时间则会进入休眠状态,休眠状态暂停迁移并会保留迁移进度,直到下一个时间窗口自动继续执行。
  2. 采用分布式并行传输可以进一步加快迁移速度。用户可以考虑使用多台机器安装 COS Migration 并分别执行不同源数据的迁移任务。