Cloud-Init 和 Cloudbase-Init

最近更新时间: 2024-06-12 15:06:00

什么是 Cloud-Init?

Cloud-Init 是一个开源工具。运行在云服务器实例内部的一个非常驻服务,在开机启动时执行,执行完成立即退出,不会监听任何端口。 腾讯云金融专区的 Linux 公共镜像都预安装了 Cloud-Init 服务。由于 Cloud-Init 服务主要用于实现对 CVM 实例的初始化操作(例如,对 DNS,Hostname,IP 等信息的配置),以及执行一些用户在创建 CVM 实例时指定首次开机启动要执行的自定义脚本,因此需要以 root 用户运行 Cloud-Init 服务。

如何确认 Linux 实例内部的 Cloud-Init 服务是否正常运行?

Cloud-Init 服务运行排查方案

首先请登录实例,依次执行以下命令,观察是否报错。显示执行结果则服务正常运行,否则会提示错误原因,请根据提示进行问题排查。

  1. 删除 cloud-init 缓存目录。

    rm -rf /var/lib/cloud
  2. 执行完整的 cloud-init 初始化。

    cloud-init init --local
  3. 根据配置的数据源拉取数据。

    cloud-init init
  4. Cloud-Init 初始化分为多个 stage,为保证各个 stage 的依赖充分,cloud-init modules 指定运行 config stage。

    cloud-init modules --mode=config
  5. cloud-init modules 指定运行 final stage。

    cloud-init modules --mode=final

Cloud-Init 执行了哪些实例初始化的操作?

腾讯云金融专区通过 Cloud-Init 实现了实例的所有初始化操作,使得整个实例内部的操作更加的透明。以下内容简单介绍了相关操作情况,更多详情可见 Cloud-init 官方文档

初始化类型 默认行为 禁用方式 注意事项
hostname 的初始化 实例首次启动时,Cloud-Init 会根据 vendor_data.json 中的 hostname 信息来设置实例的 hostname。 当您使用自定义镜像创建或重装实例时,您想保持自定义镜像内部自定义的 hostname 设置,可以在制作自定义镜像之前在 /etc/cloud/cloud.cfg 里面删除 - scripts-user 这行配置。 如果您禁用了- scripts-user 这行配置,实例内部的 /var/lib/cloud/instance/scripts/runcmd 初始化脚本将不会被执行,并会同时影响其他子项的初始化(主要涉及:云监控、云安全的安装、软件源的设置)。 同时,在您创建子机时,自定义脚本也不会被执行。
/etc/hosts 的初始化 实例首次启动时,Cloud-Init 会默认将 /etc/hosts 初始化为 127.0.0.1 $hostname。 当您使用自定义镜像创建或重装实例时,您想保持自定义镜像内部自定义的 /etc/hosts 设置,可以在制作自定义镜像之前在 /etc/cloud/cloud.cfg 里面删除 - scripts-user 这行配置。 - 如果您禁用了 - scripts-user 这行配置,实例内部的 /var/lib/cloud/instance/scripts/runcmd 初始化脚本将不会被执行,并会同时影响其子项的初始化(主要涉及:云监控、云安全的安装、软件源的设置)。同时,在您创建子机时,自定义脚本也不会被执行。
- 每当子机重启时,部分存量机器 /etc/hosts 的设置都会被覆盖。解决方案请参见 如何有效的修改 Linux 实例的 etc hosts 配置

DNS 的初始化(非 DHCP 场景)
实例首次启动时,Cloud-Init 会根据 vendor_data.json 中的 nameservers 信息来设置实例的 DNS。 当您使用自定义镜像创建或重装实例时,您想保持自定义镜像内部自定义的 DNS 设置,可以在制作自定义镜像之前在 /etc/cloud/cloud.cfg 里面删除 - resolv_conf 与 unverified_modules: ['resolv_conf']两行配置。
软件源的初始化
实例首次启动时,Cloud-Init 会根据 vendor_data.json 中的 write_files 信息来设置实例的软件源。
当您使用自定义镜像创建或重装实例时,您想保持自定义镜像内部自定义的软件源设置,可以在制作自定义镜像之前在 /etc/cloud/cloud.cfg 里面删除 - write-files 这行配置。
NTP 的初始化
实例首次启动时,Cloud-Init 会根据 vendor_data.json 中的 NTP Server 信息来设置实例的 NTP 服务器配置并拉起 NTP Service。
当您使用自定义镜像创建或重装实例时,您想保持自定义镜像内部自定义的 NTP 设置,可以在制作自定义镜像之前在 /etc/cloud/cloud.cfg 里面删除 - ntp 这行配置。
密码的初始化 实例首次启动时,Cloud-Init 会根据 vendor_data.json 中的 chpasswd 信息来设置实例的默认账号密码。 当您使用自定义镜像创建或重装实例时,您想保持自定义镜像内部自定义的默认账号密码,可以在制作自定义镜像之前在
/etc/cloud/cloud.cfg 里面删除 - set-passwords 这行配置。
密钥绑定 实例首次启动时,Cloud-Init 会根据 vendor_data.json 中的 ssh_authorized_keys 信息来设置实例的默认账号密钥。 当您使用自定义镜像创建或重装实例时,您想保持自定义镜像内部自定义的密钥,可以在制作自定义镜像之前在 /etc/cloud/cloud.cfg 里面删除 - users-groups 这行配置。 如果您通过手工的方式在实例内部自行绑定密钥,在通过控制台下发密钥绑定的操作时,系统会将此密钥覆盖。
网络初始化(非 DHCP 场景)
实例首次启动时,Cloud-Init 会根据 network_data.json 中的信息来设置实例的 IP、GATEWAY、MASK 等。
当您使用自定义镜像创建或重装实例时,您想保持自定义镜像内部自定义的网络信息,可以在制作自定义镜像之前在 /etc/cloud/cloud.cfg 里面增加 network: {config: disabled} 这行配置。

如何排查 Cloud-Init 常见问题?

1. 因卸载 Cloud-Init 的依赖包导致报错

  • 问题现象:

    在使用命令确认 Cloud-Init 服务是否正常运行时,收到如下的错误:

     Traceback (most recent call last):
       File "/usr/bin/cloud-init", line 5, in 
         ********
         raise DistributionNotFound(req)
     pkg_resources.DistributionNotFound: pyyaml
  • 问题分析:

    “pkg_resources.DistributionNotFound: xxxxx ” 表示 Cloud-Init 的安装依赖包被卸载。

  • 解决方案:

    1. 重新安装该依赖包。

    2. 根据 Cloud-Init 服务运行排查方案 执行操作,直至全部执行完无错误为止。

2. 修改了默认 Python 解释器导致报错

  • 问题现象:

    在开机启动执行 Cloud-Init 时报错。

  • 问题分析:

    安装 Cloud-Init 时,Python 解释默认使用 Python2(即 /usr/bin/python/bin/python 这两个软连链向 Python2)。当用户业务有需要时,可能会在实例内部把 Python 的默认解释器改为 Python3(即修改 /usr/bin/python/bin/python 这两个软连,使其指向 Python3)。由于兼容性问题,导致在开机启动执行 Cloud-Init 时报错。

  • 解决方案:

  1. 修改 /usr/bin/cloud-init 文件中指定的 Python 解释器,将 #/usr/bin/python#/bin/python 修改为 #! user/bin/python

    注意: 不要使用软连接,直接指向具体的解释器。

  2. 根据 Cloud-Init 服务运行排查方案 执行操作,直至全部执行完无错误为止。

Cloudbase-Init

什么是 Cloudbase-Init?

与 Cloud-Init 相似,Cloudbase-Init 是与 Windows 云服务器实例通信的桥梁。 在实例首次启动的时候会执行 Cloudbase-Init 服务,该服务会读取出实例的初始化配置信息,并对实例进行初始化操作。同时包括后续的重置密码、修改 IP 等功能也都是通过 Cloudbase-Init 来实现的。

如何确认 Windows 实例内部的 Cloudbase-Init 服务是否正常运行?

Cloudbase-Init 服务运行排查方案:

  1. 登录实例。

    说明: 若您忘记密码或因为 Cloudbase-Init 服务异常重置密码失败,可通过 步骤 2 进行密码重置。

  2. 打开控制面板 > 管理工具 > 服务

  3. 找到 cloudbase-init 服务,并右键单击【属性】,打开 cloudbase-init 的属性窗口。

    • 查看“启动类型”,确保“启动类型”为“自动”。如下图所示:

    • 查看“登录身份”,确保“登录身份”为“本地系统帐户”。如下图所示:

    • 手动启动 cloudbase-init 服务并观察是否有相关报错。

      如果有报错需要优先解决,并请确认是否安装相关安全软件拦截 cloudbase-init 执行的相关操作。

    • 打开“注册表”搜索并找到全部的“LocalScriptsPlugin”,确保其值为2。如下图所示:

    • 确认 CD-ROM 的加载是否被禁用(不适用于裸金属云服务器)。如下图所示,可以看到一个光驱设备,则表示正常加载;否则是被禁用了,需要取消禁用。

如何排查 Cloudbase-Init 常见问题?

初始化重置密码失败

可能原因:

  • 手动修改 cloudbase-init 账号密码导致 cloudbase-init 服务启动失败,从而使得初始化重置密码等操作失败。

  • 禁用了 cloudbase-init 服务,从而使得初始化重置密码等操作失败。

  • 安装安全软件拦截了 cloudbase-init 服务重置密码的操作,从而使得重置密码流程返回成功但实际重置失败。

    解决方案:

    请针对可能原因,分别参考以下三点进行操作:

  1. 将 cloudbase-init 服务改为 LocalSystem 服务,具体操作方式请参见 Cloudbase-Init 服务运行排查方案 的 步骤 2。

  2. 将 cloudbase-init 服务启动类型改为自动。 具体操作方式请参见 Cloudbase-Init 服务运行排查方案 的 步骤 2。

  3. 卸载对应的安全软件, 或在安全软件里面对 cloudbase-init 服务的相关操作加白名单。