Skip to main content

💡 常见问题

不会!系统盘和数据盘在关机后都会保留。只有释放实例时,系统盘和数据盘才会被删除。起源云盘的数据永久保留,即使释放实例也不会丢失。
  • 镜像:保存系统环境(系统盘内容),用于快速创建相同环境的实例
  • 数据盘:保存数据文件,不随镜像保存,但实例关机后数据保留
建议
  • 环境配置 → 保存为镜像
  • 数据集、模型 → 存到数据盘或起源云盘
对比项数据盘起源云盘
位置/root/origin-data/root/origin-cloud
释放实例数据删除数据保留 ⭐
跨实例共享❌ 不支持✅ 支持 ⭐
网页管理❌ 不支持✅ 支持 ⭐
速度较快一般
用途当前实例专用长期存储、共享
选择建议
  • 训练中频繁读写的数据 → 数据盘
  • 需要长期保存或多实例共享 → 起源云盘
要,但费用很低!无卡创建时,实例仍然占用 CPU 和内存资源,会按较低的价格计费。具体价格参考控制台的计费说明。相比绑定 GPU 的价格,无卡创建时的费用通常只有几分之一。
会!在线升降配需要重启实例(约 30 秒),内存中的数据会丢失。建议做法
  1. 训练时使用 checkpoint 机制定期保存
  2. 升降配前确保最新的 checkpoint 已保存
  3. 重启后从 checkpoint 恢复训练
这样可以在不浪费太多时间的情况下完成升降配。
方法1:实例列表页面显示实时费用方法2:控制台 → 收支明细,查看详细消费记录方法3:控制台首页显示当前余额和今日消费

常见问题

实例创建失败怎么办?

可能原因:
  • GPU 资源暂时不足
  • 账户余额不足
解决方案:
  • 等待几分钟再试
  • 或选择其他 GPU 型号
  • 充值后重试

训练中断了怎么办?

建议在训练代码中加入 checkpoint 机制:
# 定期保存模型
if epoch % 10 == 0:
    torch.save(model.state_dict(), f'checkpoint_{epoch}.pth')
这样即使中断,也能从 checkpoint 恢复。

数据丢失了怎么办?

预防措施
  1. 重要数据保存到起源云盘(/root/origin-cloud
  2. 定期下载到本地备份
  3. 释放实例前检查数据
起源云盘数据永久保留,即使释放实例也不会丢失!