调试任务
目录
1. 调试任务列表
操作步骤
步骤1 用户登录合肥市多元异构算力统一调度服务平台。
步骤2 单击上部导航栏“AI计算 → 训练任务”,点击“调试任务”tab标签,进入调试任务控制台,控制台展示调试训练任务列表,列表展示:任务名称、套餐配置、环境镜像、启动时间、停止时间、状态、操作(查看、停用、删除)。
2. 创建调试任务
操作步骤
步骤1 用户登录合肥市多元异构算力统一调度服务平台。
步骤2 单击上部导航栏“AI计算 → 训练任务”,点击“调试任务”tab标签,进入调试任务控制台。
步骤3 单击左上角“新建调试任务”按钮,跳转至创建调试任务表单页面。
步骤4 填写相关信息,点击“确认”按钮,页面提示“任务创建成功”,页面跳转至调试任务详情页面。
步骤5 点击“取消”按钮,页面跳转至调试任务控制台。
信息字段说明:
字段名称 | 是否必填 | 字段说明 |
---|---|---|
任务名称 | 必填 | 用户需定义自己的任务名称,校验格式为支持1-64位且只包含大小写字母、数字、中划线、下划线 |
任务描述 | 非必填 | 0-100个字符。超过100个字符的输入或粘贴内容自动截断,只保留前100个字符的输入内容 |
计算中心 | 必选 | 选择任务调度的计算中心。此处数据通过分中心列表接口查询,展示可支持普通任务的启用状态的计算中心 |
资源队列 | 必选 | 选择计算中心的资源池,此处数据通过管理后台资源队列接口查询,展示计算中心可供选择的资源池 |
输入文件 | 选填 | 选择调试环境需要挂载的文件,可选存储根据计算中心查询,只可选择所选计算中心的存储文件,支持选择文件夹路径,最多可添加10个训练输入。不支持嵌套选择,例如:第一个输入选择了obs/zhangyd,第二个输入选择了obs/zhangyd/zhangyd01,这种嵌套选择不允许 |
输入类型 | 非必填 | 输入的文件类型,当前版本支持文件路径、数据集和模型: 1. 文件路径:选择启动容器时需要挂载的文件路径; 2. 数据集:选择启动容器时需要挂载的数据集路径; 3. 模型:选择启动容器时需要挂载的模型路径; |
输出文件路径 | 非必填 | 用户可选择挂载输出路径,校验和内容同输入路径。输出路径在容器中默认挂载在/output目录下 |
训练镜像 | 必选 | 选择容器的启动镜像,支持选择官方镜像和私有镜像 1. 官方镜像查询平台提供的该计算中心所有的可用镜像; 2. 私有镜像查询用户在该计算中心创建的所有可用的私有镜像。(可用指镜像状态为成功),此处展示的为镜像名称; |
环境变量 | 选填 | 可在容器内注入环境变量 |
选择套餐 | 必选 | 选择训练所需要的套餐资源,此处查询该计算中心资源队列下配置的可用套餐规格 |
运行时长 | 必填 | 选择调试环境的运行时长,支持选择1小时、2小时、3小时和自定义,自定义支持填入整数小时,超时将自动关闭 |
访问方式 | 必填 | 支持选择jupyter和ssh两种方式,选择后可通过选择方式对任务进行调试,选择ssh需要选择连接密钥 |
算力支付 | 必选 | 支持用户使用账户的算力支付任务提交费用,此处展示用户账户的剩余算力和冻结算力,剩余算力查询一级平台用户钱包的真实数据,冻结算力为智算平台的预扣算力。在提交任务时,校验用户的真实数据-预扣算力是否大于0,若大于0,允许提交任务,若小于0,不允许提交任务,提示“算力不足,请先充值算力” |
3. 删除调试任务
操作步骤
步骤1 用户登录合肥市多元异构算力统一调度服务平台。
步骤2 单击上部导航栏“AI计算 → 训练任务”,点击“调试任务”tab标签,进入调试任务控制台。
步骤3 点击操作栏中的“删除”按钮,弹出二次提示框。
步骤4 点击“确定”按钮,删除此条调试训练任务数据。
步骤5 点击“取消”按钮,展示调试训练任务列表。
4. 搜索调试任务
操作步骤
步骤1 用户登录合肥市多元异构算力统一调度服务平台。
步骤2 单击上部导航栏“AI计算 → 训练任务”,点击“调试任务”tab标签,进入调试任务控制台。
步骤3 通过表单右上方搜索栏,可以分别通过下拉选选中任务状态和输入任务名称对创建的调试任务进行搜索。
5. 查看调试任务
操作步骤
步骤1 用户登录合肥市多元异构算力统一调度服务平台。
步骤2 单击上部导航栏“AI计算 → 训练任务”,点击“调试任务”tab标签,进入调试任务控制台。
步骤3 点击操作栏中的“查看”按钮,跳转至调试任务详情页面,可以通过二级菜单查看任务配置情况,核心区默认展示“任务日志”tab页的内容,可以查看任务运行过程中的任务日志。
步骤4 点击“资源监控”tab标签,可以查看任务运行过程中的资源利用率。
步骤5 点击“系统事件”tab标签,可以查看任务运行过程中的容器事件。
步骤6 “任务日志”tab标签页下,通过点击“切换模式”开关,可以切换页面的深浅背景。
步骤7 点击右上角“暂停”按钮,可以暂停运行中状态的任务。
步骤8 点击右上角“删除”按钮,可以删除此任务。
步骤9 点击右上角“刷新”按钮,可以刷新当前页面。
步骤10 点击左下角“退出实时模式”,可以让控制台停止打印日志,再通过点击右上角“实时跟踪”恢复日志实时打印。
步骤11 点击“存为镜像”按钮,在弹出框中输入镜像信息,可将当前任务运行的环境存为私有镜像,在“通用服务 → 镜像管理 → 私有镜像”中可以查询到保存的镜像信息。
步骤12 点击“打开Jupyter Lab”按钮,可以打开Jupyter客户端,打开notebook可打开在线程序编译器,通过python进行编译,编译通过后可ctrl+s进行保存。
步骤13 保存的文件存放在临时的code目录下,用户可通过点击“Terminal”终端图标,通过cp命令,例如:cp /code/xxxx.ipynb input/mnist/code,将文件同步至存储桶目录下。