-
阿里云GPU云服务器操作指南-安装Teslala驱动-创建GPU实例时自动安装或加载Tesla驱动
阿里云GPU云服务器操作指南-安装Teslala驱动-创建GPU实例时自动安装或加载Tesla驱动 针对通用计算场景或图形加速场景,您可以在创建GPU实例时自动安装或加载Tesla驱动,也可以在创建GPU实例后手动安装Tesla驱动,配备了驱动的GPU实例才能提供更好的计算性能和图形渲染能力。本文介绍如何在创建GPU实例时自动安装或加载Tesla驱动。 驱动安装方式 选择不同安装方式自动安装或加载Tesla驱动来满足通用计算场景或图形加速场景的性能需求。 安装方式 说明 相关链接 公共镜像方式 …
-
阿里云GPU云服务器操作指南-安装Tesla或GRID驱动-安装指引
阿里云GPU云服务器操作指南-安装Tesla或GRID驱动-安装指引 GPU实例本身并未配备相关驱动,只有安装了驱动的GPU实例,才能实现计算加速或图形渲染等功能。根据不同GPU实例规格安装与之匹配的Tesla或GRID驱动,以满足您的实际业务需求(例如通用计算场景、图形加速场景),并提供更好的计算性能和图形渲染能力。本文为您介绍如何为GPU实例安装相应驱动的方法。 驱动安装示意 阿里云GPU实例支持安装Tesla驱动和GRID驱动,驱动类型以及安装方式受实例规格、操作系统等因素影响,示意图如下…
-
阿里云GPU云服务器操作指南-诊断GPU状态-通过云助手插件一键诊断GPU
阿里云GPU云服务器操作指南-诊断GPU状态-通过云助手插件一键诊断GPU 通过云助手插件可以对当前实例的GPU卡状态或驱动状态等方面进行全方位诊断,帮助您快速检测使用GPU时遇到的一些常见问题(例如GPU卡异常、驱动异常等),一旦诊断出异常情况,可以自动发起运维动作,例如发送通知给用户等。 操作步骤 说明 本文适用于诊断Linux操作系统GPU实例,该GPU实例在创建时已默认预装了云助手插件,关于云助手的详细信息,请参见云助手概述。 登录ECS管理控制台。 在左侧导航栏,选择运维与监控 >…
-
阿里云GPU云服务器操作指南-诊断GPU状态-通过控制台自助排查功能诊断GPU
阿里云GPU云服务器操作指南-诊断GPU状态-通过控制台自助排查功能诊断GPU GPU实例在运行过程中可能会存在潜在的故障隐患或者安全风险,例如显卡故障、驱动程序错误等问题,ECS管理控制台支持配置GPU设备健康检查功能,方便您自行诊断当前实例的GPU卡或驱动是否存在异常,及时发现并解决潜在问题。 操作步骤 说明 操作前,请确认GPU实例处于运行中状态。 登录ECS管理控制台。 在左侧导航栏,单击自助问题排查。 在页面左侧顶部,选择目标GPU实例所在地域。 在实例问题排查页签下,选择问题排查类型…
-
阿里云GPU云服务器操作指南-管理GPU实例-GPU监控
阿里云GPU云服务器操作指南-管理GPU实例-GPU监控 云监控通过安装在阿里云主机(ECS实例)上的云监控插件,采集GPU的监控数据,您还可以为这些监控项设置报警规则。当某个监控项达到报警条件时,会给您发送报警通知,以便您及时关注其动态。 前提条件 请确保您已在云服务器ECS上创建GPU计算型实例,且已安装GPU驱动。具体操作,请参见创建GPU实例。 说明 如果您先安装云监控插件,再安装GPU驱动,则需要重启云监控插件。关于如何重启云监控插件,请参见如何重启云监控C++版本插件?。 请确保您已…
-
阿里云GPU云服务器操作指南-管理GPU实例-释放实例
阿里云GPU云服务器操作指南-管理GPU实例-释放实例 GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的管理操作。当您不再需要某个GPU实例提供服务时,您可以释放该实例,以免产生额外的费用,本文主要介绍释放按量付费实例(包括抢占式实例)和已到期的包年包月实例。 前提条件 仅支持释放按量付费实例(包括抢占式实例)和已到期的包年包月实例。 实例释放后数据无法恢复,建议您在释放之前先创建快照备份数据。具体操作,请参见创建快照。 释放实例不影响已经手动创建好的快照和镜像。 背景信息 …
-
阿里云GPU云服务器操作指南-管理GPU实例-重启实例
阿里云GPU云服务器操作指南-管理GPU实例-重启实例 重要 本文中含有需要您注意的重要提示信息,忽略该信息可能对您的业务造成影响,请务必仔细阅读。 GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的管理操作。本文介绍如何通过控制台重启实例。 警告 重启实例会造成您的实例停止工作,可能导致业务中断,建议您在非业务高峰期时执行该操作。 前提条件 待重启的实例必须处于运行中状态。 说明 建议您通过控制台或调用API重启实例,而非在实例操作系统内执行reboot重启命令。在一些场景下…
-
阿里云GPU云服务器操作指南-管理GPU实例-启动实例
阿里云GPU云服务器操作指南-管理GPU实例-启动实例 GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的管理操作。本文介绍如何在ECS管理控制台上启动实例。 前提条件 实例满足以下条件之一: 实例处于已停止状态。 按量付费实例处于已过期状态,您已经结清欠费账单但自动重开机失败。 说明 您的阿里云账户余额(即现金余额)和代金券的总值不得小于100.00元人民币。 按量付费实例处于欠费回收中状态,您已经结清欠费账单但自动重开机失败。 说明 您的阿里云账户余额(即现金余额)和代金券…
-
阿里云GPU云服务器操作指南-管理GPU实例-停止实例
阿里云GPU云服务器操作指南-管理GPU实例-停止实例 重要 本文中含有需要您注意的重要提示信息,忽略该信息可能对您的业务造成影响,请务必仔细阅读。 GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的管理操作。本文介绍停止ECS实例,以及VPC内实例节省停机模式相关操作。 前提条件 实例必须处于运行中状态。 警告 停止实例会中断您的业务,请谨慎执行。 停止包年包月实例 说明 停止包年包月实例不会影响实例的计费。 登录ECS管理控制台。 在左侧导航栏,选择实例与镜像 > 实…
-
阿里云GPU云服务器操作指南-连接GPU实例-通过VNC连接实例
阿里云GPU云服务器操作指南-连接GPU实例-通过VNC连接实例 VNC是远程连接ECS实例的一种方式。支持连接运行中(包括操作系统启动阶段)或停止中的实例。当无法通过其他方式连接实例时,可以使用该方式进行紧急运维,排查故障。本文为您介绍如何在控制台使用VNC登录实例。 重要 自2023年7月10日起,远程连接工具VNC无需单独设置VNC登录密码,仅需通过实例的登录名和密码,即可安全访问ECS实例。 阿里云在2023年7月10日对远程连接工具VNC完成安全升级,阿里云平台将自动托管通过VNC访问…