MegaEase Cloud 重大更新： GPU服务

Monday, June 19, 2023

前情提要

2023年4月，我们为MegaEase Cloud做了重大更新，在上一次更新中，我们对外提供了下面的服务：
基础软件更新升级
新增 Nginx 和 MinIO 服务
提供 Kubernetes 离线部署能力
集成 Cloudflare
Zero Trust + MinIO 的 CDN 能力
Easegress 与 CDN 的 灰度发布 和 Tracing 能力
监控指标梳理和优化
对标 DataDog 和 Prometheus
持续集成能力
提供 Docker 镜像仓库服务
通过 Github Action 自动化部署应用

今天， MegaEase Cloud 将迎来一个重大功能的更新——GPU 服务。

我们深知，在当今的 AIGC 浪潮下。无论是程序员，还是广大的普通人都会想去拥抱这个浪潮。想去接触 AI、了解体验 AI、感受 AI 给我们的生活、学习、娱乐所带来的影响，甚至参与到其中。我们坚信，这个世界上总会有那些愿意不断探索、接受新事物的人，他们对AI未知领域怀揣着浓厚的好奇心。然而，高昂的使用成本（硬件和知识成本）却成为了人们探索的障碍；不过我们也相信我们有能力为改变这个现状贡献一点棉薄之力，通过接近2个月的开发以及和合作伙伴的通力合作。我们在MegaEase Cloud 上完成了GPU服务，并打磨好许多AI 轻量级训练和推理（使用）场景的模板供大家使用。现在我们可以骄傲的宣布，MegaEase Cloud 的 GPU服务正式对外进行公测。我们希望大家能通过这个服务进入AI世界的大门，感知AI的带来的变化并加入到当下AIGC浪潮中，成为一个参与者，而非一个旁观者。

GPU 服务

此服务在目前只在 cloud.megaease.cn上开放， cloud.megaease.com 由于网络原因暂不开放。

选择你需要的GPU规格

在 cloud.megaease.cn 上，通过GPU 服务，提供了您一个可以低成本使用GPU 的平台。登录我们的平台后，通过GPU 资源下的购买菜单你可以看到在数据中心罗列的GPU资源：

当前罗列的是能为你提供GPU 规格，你可以选择需要的GPU规格，以及你预计要使用的时长。点击购买，就可以通过支付宝或微信完成支付。

支付后在已购页面就可以看到所购买的GPU规格。

启动GPU的服务

一旦您购买了GPU服务，你就可以从已购菜单中看到你可以使用的GPU实例列表。在下拉列表中，通过点击右边的操作下拉菜单，你便可以在GPU实例启动一个为你预先准备好的预置模板服务。你可以通过这些模板服务进一步熟悉和了解AI的训练和推理（使用）场景，因此我们将模板分为如下的几个大类：

注意当你启动GPU 时候，可能会出现库存不够的情况，不要担心，这有可能是当前用户过多导致，你可以稍晚的时候再试即可。

推理类（使用类） - 入门级：

Stable Diffusion WebUI & Jupyter NoteBook：这个模板可以快速启动一个开源的基于提示词作画的服务。这个服务还自带了ControlNet的插件和一些方便进行微调服务的插件。这个镜像中还包含了一个Jupyter Notebook服务，你可以依托它来完成大小小于100M的文件上传和下载。

Stable Diffusion WebUI With 3D to 2D Plugin& Jupyter NoteBook：这个模板增加了将三次元视频转成二次元视频的Plugin，这个实现也是基于Stable Diffusion 来完成的，但是增加了更多的插件和一些特殊的SD设置以及执行的步骤。你可以通过下面的视频了解到如何完成这项工作。

通过这个视频你可以快速了解如何使用这个模板。

ChatGLM with LangChain： ChatGLM 是一个具有60亿参数的中文开源大模型，在这个模板中集成了知识库问答的功能，这意味着，你可以上传一篇文档，可以是PDF或Word 到这个服务去建立知识库。然后基于这个知识库，就可以提出相应的问答。这个特别适合客户机器人场景

One-click deepfake (face swap)：这是一个小的AI 应用，这个模板能够让你通过上传一个人物头像图片和一个人物视频完成对视频中的人物进行换脸的AI处理。你只要跟着Jupyter Notebook 中的提示一步步执行就能完成。

通过这个视频你可以快速了解如何使用这个模板。

学习类 - 初级：

Jupyter Notebook： Jupyter Notebook 是机器学习中最基础最常用的软件，你可以在这个服务中学习Python语言。这个模板提供了机器学习的最基本内容和服务。

Jupyter Notebook for Pytorch：这也是一个Jupyter Notebook服务，但是在这个服务中预装了机器学习的开源框架Pytorch 2.0.1，你可以基于这个模板来接触机器学习领域基本概念，并做实验以方便你熟悉了解线性回归，梯度下降，反向传递以及神经网络等机器学习领域的基本概念。

Jupyter Notebook for Tensorflow：这也是一个Jupyter Notebook服务，但是在这个服务中预装了机器学习的开源框架Tensorflow 2.12.0，你可以基于这个模板来接触机器学习领域基本概念，并做实验以方便你熟悉了解线性回归，梯度下降，反向传递以及神经网络等机器学习领域的基本概念。

训练类 - 中级：

Convert any voice to the target one：通过这个Template，你可以将任意声音转换成目标声音的AI模型。这意味着你可以通过这个Template 训练出周杰伦的声音并演唱出蔡琴的歌曲。而你要做的就是准备好你的声音的素材，并按照Jupyter的步骤一步步的执行即可。

通过这个视频你可以快速了解如何使用这个模板。

这个训练需要较多的资源，建议确保在24GB显存、32GB内存的环境里训练推理。

Finetune a 3B Large Language Model with Lit-Parrot script：这个Template 会带着你一步步的通过使用 Lit-Parrot 提供的脚本对一个开源大模型Stable-LM-3B进行微调。使它具有更强的中文理解能力。

通过这个视频你可以快速了解如何使用这个模板。

这个训练需要较长时间，请确保你有足够的时间额度来完成训练。

GPU 存储

我们知道，在很多机器学习和训练场景中，使用者会上传或下载大量的数据。而我们提供的GPU服务本质上是一个无状态的服务。一旦实例停机或重启，所有的数据均会消失。所以我们提供了GPU 存储的服务。

你只要购买一定容量的存储后，在你启动GPU服务时，你可以将你的存储挂载到指定目录。同时我们也提供了存储访问的界面。通过点击打开Web 控制台，你可以上传或下载你的数据。

新功能敬请期待

我们也明白，目前GPU服务所集成的基础模板应该远远不能满足广大AI 爱好者的需求。为此，我们将会在未来提供自定义模板的功能。届时，用户可以自定义的模板并提交到平台。模板一旦提交，在用户租户下便可以应用到GPU 资源上使用。自定义模板一般多是Docker 镜像的形式。提交时，用户需要指定好相关的信息，例如监听的服务端口信息等。

除此之外，未来我们还会去努力寻找一些更好的GPU 算力的资源。加入一些高显存，高FLOPs算力的多GPU规格的资源提供给有专业“炼丹”需求的“炼丹师”使用。

联系我们

如果您有什么样的想法或是想跟我们聊聊，欢迎通过下面的方式与我们联系！