AI:ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略
导读:ModelScope旨在打造下一代开源的模型即服务共享平台,汇集了行业领先的预训练模型,减少了开发者的重复研发成本。个人认为,相比于AI公司经常卖一款软件产品或者卖一个算法需求,而ModelScope更偏向于某种功能(model端到端)实现,初级AI从业者也能很容易实现大模型,有点低代码的感觉。当前ModelScope的功能,相比于CV、NLP的丰富内容,它在DS方面、可视化方面、解释性方面的就相对较少,同时,产品 To B和To C的功能域划分,也不算是很清晰,当然这也是该领域一个共同困扰。首次,当然可以先初级版本开源,其次,平台可以集大智慧,最后,模型迭代实现功能升级。对比国外也有类似平台或服务产品,六年的快速发展,如今实现估值十多亿美元。而在国内,随着人工智能场景的无处不在,也有着上千万的开发者,国内人工智能领域活跃度也异常空前,且有达摩院品牌的加持,ModelScope,六年的时间,会走到哪里呢?是否会迎来一个面向机器学习社区的新生态?一个崭新的独角兽?让我们拭目以待吧……
目录
ModelScope的简介
1、ModelScope 社区简介
2、对开发者好处
3、ModelScope提供的服务
4、 ModelScope 社区平台覆盖多个领域的模型任务——CV、NLP、Audio、Multi-Modal
计算机视觉
自然语言处理
语音处理
多模态技术
ModelScope的安装
T1、基于Anaconda安装
T2、直接在基于PAI-DSW的Jupyterlab内建模
ModelScope的使用方法
1、在线体验模型
2、创建模型或数据集并共享至ModelScope社区
第一步,登录账号,点击创建模型或数据集
第二步,填写基础信息
第三步, 点击创建模型
第四步,使用python SDK的方式添加模型
3、具体案例应用
CV之ModelScope:基于ModelScope框架的人脸人像数据集利用DCT-Net算法实现人像卡通化图文教程之详细攻略
NLP之ModelScope:基于ModelScope框架的afqmc数据集利用StructBERT预训练模型的文本相似度算法实现文本分类任务图文教程之详细攻略
最先进的开源模型,为开发者提供简单易用的模型构建、训练、部署等一站式产品服务,让模型应用更简单。 ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单! 我们希望在汇集行业领先的预训练模型,减少开发者的重复研发成本,提供更加绿色环保、开源开放的AI开发环境和模型服务,助力绿色“数字经济”事业的建设。 ModelScope平台将以开源的方式提供多类优质模型,开发者可在平台上免费体验与下载使用。 若您也和我们有相同的初衷,欢迎关注我们,我们鼓励并支持个人或企业开发者与我们,平台将为您构建更好的支持服务,共同为泛AI社区做出贡献。
官网:https://modelscope.cn/home
官网文档:https://modelscope.cn/docs/%E6%A6%82%E8%A7%88%E4%BB%8B%E7%BB%8D
免费使用平台提供的预训练模型,支持免费下载运行; 一行命令实现模型预测,简单快速验证模型效果; 用自己的数据对模型进行调优,定制自己的个性化模型; 学习系统性的知识,结合实训,有效提升模型研发能力; 分享和贡献你的想法、评论与模型,让更多人认识你,在社区中成长;
千亿参数大模型全面开放多领域SOTA“百模”开源 10行代码实现模型finetune 1行代码实现模型推理
官方文档:https://www.modelscope.cn/docs/%E4%BB%BB%E5%8A%A1%E7%9A%84%E4%BB%8B%E7%BB%8D
ModelScope 社区平台提供了覆盖多个领域的模型任务,包括自然语言处理(NLP)、计算机视觉(CV)、语音(Audio)、多模态(Multi-Modal)等,并提供相关任务的推理、训练等服务。
- 计算机视觉(CV):计算机视觉是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。
- 自然语言处理(NLP):自然语言处理是人工智能和语言学领域的分支学科。自然语言处理融合了计算机科学,语言学和机器学习的交叉学科,利用计算机技术对语言进行处理和加工的科学,包括对词法、句法、语义等信息的识别、分类、抽取、生成等技术。
- 语音处理(Audio):语音处理指机器从大量的语音数据中提取语音特征,学习和发现其中蕴含的规律的过程。
- 多模态(Multi-Modal): 多模态主要是指让机器能够理解和处理自然界或人工定义的多种模态信息,如声音、语言、视觉信息和表格、点云信息等。多模态技术的目的是打通模态之间沟通的桥梁和通过信息互补提升理解各自模态的能力。常见任务有视觉问答,表格问答,图片描述以及目前火热的根据描述生成图片。
当前,ModelScope 社区平台支持的任务类型按照领域分为如下的任务类型,该任务列表将持续更新扩展。若您有新的任务类型和模型,建议提PR给我们,我们欢迎社区成员共同来贡献和维护相应的任务列表!
计算机视觉
自然语言处理
语音处理
多模态技术
ModelScope Library目前支持tensorflow,pytorch深度学习框架进行模型训练、推理, 在Python 3.7+, Pytorch 1.8+, Tensorflow1.15,Tensorflow 2.x上测试可运行。注意:语音相关的功能仅支持 python3.7, tensorflow1.15.4的Linux环境使用。 其他功能可以在linux、mac x86等环境上安装使用。
第一步,python环境配置
第二步,安装相关DL框架
第三步,安装ModelScope library
第四步,测试
模型库:https://www.modelscope.cn/models
管方文档:https://modelscope.cn/docs/%E6%A8%A1%E5%9E%8B%E5%BA%93%E4%BB%8B%E7%BB%8D
1)基础信息包括您的模型英文名称、中文名、所有者、许可证类型、是否公开和模型描述。
- 许可证类型决定您的模型遵循对应的开源协议。
- 是否公开决定您的模型是否能被其他用户检索查看,若设置为非公开模型,则其他用户无法查看,仅您自己查看。您也可以创建后在设置页面进行权限的修改配置。
- 模型描述建议介绍您的模型的特性和应用场景,将展现在模型列表页方便用户搜索查询。
2)上传README文档。若您已有README文档,可直接在此处上传。若您没有README文档,系统将为您自动创建一个README文档。 为了让模型介绍更容易被理解和检索,我们推荐您按照模型卡片规范进行书写,具体可查看如何写好用的模型卡片。
系统将根据您上传的README.md文件进行解析,并展示在模型介绍页面。 右侧的demo根据task进行支持,当前支持的task类型将逐步开放,若您在readme中按照要求填写task和demo的示例代码等信息,系统将自动渲染出来。 若您没有README文档,可在模型文件中找到README.md并点击编辑进行在线编辑。
完成创建后,平台将为您分配一个存储地址,如下:
可通过页面或者git的方式将文件添加至该模型库中,也可通过页面上传相关的模型文件。
其中ACCESS_TOKEN可以通过用账号登录网站, 前往【个人中心】->【访问令牌】获取
以上例子中,创建出模型的完整模型id为"damo/cv_unet_image-matting_damo",可以在Model/Pipeline种使用。