产品中心
Product
首页 > 产品中心 > RT-Brain
返回

RT-brian 集群版

平台介绍

    RT-Brain 人工智能大数据平台集群版是容天专为深度学习业务客户研发的平台软件,专为大模型、大显存、大数据客户定制。其中包含深度学习、神经网络、语音识别、GPU 应用等。因单一服务器并不能满足大数据业务需求,故 RT-Brain 集群版专为深度学习集群、数据中心提供全方位、有效的性能保障。


平台架构

    RT-Brain 集群版采用以 Docker 容器技术为核心,利用 Kubernetes 的 Replication contorller 等 Deployment 管理引擎有效的控制各个计算节点的资源。同时部署目前流行深度学习分布式框架进行训练,并通过对应 WEB 接口调用深度学习框架使用命令。监控模块可实时监控每一计算节点的资源,可以更方便、更高效的进行多机训练识别,是针对大规模型计算的高效工具。


1-210FG55243934.png


应用场景

图片识别  

语音识别  

目标检测  

数据并行、模型并行类应用

大规模、大显存、大尺寸、高精度的 AI 业务


产品优势

资源:不同于传统集群,利用 Kubernetes 有效对 Docker 容器进行调用管理,可以生成资源池,更有效的对资源进行管理。

部署:采用智能管家运维平台,输入 IP 地址,一键完成部署。

功能:添加容天自主开发模块,比如 TPE、贝叶斯随机网络,使深度学习的入门更简单,使用更方便,采用 CaffeOnSpark 和 TensorflowOnSpark 分布式神学习框架,功能更丰富。


管理

实时监控计算节点状态,管理员用户有绝对权限分配数据中心资源池的资源。


上一篇:暂无