靈雀云云原生解決方案白皮書
靈雀云ACP 5G專網解決方案
靈雀云云原生技術轉型參考設計
英特爾? 精選開源云解決方案
查看所有內容
云原生技術落地調研報告-央國企
云原生技術落地調研報告-金融篇
傳統企業云原生落地調研報告
第4期傳統行業云原生調研報告
第3期傳統行業云原生調研報告
第2期傳統行業云原生調研報告
第1期傳統行業云原生調研報告
查看所有內容
企業高管IT戰略指南-平臺工程
企業應用現代化行動指南
企業高管IT戰略指南-微服務
企業高管IT戰略指南-DevOps
企業高管IT戰略指南-容器與K8s
查看所有內容
云原生標準體系白皮書
云原生安全和使用報告
云原生安全現狀報告
央國企-云原生技術實踐案例匯編
央國企云原生落地實用指南
金融-云原生技術實踐案例匯編
云原生安全和使用報告
金融云原生落地實用指南
查看所有內容
Kubeflow-chart是一款由靈雀云自主研發的開源MLOps 工具,它可以簡化開源Kubeflow在Kubernetes上部署的步驟,幫助企業免去調研、部署、運維、 應用遷移、應用適配等成本,極大程度地降低企業應用Kubeflow的成本。
Kubeflow-chart使用Helm Chart方式定制了Kubeflow的安裝方式,使用一個命令 (helm install) 即可完成Kubeflow和其依賴組件的安裝,包括dex, cert-manager, istio, knative-serving 等。
此外,Kubeflow-chart將常見的配置項,如鏡像地址,認證配置信息,默認賬戶,依賴組件安裝開關等常用配置項抽出,只需要更改values.yaml文件, 即可完成kubeflow對不同K8s環境完成部署,同時提供values-cn.yaml免去在國內開發者對鏡像下載的困擾。Kubeflow-chart可以幫助開發者輕松實 現在Kubernetes上快速方便地部署、學習、使用、管理當前最流行的機器學習軟件。
靈雀云云原生MLOps以及其開源工具kubeflow-chart,致力于最大程度地降低企業應用AI能力的門檻,使企業獲得高效、低成本、規范化、可追溯的AI應用開發以及上線流程,幫助企業快速應用云原生機器學習技術,構建高效、穩定、可擴展的MLOps平臺。
靈雀云云原生MLOps相較于其他MLOps開源工具,具備以下亮點:
●非侵入開發模式:支持非侵入式的、可視化的工作流編排開發環境,不需要改造原先工程代碼即可應用MLOps能力。 可視化分布式:支持在可視化工作流開發時,直接配置多種形式的分布式訓練 多租戶和配額:和ACP聯動的可視化多租戶資源配額(CPU, GPU, vGPU)管理能力
●虛擬GPU:支持使用GPUManager管理的虛擬GPU資源
●調度器:使用Volcano增強分布式訓練任務的調度器(支持TFJob, PytorchJob, MPIJob, 和通用 Argo 工作流) 實驗追蹤:集成MLFlow代替 Kubeflow實驗追蹤和可視化實驗比對
●數據標注:集成label studio聯動S3存儲完成可視化數據標注
●SQL訓練:集成SQLFlow ,使用SQL語言完成模型訓練和預測
●大模型:在數據存儲、分布式訓練、模型存儲等MLOps關鍵環節,支持對大模型的存儲和調用中文界面:支持中文界面
●國產硬件支持:支持 arm64 架構的各種國產CPU和部分國產GPU案例教程:內置大量中文案例和教程Notebook,快速上手
●高性能:內置IntelTensorflow,NeralCompressor,GPUManager,Triton等工具充分發揮訓練、推理的性能 高可用:支持平臺高可用,發布的推理服務高可用
企業級云原生MLOps在多種應用方向均可以發揮其功能,包括傳統數據挖掘、機器學習、深度學習,甚至超大規模語言模型、對話AI等。目前平臺包含了4個主要功能板塊:
● 數據集管理
● 機器學習開發
● 模型訓練
● 模型/推理服務
