AI算力池化與動態資源調度軟件需求說明_第1頁
AI算力池化與動態資源調度軟件需求說明_第2頁
AI算力池化與動態資源調度軟件需求說明_第3頁
AI算力池化與動態資源調度軟件需求說明_第4頁
AI算力池化與動態資源調度軟件需求說明_第5頁
已閱讀5頁,還剩18頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

AI算力池化與動態資源調度軟件需求說明1、貨物清單明細序號貨物名稱(標的名稱)數量單位1模型管理軟件1套2監控運維軟件1套3資源管理軟件1套4統一管理軟件1套5數據管理軟件1套6智能調度軟件1套7GPU池化軟件58節點8作業管理軟件1套9用戶管理軟件1套2、技術要求序號貨物名稱技術要求1模型管理軟件1.1預置模型:為滿足不同用戶在各類場景下的多樣化需求,提供至少20個預置模型,涵蓋圖像類與自然語言類。圖像類預置模型(不少于10個)?圖像分類模型:能夠對各種類型的圖像進行快速準確的分類,涵蓋人物、動物、植物、風景、建筑、交通工具等多個常見類別。無論是識別照片中的花卉品種,還是區分不同風格的建筑,該模型都能展現出卓越的性能。?目標檢測模型:專注于在復雜圖像背景中精準定位和識別特定目標物體。例如,在安防監控領域,可準確檢測出人員、車輛等目標的位置;在工業質檢中,能快速發現產品表面的缺陷或瑕疵。?語義分割模型:可將圖像中的每個像素都分配到對應的語義類別中,實現對圖像內容的精細理解。在醫學影像分析中,有助于醫生準確識別病變區域;在城市規劃中,可用于對城市土地利用類型的劃分。?圖像生成模型:基于給定的條件或隨機噪聲,生成具有高度逼真度和多樣性的圖像。在藝術創作、廣告設計等領域具有重要應用價值,能夠為用戶提供豐富的創意靈感和素材。?圖像超分辨率模型:通過先進的算法技術,將低分辨率圖像轉換為高分辨率圖像,顯著提升圖像的清晰度和細節表現力。在安防監控、衛星遙感等領域,可幫助用戶獲取更清晰的圖像信息。?圖像風格轉換模型:能夠將一種風格的圖像轉換為另一種風格,如將普通照片轉換為梵高風格的畫作。這一模型在藝術創作、文化傳承等方面具有獨特的應用優勢。?圖像修復模型:針對受損、殘缺或模糊的圖像,利用先進的修復算法進行自動修復和還原,恢復圖像的原始面貌。在文物保護、老照片修復等領域發揮著重要作用。?3D圖像重建模型:從二維圖像或多視角圖像數據中重建出三維模型,為虛擬現實、增強現實、建筑設計等領域提供強大的支持。例如,在建筑設計中,可根據建筑圖紙和照片快速生成逼真的三維建筑模型。?圖像檢索模型:通過提取圖像的特征信息,實現快速、準確的圖像檢索功能。用戶可以通過上傳一張圖片,在海量圖像庫中找到與之相似的圖像,廣泛應用于圖像搜索引擎、版權保護等領域。?醫學圖像分析模型:專門針對醫學領域的圖像數據,如X光、CT、MRI等,進行疾病診斷、病變檢測和分析。輔助醫生更準確地判斷病情,提高醫療診斷的效率和準確性。?遙感圖像分析模型:用于處理和分析遙感衛星獲取的圖像數據,實現對地球表面資源、環境、災害等的監測和評估。在農業、林業、水利、氣象等領域具有廣泛的應用前景。自然語言類預置模型(不少于10個)?文本分類模型:能夠對各種類型的文本進行自動分類,如新聞報道、社交媒體評論、學術論文等。可按照主題、情感傾向、領域等多個維度進行分類,幫助用戶快速篩選和整理大量文本信息。?情感分析模型:深入分析文本中的情感色彩,判斷其是積極、消極還是中性。在社交媒體監測、市場調研、客戶服務等領域具有重要應用價值,能夠幫助企業了解用戶的情緒和需求。?命名實體識別模型:從文本中準確識別出各類命名實體,如人名、地名、組織機構名、日期、時間等。在信息檢索、知識圖譜構建等領域發揮著關鍵作用,為用戶提供更精準的信息提取和分析服務。?關鍵詞提取模型:自動從文本中提取出最具代表性和重要性的關鍵詞,幫助用戶快速了解文本的核心內容和主題。在搜索引擎優化、文本摘要生成等方面具有重要應用。?文本摘要生成模型:根據給定的文本,自動生成簡潔明了的摘要,保留文本的核心信息和關鍵觀點。在新聞報道、學術論文處理等領域,能夠幫助用戶快速獲取文本的要點,提高信息獲取的效率。?機器翻譯模型:實現不同語言之間的自動翻譯,支持多種語言對的互譯。無論是日常交流、商務合作還是學術研究,都能為用戶提供便捷、高效的翻譯服務。?問答系統模型:能夠理解用戶提出的自然語言問題,并根據知識庫或相關數據源提供準確的答案。在智能客服、在線教育、智能助手等領域具有廣泛應用,為用戶提供便捷的信息查詢和解答服務。?對話生成模型:模擬人類對話的方式,根據用戶輸入的文本生成自然流暢、符合語境的回復。在聊天機器人、智能客服等應用場景中,為用戶提供更加智能、友好的交互體驗。?文本生成模型:根據給定的提示或主題,自動生成自然語言文本,如新聞報道、故事創作、詩歌寫作等。在內容創作、廣告營銷等領域具有重要的應用價值,能夠幫助用戶快速生成高質量的文本內容。?語義角色標注模型:分析文本中各個詞語的語義角色,如主語、謂語、賓語、修飾語等,深入理解文本的語義結構和含義。在自然語言處理的基礎研究和應用開發中具有重要作用,為其他任務提供更準確的語義信息支持。?語言模型微調模型:基于大規模預訓練語言模型,針對特定領域或任務進行微調優化,以提高模型在特定場景下的性能和效果。在醫療、法律、金融等專業領域,能夠為用戶提供更加專業、精準的語言處理服務。1.2模型版本管理與維護:支持,包括包括模型大小、創建時間、模型描述、參數信息和模型來源等信息維護。1.3模型自動評估:提供至少4種指標自動化評估方式,包括評估指標如準確度(ACC)、F1評分、精確度(Precision)、召回率(Recall)。1.4模型共享:支持模型在不同租戶和用戶之間實現共享,以滿足多樣化的業務需求和提升資源利用效率。多租戶環境下的共享機制?租戶級別的共享策略:在多租戶架構中,系統為每個租戶提供了獨立的運行空間和數據隔離機制,同時允許管理員根據租戶的業務需求和權限設置,靈活配置模型的共享策略。例如,對于一些通用的基礎模型,如文本分類模型、圖像識別基礎模型等,管理員可以選擇將其設置為跨租戶共享模式,使得不同租戶的用戶都能夠使用這些模型進行相應的任務處理,從而提高模型的利用率,降低各租戶的使用成本。?細粒度的訪問控制:為了確保數據安全和隱私,系統在實現模型共享的過程中,引入了細粒度的訪問控制機制。即使模型在不同租戶之間共享,每個租戶仍然可以對其內部用戶的訪問權限進行精確控制。例如,租戶A的管理員可以根據用戶角色和業務需求,為部分用戶授予對特定共享模型的只讀權限,而另一些用戶則可能被賦予讀寫權限,以便他們能夠根據實際業務情況對模型進行微調或優化。這種細粒度的訪問控制機制有效地保障了各租戶的數據安全性和業務獨立性。用戶層面的共享功能實現?用戶間的模型共享協作:除了租戶級別的共享,系統還支持用戶之間的模型共享與協作。在一個租戶內部,不同用戶可能具有不同的專業背景和技能水平,通過模型共享功能,經驗豐富的用戶可以將自己創建或優化好的模型分享給其他同事,促進團隊成員之間的知識交流和技術協作。例如,在一個數據分析團隊中,數據科學家可以將其訓練好的深度學習模型共享給其他分析師,使得他們能夠利用該模型進行更深入的數據分析和挖掘工作,提高整個團隊的工作效率。?個性化的共享設置:為了滿足用戶在不同場景下的個性化需求,系統提供了豐富的共享設置選項。用戶可以根據自己的意愿選擇共享模型的范圍、權限和使用期限等。例如,用戶A可以將自己創建的一個特定領域的預測模型共享給用戶B,并設置該模型僅在一個月內可供用戶B使用,且用戶B只能進行查詢操作,不能對模型進行修改和刪除。這種個性化的共享設置方式為用戶提供了更大的靈活性和控制權,使得模型共享更加符合實際業務需求。共享過程中的安全保障與性能優化?數據加密與隱私保護:在模型共享過程中,系統采用了先進的數據加密技術,對模型的參數、權重等關鍵信息進行加密處理,確保模型在傳輸和共享過程中的數據安全性。同時,結合嚴格的隱私保護策略,防止模型在使用過程中泄露敏感信息。例如,在跨租戶共享模型時,系統會對模型的數據進行加密傳輸,并在接收端進行解密和驗證,只有經過授權的用戶才能訪問和使用模型,有效保障了各租戶的數據隱私。?性能優化與資源管理:為了確保模型在不同租戶和用戶之間共享時的性能穩定性和高效性,系統進行了深度的性能優化和資源管理。通過智能的資源調度算法,根據模型的復雜度、用戶的使用頻率以及系統的負載情況,動態分配計算資源和存儲資源,避免因資源共享導致的性能瓶頸。例如,當多個用戶同時請求使用同一個共享模型時,系統會根據用戶的優先級和當前系統資源狀況,合理分配計算資源,確保每個用戶都能夠獲得及時、高效的模型服務。1.5模型資源彈性擴縮容:支持。1.6模型周期管理:提供模型的各個生命周期階段,為用戶提供模型的創建、刪除、修改和查詢界面,以及在線服務能力的新增、刪除、伸縮等操作的界面。1.7模型一鍵部署:支持。1.8NPU設備上進行Pytorch模型推理的資源占用率:不低于95%。1.9NPU設備上進行Tensorflow模型推理的資源占用率:不低于95%。具體而言,在整個推理過程中,NPU設備的各類關鍵資源,包括但不限于計算單元、緩存、內存帶寬等,都應被充分調動和利用起來,使得這些資源的實際占用情況穩定且持續地維持在一個較高的比例區間,即不低于整體可用資源的95%。這意味著在進行Pytorch模型推理時,NPU設備需要以接近滿負荷的高效運行狀態來處理模型相關的計算任務,充分利用其硬件性能優勢,以實現快速且準確的推理結果輸出,同時最大程度地發揮NPU設備在深度學習模型推理方面的效能,減少因資源閑置而可能導致的性能損耗和時間浪費。2監控運維軟件2.1預置模型的的測試工具和評測結果。2.2總體資源統計:支持集群算力的使用量和可用量的統計。2.3作業的資源使用情況統計:支持設定統計周期,對用戶的作業的GPU使用情況進行統計。2.4用戶資源自動釋放策略:管理員可設定用戶資源使用率閾值與統計周期,當前用戶的資源利用率在統計周期內低于閾值,該用戶資源將被自動掛起并釋放資。2.5單AI作業資源:支持作業資源使用率的統計和收集。具體而言,對于計算資源,如CPU核心的使用率,系統能夠以精細的時間粒度進行監測和記錄,精確統計出每個作業在不同時間段內占用CPU核心的比例,以及多個作業并發運行時CPU資源的分配和消耗情況。對于內存資源,系統可以詳細追蹤每個作業在運行過程中對內存的占用量變化,包括初始內存分配、內存增長以及最終的釋放情況,從而全面了解作業對內存資源的使用效率。除了計算和內存資源,系統還能對存儲資源的使用率進行有效的統計和收集。它可以實時監控作業在讀寫數據過程中對磁盤I/O的占用情況,記錄數據的讀寫速度、讀寫量以及磁盤尋道時間等信息,以此評估作業對存儲資源的依賴程度和使用效率。同時,對于網絡資源,系統能夠監測作業在數據傳輸過程中的網絡帶寬占用情況,包括上傳和下載的速度、數據流量大小等,以便分析作業在網絡通信方面的資源消耗情況。在統計和收集作業資源使用率的過程中,系統采用了先進的技術手段和算法,確保數據的準確性和實時性。通過對大量作業運行數據的持續收集和分析,不僅可以為系統管理員提供詳細的資源使用報告,幫助他們了解系統的整體運行狀況和資源分配情況,還能為作業調度和優化提供有力的數據支持。例如,根據作業資源使用率的統計結果,系統可以自動調整作業的優先級和資源分配策略,以提高系統資源的利用率和作業的執行效率。2.6資源節點性能監控:支持節點維度的監控,包括CPU、memory、GPU算力和顯存、網絡、磁盤I/O等性能的監控和收集。2.7運行穩定性:不低于99%。2.8支持最大并發任務數:不低于200。2.9頁面響應時間:不高于1s。2.10租戶安全隔離:支持。2.11租戶算力時消耗達到預警閾值時,對租戶管理員郵件告警。2.12用戶配額達到上限閾值時,對用戶郵件告警。2.13系統高級資源如GPU耗盡時,對系統管理員進行郵件告警。2.14針對容器作業使用的高級資源如GPU,如資源周期使用率低于閾值,對作業進行自動告警并關停。3資源管理軟件3.1國產異構芯片兼容:支持包含華為昇騰在內的不少于三種國產異構加速卡的管理與任務調度。3.2模型訓練與預測:支持至少五種CPU、GPU、NPU等異構AI計算芯片的模型訓練與預測。3.3專有資源池管理:支持提供專屬和共享資源池,實現異構資源的池化管理,能夠高效地實現異構資源的池化管理,滿足不同用戶在多樣化場景下的復雜需求。專屬資源池?定制化資源分配:專屬資源池是為特定用戶、項目或業務單元量身定制的獨立資源集合。根據用戶的特定需求和業務特點,系統可以為其分配專屬的計算資源(如特定型號的CPU、GPU等)、存儲資源(如大容量的高速硬盤、固態硬盤陣列等)以及網絡資源(如獨立的網絡帶寬、專用的IP地址段等)。這種定制化的資源分配方式確保了用戶在運行關鍵業務或對資源有特殊要求的任務時,能夠獲得穩定、可靠的資源保障,不受其他用戶或業務的干擾。?安全隔離保障:專屬資源池在物理和邏輯層面都實現了嚴格的安全隔離。從物理層面來看,通過獨立的硬件設備或服務器集群來構建專屬資源池,確保不同用戶的資源在硬件層面上相互獨立,避免因硬件故障或其他用戶的操作失誤而影響到自身業務的正常運行。在邏輯層面,采用先進的訪問控制技術和安全策略,對專屬資源池的訪問進行嚴格的身份認證和授權管理,只有經過授權的用戶才能訪問和使用專屬資源池中的資源,從而有效保障了數據的安全性和隱私性。?性能優化與定制服務:針對專屬資源池的特點和用戶需求,系統可以進行深度的性能優化和定制化服務。例如,根據用戶業務的特點和負載模式,對資源池中的硬件設備進行針對性的配置和調優,以提高系統的整體性能和響應速度。同時,還可以為用戶提供定制化的軟件環境和工具集,滿足用戶在特定領域的專業需求,進一步提升用戶在專屬資源池上的業務處理能力和效率。共享資源池?資源的高效利用:共享資源池是一種將多種異構資源集中管理和分配的模式,旨在實現資源的高效利用和共享。在共享資源池中,不同用戶可以根據自己的需求動態地申請和使用資源池中的各種資源,包括計算資源、存儲資源和網絡資源等。系統通過智能的資源調度算法和負載均衡機制,根據用戶的需求和資源的使用情況,自動分配和調整資源,確保資源能夠在不同用戶之間得到合理的分配和利用,避免資源的閑置和浪費。?靈活的資源調配:共享資源池具有高度的靈活性和可擴展性,能夠根據用戶的業務需求和系統負載情況,動態地調整資源的分配和配置。例如,當某個用戶的業務負載突然增加時,系統可以自動從共享資源池中調配更多的計算資源和存儲資源給該用戶,以滿足其業務需求;當業務負載降低時,系統又可以將多余的資源釋放回資源池,供其他用戶使用。這種靈活的資源調配機制使得共享資源池能夠適應不同用戶的多樣化需求,提高資源的利用率和系統的整體性能。?多用戶協同與資源共享:共享資源池為多個用戶提供了一個協同工作和資源共享的平臺。不同用戶可以在共享資源池中共同使用各種資源,開展合作項目和業務活動。通過資源共享,用戶可以充分利用其他用戶的閑置資源,降低自身的成本投入;同時,也可以將自己的閑置資源提供給其他用戶使用,實現資源的互利共享。這種多用戶協同和資源共享的模式不僅有助于提高資源的利用效率,還能夠促進不同用戶之間的交流與合作,推動業務的發展和創新。異構資源的池化管理?統一管理與調度:異構資源池化管理是指將不同類型、不同規格的資源(如不同型號的CPU、GPU、存儲設備等)整合到一個統一的資源池中進行管理和調度。系統通過建立統一的資源管理模型和接口,對異構資源進行抽象和封裝,使得不同類型的資源在資源池中具有統一的表示和管理方式。這樣,用戶在使用資源時無需關注資源的具體類型和規格,只需要根據自己的需求向資源池申請相應的資源即可,系統會自動根據資源的實際情況進行分配和調度,大大簡化了資源管理的復雜性。?智能適配與優化:在異構資源池化管理過程中,系統具備智能適配和優化的能力。由于不同類型的資源具有不同的性能特點和適用場景,系統會根據用戶提交的任務需求和資源池中各類資源的實際情況,自動選擇最適合的資源來滿足用戶的任務需求。例如,對于計算密集型任務,系統會優先分配高性能的CPU或GPU資源;對于存儲密集型任務,則會分配大容量、高讀寫速度的存儲資源。同時,系統還會根據資源的實時使用情況和性能變化,動態調整資源的分配和配置,以確保任務能夠在最優的資源環境下運行,提高任務的執行效率和性能。?資源監控與維護:為了確保異構資源池的穩定運行和高效利用,系統還提供了全面的資源監控和維護功能。通過對資源池中的各類資源進行實時監測和分析,系統可以及時發現資源的異常情況和潛在問題,并采取相應的措施進行處理。例如,當某個硬件設備出現故障時,系統會自動報警并嘗試進行故障恢復;當資源的使用率過高或過低時,系統會及時調整資源的分配策略,以保證資源的合理利用和系統的穩定運行。此外,系統還會定期對資源進行維護和更新,確保資源的性能和安全性始終保持在最佳狀態。3.4集群管理虛擬環境GPU集群支持集成anaconda管理虛擬環境,內置python開發環境jupyter,可立即啟動在線開發程序,并向下計算節點進行分發任務。3.5算力計量管理:支持算力卡時計量。3.6性能優化的復雜度分析工具:支持。3.7資源共享:支持。3.8資源切分:支持對一張GPU卡,切分不同粒度,1/2,1/4,1/8,1/16,1/32。3.9資源監控日志:保留180天日志服務和180天資源監控指標。3.10動態指定運行節點:支持。3.11計算資源碎片優化:支持。3.12計算資源碎片優化:支持。4統一管理軟件4.1建設以算力池化為基礎的AI算力池化與動態資源調度平臺,實現計算、數據、模型等更多能力的內網共享使用。算力池化基礎建設?異構算力資源整合:平臺將廣泛匯聚各種不同類型、不同規格的計算資源,包括CPU、GPU、FPGA等,形成一個龐大且豐富的算力資源池。通過底層的硬件抽象和適配技術,將這些異構算力資源進行統一的抽象和封裝,屏蔽掉硬件差異,使得上層應用能夠以統一的方式對這些資源進行訪問和使用。例如,對于一個深度學習訓練任務,平臺能夠根據任務的具體需求和算力資源的實時狀態,自動從算力池中選擇合適的GPU和CPU資源進行組合分配,以實現最佳的計算性能。?算力資源的動態分配與優化:算力池化不僅僅是簡單的資源集合,更重要的是實現資源的動態分配和優化。平臺將引入智能的資源調度算法和負載均衡機制,實時監測各任務的計算需求和算力資源的使用情況。根據這些信息,系統能夠動態地調整算力資源的分配,將閑置的計算資源及時分配給有需求的任務,避免資源的閑置和浪費。同時,通過對算力資源的合理調配,提高整個平臺的計算效率,降低任務的執行時間。例如,在業務高峰期,當大量AI任務同時提交時,平臺能夠自動根據任務的優先級和計算復雜度,合理分配算力資源,確保重要任務能夠得到優先處理,同時整體任務的處理效率也能得到保障。數據共享與管理?安全的數據共享機制:數據是人工智能的核心要素之一,平臺將建立一套安全、高效的數據共享機制,實現數據在內網環境下的共享使用。首先,通過嚴格的數據訪問控制和身份認證機制,確保只有授權的用戶和應用程序能夠訪問和使用特定的數據資源。其次,采用數據加密技術對敏感數據進行加密處理,防止數據在傳輸和共享過程中被竊取或篡改。同時,為了提高數據的可用性,平臺將提供數據緩存、數據預取等功能,減少數據的訪問延遲,提高數據的讀取速度。?數據的規范化與標注:為了更好地支持AI模型的訓練和應用,平臺將對共享的數據進行規范化處理和標注。建立統一的數據格式和標注規范,對不同來源的數據進行清洗、轉換和標注,提高數據的質量和一致性。同時,通過數據質量管理工具,對數據進行質量監測和評估,及時發現和解決數據中存在的問題,確保數據的準確性和可靠性。經過規范化與標注的數據能夠為AI模型的訓練提供更優質的素材,提高模型的性能和準確性。模型共享與優化?模型的集中存儲與管理:模型是人工智能應用的核心資產,平臺將建立模型庫,實現對各種AI模型的集中存儲和管理。模型庫將支持多種常見的模型格式和框架,方便用戶上傳、下載和共享自己開發的模型。同時,為了方便模型的管理,平臺將提供模型的版本控制、元數據管理等功能,記錄模型的創建時間、開發者、參數配置等信息,便于用戶對模型進行追溯和管理。?模型的動態加載與優化:在模型使用過程中,平臺將支持模型的動態加載和優化。根據業務需求和任務特點,系統能夠自動從模型庫中選擇合適的模型,并將其加載到計算資源上進行運行。同時,通過對模型的性能監測和分析,平臺將提供模型優化功能,如模型壓縮、量化、剪枝等,降低模型的計算成本和存儲需求,提高模型的運行效率。此外,平臺還將支持模型的在線更新和升級,確保模型能夠適應不斷變化的業務環境和數據分布。動態資源調度平臺功能?實時資源監測與分析:動態資源調度平臺將具備強大的實時資源監測和分析能力,通過對算力、數據、模型等資源的實時監測,獲取各資源的運行狀態、使用情況等關鍵指標。基于這些數據,平臺將運用數據分析和挖掘技術,對資源的使用趨勢進行分析和預測,為資源的調度和優化提供決策依據。例如,通過對歷史數據的分析,預測不同時間段的業務需求,提前調整算力資源的分配,以應對業務的波動。?智能的任務調度策略:根據實時資源監測和分析的結果,平臺將制定智能的任務調度策略。任務調度策略將綜合考慮任務的優先級、計算復雜度、資源需求等因素,合理分配算力、數據和模型等資源,確保任務能夠高效、穩定地運行。例如,對于高優先級的實時任務,平臺將優先分配充足的計算資源,確保任務能夠在規定的時間內完成;對于一些批處理任務,平臺將根據資源的空閑情況進行合理安排,提高資源的利用率。?資源彈性伸縮與管理:為了應對業務的突發變化和資源的動態需求,動態資源調度平臺將支持資源的彈性伸縮。當業務需求增加時,平臺能夠自動從算力池中調用閑置的資源,滿足任務的運行需求;當業務需求減少時,平臺將自動釋放多余的資源,避免資源的浪費。同時,平臺將提供資源管理的功能,允許用戶根據自身的需求靈活調整資源的配置和使用策略,實現資源的最優配置。通過建設以算力池化為基礎的AI算力池化與動態資源調度平臺,實現計算、數據、模型等更多能力的內網共享使用,將為AI應用的發展提供有力的支持,推動各行業的技術創新和業務升級。4.2教學實訓作業資源和科研資源自定義配置:支持。4.3教學實訓作業資源和科研資源隔離:支持。4.4具備AI作業的自動分發和自適應調度能力,GPU利用率實現50%以上。4.5容災策略:支持三節點以上容災策略,系統管理節點可分批關機維護。4.6系統時鐘同步:支持。5數據管理軟件5.1數據標注:支持四種標注方式,分類、標框、區域、標點。5.2支持用戶創建、注冊、管理模型和數據集。5.3數據集隱私設置:支持。5.4提供數據傳輸能力,支持用戶以文件和目錄形式在本地導入導出數據。5.5數據集版本管理:支持。5.6支持系統創建預置模型和數據集。5.7數據預覽:支持用戶通過目錄掛載方式在容器作業中調用公開數據以及編輯個人數據。5.8數據源管理:提供2種以上數據源管理。6智能調度軟件6.1作業優先級等級:支持高、中、低不同等級作業。6.2集群調度策略:支持集群親和性和反親和性策略,可以優化特定類型作業的分配。6.3作業調度策略:實現多種調度策略,包括FIFO(先進先出)、公平調度、能力調度、批調度、重調度,以滿足不同場景下的調度需求。6.4作業依賴配置:支持。6.5作業任務排隊:支持任務排隊和調度,同時提供查看訓練任務詳情的功能,包括任務的基本信息和訓練進展等。6.6總體算力資源平衡:提供算力資源的性能評分機制,考慮處理能力、能耗效率等因素。6.7資源均衡:提供算力資源的彈性伸縮能力,適應突發計算需求。6.8調度配置:支持細粒度資源條件調度,包括作業配置節點屬性、節點親和性和反親和性等條件,以滿足特定的資源需求。6.9資源調度能力:提供二級調度能力,支持多集群場景,使作業可以智能跨集群調度。6.10資源標簽化:支持。6.11資源動態調整:支持。6.12專用資源配置:支持。6.13智能調度:支持根據任務、資源情況智能調度適配的資源上。6.14系統響應:頁面響應時間需要小于500ms。6.15作業遷移時間:不超過3分鐘。6.16分布式訓練:支持,支持一機多

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論