歡迎光臨廣東廣東到啦網信息科技有限公司官方網站(zhàn)!
熱門關(guān)鍵詞: 視頻監控系統 門禁一卡通(tōng)系統 MES 弱電工程
日期:2022-11-18 閱讀數:394
11月(yuè)16日,OFweek第七屆人工智能産業(yè)大會暨行業(yè)年度頒獎典禮在深圳舉辦。深信服AIOps技術(shù)憑借在人工智能領域的實力和(hé)優勢,獲得維科杯 · OFweek 2022 人工智能行業(yè)“技術(shù)突破獎”。當天,深信服高級研發技術(shù)專家易佳受邀出席大會,發表《桌面雲場景下(xià)的AIOps技術(shù)實踐》的演講,介紹了桌面雲運維遇到的挑戰,以及如(rú)何利用AIOps簡化桌面雲運維等内容。
人工智能産業(yè)大會現場
桌面雲運維面臨諸多挑戰
近年來,桌面雲為數字化辦公提供了有力支撐。與此同時,桌面雲也容易面臨第三方軟件兼容性、藍屏、木馬、應用卡慢、響應延遲等問(wèn)題,這些問(wèn)題的背後暴露出來的可(kě)能是私有雲資(zī)源不足、硬件故障難以定位、網絡故障等深層次問(wèn)題。
桌面雲運維的挑戰
為此,深信服提出了AIOps 智能運維一體化技術(shù)方案。該方案通(tōng)過采集桌面雲的日志、鍊路(lù)和(hé)指标數據,執行故障預測、異常檢測、關(guān)聯推理等算法,為用戶提供智能分析服務。
“AIOps的數據采集引擎基于Golang實現了插件化探針,支持采集Windows、Linux、Docker等多類指标數據,可(kě)以跨平台、多應用地進行動(dòng)态采集,也支持Prometheus協議和(hé)導出,在數據采集上實現了高效和(hé)可(kě)擴展。”易佳補充。
曆經三次叠代,打造更優運維體驗
易佳介紹,随着用戶訴求和(hé)用戶體量的的不斷變化,深信服AIOps數據模型與AI框架演進了三個(gè)版本。
第一個(gè)版本适用于小規模用戶,是一套輕量級監控分析系統,支持時序數據、告警數據、統計分析和(hé)容器(qì)化部署,也支持主機、虛拟機數據采集做簡單AI分析,但是DB/存儲與業(yè)務耦合嚴重,算法效果難保障,難以支撐大規模虛拟機接入。
第二個(gè)版本是輕量級AIOps引擎,支持OpenAPI和(hé)數據統一調度,引入緩存機制,實現了存算分離(lí)。但OpenAPI、Requests Handler和(hé)Prometheus容易遇到瓶頸,導緻體驗欠佳。
從第三個(gè)版本開始,深信服打造了全棧的AIOps引擎。在該版本中(zhōng),面對數據上報的性能瓶頸問(wèn)題,抽象數據接口,實現Requests Handler負載均衡;其次是設計了投遞分級,内存磁盤雙對列的模式,為低優先級數據設立單獨通(tōng)路(lù),可(kě)以優先保障高優先級數據入庫;同時,設計了多級分表,優化了數據結構,這樣可(kě)以保留橫向擴展能力。
另外,為了平衡實時性與準确度,減少(shǎo)重複數據,AIOps可(kě)以按采集指标區分不同采集周期,例如(rú)設定10s采集一次CPU,20s采集一次memory;服務器(qì)型号、磁盤大小等靜态數據盡量隻采集一次。
最後,針對多維異構數據進行了冷(lěng)熱分層處理,冷(lěng)數據存檔供AI離(lí)線分析和(hé)模型訓練,熱數據實時監控和(hé)展示。
在AI算法方面,易佳介紹,“桌面雲AIOps算法包括基于bagging策略的分段線性回歸算法、基于網格搜索的縮擴容模型、基于資(zī)源約束算法和(hé)貪心策略的虛拟機新增模型、基于時間序列特征提取和(hé)随機森林的閑置資(zī)源識别模型等”,基于這些算法,最終形成了包含AIOps算法、AI調度決策、OpenAPI、數據管理、服務化等功能在内的AIOps基礎結構。
AIOps 實踐與落地效果
易佳表示,AIOps可(kě)以快速識别出卡慢故障等異常問(wèn)題。通(tōng)過引入50多個(gè)規則、采集800多個(gè)維度數據,實現20多個(gè)機器(qì)學習算法,診斷出30+核心卡慢場景。AIOps的監測分析能力已經能夠全方位地支撐大盤、集群、主機、虛拟機、網絡、存儲、應用軟件全棧監控與分析。
在算法效果上,桌面雲卡慢/故障異常檢測準确率達到87%。實施卡慢緩解建議後,約有47%的問(wèn)題能夠得到明顯緩解,AIOps的智能診斷能力,可(kě)以覆蓋桌面雲65%的已知資(zī)源卡慢問(wèn)題。
易佳最後總結,AIOps未來會增加更多的反饋和(hé)模型的自更新機制,實現多業(yè)務場景的覆蓋。同時,基于業(yè)務畫像和(hé)運維知識圖譜,實現精細化故障診斷,打造讓用戶滿意的産品體驗。