本文版權(quán)為《郵電設(shè)計(jì)技術(shù)》所有,如需轉(zhuǎn)載請(qǐng)聯(lián)系《郵電設(shè)計(jì)技術(shù)》編輯部
摘 要:針對(duì)復(fù)雜場(chǎng)景下輸電線路可視化監(jiān)控中目標(biāo)識(shí)別準(zhǔn)確率不高、誤檢誤報(bào)率較高的問題,提出了一種結(jié)合大模型的數(shù)據(jù)擴(kuò)增和 YOLOv10優(yōu)化算法來(lái)提升復(fù)雜場(chǎng)景下目標(biāo)識(shí)別準(zhǔn)確率的實(shí)現(xiàn)方法。首先,針對(duì)樣本數(shù)據(jù)數(shù)量短缺的問題,基于Stable-diffusion大模型進(jìn)行數(shù)據(jù)擴(kuò)增,豐富并增加了樣本數(shù)量。其次,針對(duì)訓(xùn)練樣本數(shù)量有限的情況,對(duì)YOLOv10算法進(jìn)行改進(jìn),進(jìn)一步強(qiáng)化圖片特征的提取算法,優(yōu)化目標(biāo)識(shí)別算法,提升復(fù)雜自然場(chǎng)景下的目標(biāo)識(shí)別準(zhǔn)確率及性能。最終的實(shí)驗(yàn)結(jié)果表明,與現(xiàn)有的實(shí)現(xiàn)方法相比,針對(duì)復(fù)雜場(chǎng)景的輸電線路的可視化監(jiān)控,對(duì)目標(biāo)識(shí)別的準(zhǔn)確率從原有的52.6%提升至54.3%。
關(guān)鍵詞:數(shù)據(jù)擴(kuò)增;目標(biāo)識(shí)別;YOLO
doi:10.12045/j.issn.1007-3043.2024.09.006
概述
輸電線路的可視化監(jiān)控是保障電網(wǎng)安全運(yùn)行的重要手段。通過在電力桿塔上架裝智能攝像頭,對(duì)輸電線路的環(huán)境安全、電力作業(yè)安全等進(jìn)行實(shí)時(shí)、遠(yuǎn)程和智能的監(jiān)控,這種方式已經(jīng)在電網(wǎng)運(yùn)營(yíng)企業(yè)中進(jìn)行了大規(guī)模的應(yīng)用,并取得了不錯(cuò)的效果,可以顯著提高輸電線路的安全性和運(yùn)維效率。然而,由于自然場(chǎng)景的復(fù)雜性,現(xiàn)有方案存在目標(biāo)識(shí)別的準(zhǔn)確性不高和及時(shí)性不夠的問題,誤撿、漏檢現(xiàn)象時(shí)有發(fā)生。例如,在復(fù)雜自然場(chǎng)景下,挖掘機(jī)在輸電走廊附近進(jìn)行作業(yè),受樹木、建筑等物體的遮擋,或者攝像頭拍攝角度的影響,無(wú)法及時(shí)識(shí)別出挖掘機(jī)對(duì)輸電線路安全運(yùn)行造成的潛在危害。產(chǎn)生這種問題的原因在于,這種智能視覺實(shí)現(xiàn)方案通; YOLO 等深度學(xué)習(xí)模型,通過大量的標(biāo)注圖片進(jìn)行模型訓(xùn)練,形成最終的推理模型和算法。
國(guó)內(nèi)外的許多學(xué)者對(duì)基于深度學(xué)習(xí)的電力線路監(jiān)測(cè)技術(shù)都有過深入的研究,文獻(xiàn)[1]提出了新模型YOLO-2MCS 用于輸電線路走廊隱患目標(biāo)檢測(cè),并使用混合數(shù)據(jù)增強(qiáng)策略對(duì)數(shù)據(jù)集進(jìn)行有效擴(kuò)充;文獻(xiàn)[2]提出一種基于改進(jìn)型目標(biāo)檢測(cè)算法(YOLO v3)的絕緣子異物檢測(cè)方法,在實(shí)現(xiàn)中首先使用視頻分割算法和背景替換的方式對(duì)樣本數(shù)據(jù)進(jìn)行了擴(kuò)增;文獻(xiàn)[3]從近10年來(lái)基于深度學(xué)習(xí)的輸電線路視覺檢測(cè)方法的研究進(jìn)展出發(fā),首先概述適用于輸電線路巡檢的深度卷積神經(jīng)網(wǎng)絡(luò),接著重點(diǎn)闡述基于深度卷積神經(jīng)網(wǎng)絡(luò)的輸電線路巡檢圖像數(shù)據(jù)的目標(biāo)檢測(cè),最后指出基于深度學(xué)習(xí)的輸電線路巡檢圖像數(shù)據(jù)視覺檢測(cè)方法目前存在樣本均衡性、小目標(biāo)檢測(cè)等方面的問題。文獻(xiàn)[4]對(duì)基于計(jì)算機(jī)視覺和深度學(xué)習(xí)的電力線路巡檢方案及數(shù)據(jù)來(lái)源問題進(jìn)行了總結(jié)和回顧,提出了一種新的基于自主視覺的電力線路巡檢概念。綜上,在基于深度學(xué)習(xí)的電力線路監(jiān)控和巡檢應(yīng)用中,研究人員始終面臨著如下挑戰(zhàn):樣本數(shù)據(jù)獲取困難,由于電網(wǎng)運(yùn)營(yíng)安全性要求很高,管理措施也比較嚴(yán)格,加之這種影響電網(wǎng)安全的作業(yè)行為并不經(jīng)常發(fā)生,所以很難獲取到大量的訓(xùn)練樣本數(shù)據(jù)來(lái)訓(xùn)練模型;復(fù)雜場(chǎng)景下的目標(biāo)識(shí)別問題,包括復(fù)雜的自然場(chǎng)景下電力線路危害監(jiān)測(cè)和預(yù)警,以及電網(wǎng)小目標(biāo)識(shí)別問題,如絕緣子粉化、小金具銹蝕、導(dǎo)線斷股、M銷松動(dòng)等。
針對(duì)訓(xùn)練樣本數(shù)據(jù)短缺的問題,現(xiàn)有方案通常采用數(shù)據(jù)擴(kuò)增的方法來(lái)改進(jìn)[5-12]。文獻(xiàn)[5]采用光照變換、噪聲變換、旋轉(zhuǎn)變換、平移變換等傳統(tǒng)圖像處理方法來(lái)對(duì)原始樣本數(shù)據(jù)集進(jìn)行擴(kuò)充,文獻(xiàn)[6]采用生成對(duì)抗網(wǎng)絡(luò)技術(shù)來(lái)進(jìn)行數(shù)據(jù)擴(kuò)增,文獻(xiàn)[7-8]通過圖像的鏡像、翻轉(zhuǎn),以及改變?cè)紙D像的大小、亮度和模糊度來(lái)擴(kuò)增訓(xùn)練數(shù)據(jù)集;文獻(xiàn)[9-10]通過調(diào)整圖像的飽和度、曝光度和色調(diào)來(lái)生成更豐富的樣本。文獻(xiàn)[11]使用去噪擴(kuò)散概率模型提取出域外數(shù)據(jù)中的背景知識(shí),將電力設(shè)備在真實(shí)樣本中的位置知識(shí)遷移到背景知識(shí),從而生成具有較復(fù)雜背景的人工圖像。
以上這些數(shù)據(jù)擴(kuò)增的實(shí)現(xiàn)方法,總體上可以分為2類,一類是基于傳統(tǒng)圖像處理的數(shù)據(jù)擴(kuò)增技術(shù),另一類是基于深度學(xué)習(xí)網(wǎng)絡(luò)的數(shù)據(jù)庫(kù)擴(kuò)增。本文將針對(duì)電力復(fù)雜場(chǎng)景下的目標(biāo)識(shí)別問題,提出一種基于大模型內(nèi)容生成技術(shù)的數(shù)據(jù)擴(kuò)增方法,同時(shí),針對(duì)這些包含真實(shí)樣本數(shù)據(jù)和擴(kuò)增生成數(shù)據(jù)的復(fù)雜場(chǎng)景下的目標(biāo)識(shí)別,改進(jìn) YOLOv10 算法,從而提升了目標(biāo)識(shí)別的準(zhǔn)確性。