C114通信網(wǎng)  |  通信人家園

技術(shù)
2018/6/8 16:54

基于垃圾短信發(fā)往方向頻次流量的大數(shù)據(jù)相關(guān)性分析

C114中國(guó)通信網(wǎng)  秦保根

秦保根,男,1985年畢業(yè)于南京郵電學(xué)院電信工程系,高級(jí)工程師,享受國(guó)務(wù)院特殊津貼,中國(guó)聯(lián)通科技成果評(píng)審專家、結(jié)算專家、評(píng)標(biāo)專家,江西聯(lián)通高級(jí)經(jīng)理。

摘要:

垃圾短信紛繁多樣,給電信運(yùn)營(yíng)商的攔截帶來極大的困擾,通過基于短信發(fā)往的所屬本地網(wǎng)方向、頻次及流量的垃圾短信大數(shù)據(jù)相關(guān)性分析,解決了這一難題,供各電信運(yùn)營(yíng)商參考。

作者簡(jiǎn)介:

1.前言

根據(jù)相關(guān)資料顯示,僅有0.7%以下的用戶表示沒有收到過垃圾短信,用戶每周平均收到的垃圾短信數(shù)量為12 條。此外,電信運(yùn)營(yíng)商每月退網(wǎng)用戶中垃圾短信用戶占近一半,并造成大量欠費(fèi),尤其是后付費(fèi)用戶漫游異地后,其話單記錄需要過一定時(shí)間后,方能向其歸屬地發(fā)回賬單,造成欠費(fèi)!因此,依法治理垃圾短信,是促進(jìn)社會(huì)主義政治文明及精神文明建設(shè)、構(gòu)建和諧社會(huì)、凈化社會(huì)環(huán)境、打擊違法犯罪的必然需要,是保障人民群眾合法權(quán)益的根本使然。

垃圾短信詐騙和傳播違法短信等活動(dòng)日益猖獗,主要表現(xiàn)如下:

  • 假冒銀行或銀聯(lián)名義發(fā)送手機(jī)違法短信進(jìn)行詐騙或者敲詐勒索公私財(cái)物;
  • 散布淫穢、色情、賭博、暴力、兇殺、恐怖內(nèi)容或者教唆犯罪、傳授犯罪方法;
  • 非法銷售槍支、彈藥、爆炸物、走私車、毒品、迷魂藥、淫穢物品、假鈔、假發(fā)票或者明知是犯罪所得贓物;
  • 發(fā)布假中獎(jiǎng)、假婚介、假招聘,或者引誘、介紹他人賣淫嫖娼的;
  • 多次發(fā)送干擾他人正常生活的,以及含有其他違反憲法、法律、行政法規(guī)禁止性規(guī)定的內(nèi)容;
  • 極少數(shù)境內(nèi)外敵對(duì)勢(shì)力、敵對(duì)分子和對(duì)社會(huì)心懷不滿的人,編造、傳播一些明顯帶有誹謗、煽動(dòng)性內(nèi)容的手機(jī)違法短信,企圖破壞社會(huì)穩(wěn)定。

2.建議的技術(shù)方案

2.1以前垃圾短信防范系統(tǒng)存在的缺點(diǎn):

  • 僅通過對(duì)短信關(guān)鍵字進(jìn)行匹配識(shí)別攔截;
  • 僅對(duì)某一時(shí)段超頻發(fā)送短信的用戶進(jìn)行識(shí)別攔截。

以上方式,易造成對(duì)正常用戶的誤判,且對(duì)垃圾短信的識(shí)別量非常有限。

2.2 實(shí)施的組網(wǎng)及處理流程

為在公眾通信網(wǎng)上,提高垃圾短信判別的準(zhǔn)確率,大幅減少垃圾短信的傳送,使經(jīng)濟(jì)詐騙、垃圾廣告、不法短信傳播得到及時(shí)的甄別堵截,建議如下的垃圾短信攔截方案:

垃圾短信判別系統(tǒng)組網(wǎng)圖,如圖1所示,判斷可疑垃圾短信的流程,如圖2所示。

3.實(shí)施的主要步驟

在此,我們首先定義“可疑短信接收方向”,它是指:在某一時(shí)間段內(nèi),某A地之某一電信運(yùn)營(yíng)商發(fā)往其他異地本地網(wǎng)(Bn地)短信數(shù)量X,若大于或接近其發(fā)往所在地(A地)的本地網(wǎng)短信數(shù)量Y,則該異地本地網(wǎng)(Bn地)稱為“可疑短信接收方向”,“可疑短信接收方向”(Bn地)可能同時(shí)存在不止一個(gè),即n>=1。比如:假設(shè)南昌聯(lián)通(A)發(fā)往長(zhǎng)沙(B1)、海口(B2)、東莞(B3)所有三個(gè)運(yùn)營(yíng)商(聯(lián)通、電信及移動(dòng))的短信數(shù)量,若大于或接近其發(fā)往南昌本地三個(gè)運(yùn)營(yíng)商(聯(lián)通、電信及移動(dòng))的短信數(shù)量,則長(zhǎng)沙、?、東莞稱為“可疑短信接收方向”,如表1所示。

“可疑短信號(hào)碼”:是指可疑短信接收方向的所有發(fā)信號(hào)碼中,剔除電信運(yùn)營(yíng)商設(shè)定的白名單號(hào)碼和吉祥號(hào)碼后的發(fā)信號(hào)碼。

具體來說:參照?qǐng)D1所示的可疑短信判別系統(tǒng)組網(wǎng)圖,按照?qǐng)D2所示的判斷可疑垃圾短信的流程,除重大節(jié)日:如春節(jié)、元宵、端午、中秋、國(guó)慶、元旦、五一、圣誕平安、情人節(jié)、父親節(jié)、母親節(jié)等外,垃圾短信分析判別服務(wù)器的短信話單采集模塊,從短信中心采集短信話單,統(tǒng)計(jì)分析及判別模塊分析某一個(gè)或多個(gè)時(shí)間段內(nèi)超頻發(fā)信號(hào)碼的可疑短信接收方向及其可疑短信號(hào)碼,對(duì)可疑垃圾短信方向發(fā)信號(hào)碼的關(guān)聯(lián)情況進(jìn)行統(tǒng)計(jì)分析,再?gòu)挠?jì)費(fèi)帳務(wù)系統(tǒng)中提取該部分發(fā)信號(hào)碼的用戶信息資料進(jìn)行鑒別,將判定為垃圾短信的號(hào)碼列為黑名單,放入短信中心限制其短信發(fā)送,具體步驟如下:

步驟1,短信話單采集模塊通過FTP從短信中心實(shí)時(shí)獲得原始話單數(shù)據(jù),對(duì)某一或多個(gè)時(shí)間段內(nèi)(如每日8:00-12:00、13:00-17:00、19:00-23:00或按天等等)發(fā)信號(hào)碼的超頻短信話單(如在設(shè)定的某個(gè)時(shí)間段內(nèi)超頻發(fā)送100條以上短信,其他時(shí)間段超頻發(fā)送短信數(shù)可以設(shè)定為150條等)進(jìn)行分揀;

步驟2,可疑垃圾短信統(tǒng)計(jì)分析及判別模塊,按本地網(wǎng)歸屬手機(jī)H碼或小靈通長(zhǎng)途區(qū)號(hào)統(tǒng)計(jì)短信接收數(shù),將短信接收數(shù)大于或接近(如:50%以上)發(fā)信號(hào)碼所在本地網(wǎng)的異地本地網(wǎng)(城市)列為可疑短信接收方向,在可疑短信接收方向的發(fā)信號(hào)碼庫(kù)中,剔除電信運(yùn)營(yíng)商設(shè)定的白名單號(hào)碼和吉祥號(hào)碼后,剩余部分列為可疑短信號(hào)碼;

步驟3,分析可疑短信號(hào)碼在所有可疑短信方向的短信發(fā)送數(shù)占該號(hào)碼短信發(fā)送總數(shù)之比的數(shù)值,如該數(shù)值大于50%(如表2),則繼續(xù)步驟4,否則返回到步驟1;

步驟4,從計(jì)費(fèi)營(yíng)帳系統(tǒng)中,調(diào)取該部分可疑短信號(hào)碼的用戶信息資料,進(jìn)行鑒別,若同時(shí)所有設(shè)定條件:信用度為0、近期入網(wǎng)(如當(dāng)月入網(wǎng))、入網(wǎng)后極少接收短信(如接收短信少于三條)、且極少通話記錄(剔除電信運(yùn)營(yíng)商免費(fèi)客戶號(hào)碼通話記錄后,通話記錄少于三條),則將可疑短信號(hào)碼定義為可疑垃圾短信號(hào)碼,并繼續(xù)往下,否則返回到步驟1;

步驟5,將可疑垃圾短信號(hào)碼,列為黑名單,放入短信中心,在一定時(shí)間內(nèi)(如七天或三個(gè)月等,根據(jù)具體規(guī)定設(shè)定),限制其短信發(fā)送,返回到步驟1。

鑒于部分垃圾短信發(fā)送方式越來越隱蔽和狡猾,對(duì)于實(shí)施以上規(guī)則后,仍沒有截停的垃圾短信號(hào)碼,可按照以下規(guī)則,予以二次過濾,提高攔截效果:

  • 統(tǒng)計(jì)用戶入網(wǎng)時(shí)間至6個(gè)月,以捕捉部分開卡時(shí)間和開始使用時(shí)間差較長(zhǎng)的準(zhǔn)預(yù)付費(fèi)的“養(yǎng)卡”號(hào)碼。
  • 增加總量控制,加長(zhǎng)統(tǒng)計(jì)時(shí)間,按如按某4個(gè)小時(shí)、6小時(shí)等區(qū)段統(tǒng)計(jì),其累計(jì)發(fā)送總數(shù)量≥電信運(yùn)營(yíng)商設(shè)定的超頻數(shù)量,如200條、300條、500條等,按上述步驟3判斷分析。
  • 個(gè)別真實(shí)的正常新入網(wǎng)用戶,在入網(wǎng)后,會(huì)以短信方式告知親朋好友,有可能被識(shí)別為垃圾短信用戶,可采取對(duì)個(gè)別已錯(cuò)列黑名單的用戶結(jié)合營(yíng)帳系統(tǒng)中取得的通話、流量等正常使用行為情況進(jìn)行復(fù)核,一旦出現(xiàn)正常通話和流量,則將該號(hào)碼立即從黑名單中剔除。
  • 電信運(yùn)營(yíng)商,應(yīng)將垃圾短信黑名單用戶攔截記錄,提供給客服,便于投訴處理時(shí)的查詢和解釋。

通過以上二次過濾,再次提高垃圾短信的攔截質(zhì)量和效率,有效率達(dá)到99%以上,目前攔截效果很好。

4.結(jié)束語(yǔ)

基于發(fā)送方向、頻次流量的垃圾短信大數(shù)據(jù)相關(guān)性分析,通過采集某一個(gè)或多個(gè)時(shí)間段內(nèi)超頻發(fā)信號(hào)碼的可疑短信接收方向、可疑短信號(hào)碼,對(duì)可疑垃圾短信方向發(fā)信號(hào)碼的關(guān)聯(lián)情況進(jìn)行統(tǒng)計(jì)分析,再?gòu)挠?jì)費(fèi)帳務(wù)系統(tǒng)中提取該部分發(fā)信號(hào)碼的用戶信息資料進(jìn)行鑒別,將判定為垃圾短信的號(hào)碼列為黑名單,放入短信中心限制其短信發(fā)送。該方法極大地提高垃圾短信判別的準(zhǔn)確率,大幅減少垃圾短信的傳送,使經(jīng)濟(jì)詐騙、垃圾廣告、不法短信傳播得到及時(shí)的甄別堵截。

給作者點(diǎn)贊
0 VS 0
寫得不太好

免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

熱門文章
    最新視頻
    為您推薦

      C114簡(jiǎn)介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機(jī)版

      Copyright©1999-2024 c114 All Rights Reserved | 滬ICP備12002291號(hào)

      C114 通信網(wǎng) 版權(quán)所有 舉報(bào)電話:021-54451141