国产色频,国产网站精品,成人在线综合网,精品一区二区三区毛片,亚洲无卡视频,黄色av观看,亚洲福利影视

基于機器學習的數(shù)據(jù)脫敏系統(tǒng)研究與設計

2018-03-20 15:54:05 電力信息與通信技術  點擊量: 評論 (0)
近年來,國家電網(wǎng)公司各專業(yè)信息系統(tǒng)建設不斷完善,為了保障數(shù)據(jù)在各類應用場景中安全使用,提出了一種基于機器學習的數(shù)據(jù)脫敏系統(tǒng)設計方案,重點針對敏感數(shù)據(jù)識別、定級,敏感算法制定,以及脫敏任務配置的實現(xiàn)方式進行研究。結(jié)合用戶欠費信息的脫敏分析,驗證了該方案具有自定義定級

 3 脫敏任務配置

在完成脫敏策略制定后,為使脫敏任務能夠長時間工作,首先需在脫敏系統(tǒng)中對源數(shù)據(jù)所在業(yè)務系統(tǒng)的地址及端口號進行注冊[14]。然后,獲取已制定的脫敏策略,脫敏系統(tǒng)按照選擇的脫敏算法及相關參數(shù)生成脫敏代碼。用戶根據(jù)應用場景選擇脫敏實現(xiàn)方式,對于靜態(tài)脫敏,系統(tǒng)先執(zhí)行脫敏操作,并將脫敏結(jié)果緩存在本地存儲,待目標系統(tǒng)需要獲取脫敏數(shù)據(jù)時,用戶在脫敏系統(tǒng)中注冊目標系統(tǒng)的地址及端口,最后將本地脫敏數(shù)據(jù)傳輸至目標系統(tǒng)。而對于動態(tài)脫敏,用戶必須先在脫敏系統(tǒng)中注冊目標系統(tǒng)地址、端口以及目標系統(tǒng)使用賬號,然后將脫敏代碼下發(fā)至代理服務器,由代理服務器進行在線數(shù)據(jù)脫敏,并將脫敏結(jié)果返回至脫敏系統(tǒng),最后傳輸至目標系統(tǒng),由目標系統(tǒng)中的數(shù)據(jù)需求方的賬號使用。脫敏任務配置流程如圖4所示。

圖4 脫敏任務配置流程Fig.4 Configuration flow chart of data masking task

 4 應用驗證

本文以營銷業(yè)務應用系統(tǒng)數(shù)據(jù)庫中的實收電費信息表為例[15],分析人員希望通過分析某一用電用戶的欠費歷史,對該用戶的用電行為進行評估。實收電費信息表中涉及的用戶用電欠費信息和繳費信息均為敏感信息,因此在使用數(shù)據(jù)表進行分析之前,應對其進行脫敏處理。

在明確敏感信息后,脫敏實現(xiàn)的關鍵點為脫敏算法的選擇。脫敏算法選擇決策樹如圖5所示,為數(shù)據(jù)脫敏系統(tǒng)中用于脫敏算法制定的決策樹,由192組數(shù)據(jù)的訓練集訓練得到,其中Level表示敏感級值,ZSX、KYX、KPZ、GLX、SXX、KCX分別為真實性、可用性、可配置、關聯(lián)性、時效性、可重現(xiàn)等6個脫敏算法選擇因素的中文首字母縮寫,RP、EC、SF、DL、MK、CG為上文介紹的6種脫敏方法。在利用決策樹選擇脫敏算法之前,脫敏系統(tǒng)用戶應與分析人員共同確定敏感信息在本次分析過程中的6個因素是否滿足。

圖5 脫敏算法選擇決策樹Fig.5 Decision tree for masking algorithm selection

欠費信息是統(tǒng)計分析的對象,數(shù)據(jù)應具有可用性和真實性。同時,由于是分析某一用戶,因此用戶編號字段和欠費信息間的對應關系不能被破壞,數(shù)據(jù)需要具有關聯(lián)性,而時效性、可重現(xiàn)和可配置3個因素在這里則無關緊要。因此,綜合考慮因素分析,系統(tǒng)用戶可按照圖5決策樹選擇數(shù)據(jù)變換(CG)算法對欠費信息進行脫敏處理。而繳費信息不是統(tǒng)計分析的對象,不具可用性,同時另外5個因素也不用具備,根據(jù)決策樹推薦可以直接刪除并置空繳費信息。

在系統(tǒng)用戶完成靜態(tài)脫敏任務配置后,脫敏系統(tǒng)可按照選擇的脫敏策略對實收電費信息表進行脫敏,待分析人員的目標地址及端口在脫敏系統(tǒng)中注冊后,即可將脫敏表從本地緩存?zhèn)鹘o用于分析的目標系統(tǒng)。

 5 結(jié)語

數(shù)據(jù)脫敏將成為大數(shù)據(jù)時代企業(yè)數(shù)據(jù)化運行維護的必要安全機制。本文從國家電網(wǎng)公司信息化建設實際情況出發(fā),分析并提出了一種數(shù)據(jù)脫敏系統(tǒng)設計方法,探討利用機器學習方法使脫敏過程更加系統(tǒng)化、智能化、專業(yè)化,并結(jié)合實際應用場景驗證了脫敏策略制定功能。隨著未來對數(shù)據(jù)脫敏的進一步研究,脫敏系統(tǒng)將可實現(xiàn)更細粒度的訪問控制、更精確的需求理解能力、更強的擴展能力以及更友好的交互方式,從而滿足更多跨系統(tǒng)、跨專業(yè)、跨行業(yè)的數(shù)據(jù)交互、共享和融合需求。

大云網(wǎng)官方微信售電那點事兒

責任編輯:售電衡衡

免責聲明:本文僅代表作者個人觀點,與本站無關。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內(nèi)容。
我要收藏
個贊
?