1. Məlumatların maskalanması konsepsiyası
Məlumat maskalanması məlumat maskalanması kimi də tanınır. Bu, maskalanma qaydaları və siyasəti verdiyimiz zaman mobil telefon nömrəsi, bank kartı nömrəsi və digər məlumatlar kimi həssas məlumatları çevirmək, dəyişdirmək və ya əhatə etmək üçün texniki üsuldur. Bu texnika ilk növbədə həssas məlumatların etibarsız mühitlərdə birbaşa istifadəsinin qarşısını almaq üçün istifadə olunur.
Məlumatların maskalanması prinsipi: Məlumatların maskalanması, sonrakı inkişaf, sınaq və məlumatların təhlilinə maskalanmanın təsir göstərməməsini təmin etmək üçün orijinal məlumat xüsusiyyətlərini, iş qaydalarını və məlumatların uyğunluğunu saxlamalıdır. Maskalanmadan əvvəl və sonra məlumatların ardıcıllığını və etibarlılığını təmin edin.
2. Məlumatların Maskalanması təsnifatı
Məlumatların maskalanması statik məlumat maskalanmasına (SDM) və dinamik məlumat maskalanmasına (DDM) bölünə bilər.
Statik məlumat maskalanması (SDM): Statik məlumatların maskalanması istehsal mühitindən təcrid olunmaq üçün yeni qeyri-istehsal mühiti məlumat bazasının yaradılmasını tələb edir. Həssas məlumatlar istehsal məlumat bazasından çıxarılır və sonra qeyri-istehsal məlumat bazasında saxlanılır. Beləliklə, desensitləşdirilmiş məlumatlar istehsal mühitindən təcrid olunur, bu da biznes ehtiyaclarına cavab verir və istehsal məlumatlarının təhlükəsizliyini təmin edir.
Dinamik məlumat maskalanması (DDM): Ümumiyyətlə istehsal mühitində real vaxtda həssas məlumatları həssaslaşdırmaq üçün istifadə olunur. Bəzən fərqli vəziyyətlərdə eyni həssas məlumatları oxumaq üçün müxtəlif maskalanma səviyyələri tələb olunur. Məsələn, müxtəlif rollar və icazələr müxtəlif maskalama sxemlərini həyata keçirə bilər.
Məlumat hesabatı və məlumat məhsullarının maskalanması tətbiqi
Belə ssenarilərə əsasən daxili məlumatların monitorinqi məhsulları və ya reklam lövhəsi, xarici xidmət datası məhsulları və biznes hesabatları və layihənin nəzərdən keçirilməsi kimi məlumatların təhlilinə əsaslanan hesabatlar daxildir.
3. Məlumatların Maskalanması Həlli
Ümumi məlumat maskalama sxemlərinə aşağıdakılar daxildir: etibarsızlıq, təsadüfi dəyər, məlumatların dəyişdirilməsi, simmetrik şifrələmə, orta dəyər, ofset və yuvarlaqlaşdırma və s.
Etibarsızlıq: Etibarsızlıq həssas məlumatların şifrələnməsinə, kəsilməsinə və ya gizlədilməsinə aiddir. Bu sxem adətən real məlumatları xüsusi simvollarla (məsələn, *) əvəz edir. Əməliyyat sadədir, lakin istifadəçilər orijinal məlumatların formatını bilmirlər və bu, sonrakı məlumat tətbiqlərinə təsir göstərə bilər.
Təsadüfi dəyər: Təsadüfi dəyər həssas məlumatların təsadüfi dəyişdirilməsinə aiddir (rəqəmlər rəqəmləri, hərflər hərfləri və simvollar simvolları əvəz edir). Bu maskalama üsulu müəyyən dərəcədə həssas məlumatların formatını təmin edəcək və sonrakı məlumatların tətbiqini asanlaşdıracaq. İnsanların və yerlərin adları kimi bəzi mənalı sözlər üçün maskalı lüğətlər lazım ola bilər.
Məlumatların dəyişdirilməsi: Məlumatların dəyişdirilməsi null və təsadüfi dəyərlərin maskalanmasına bənzəyir, istisna olmaqla, xüsusi simvollardan və ya təsadüfi dəyərlərdən istifadə etmək əvəzinə, maskalanma məlumatları xüsusi dəyərlə əvəz olunur.
Simmetrik Şifrələmə: Simmetrik şifrələmə xüsusi geri dönən maskalama üsuludur. Şifrələmə açarları və alqoritmlər vasitəsilə həssas məlumatları şifrələyir. Şifrə mətn formatı məntiqi qaydalarda ilkin verilənlərə uyğundur.
Orta: Orta sxem tez-tez statistik ssenarilərdə istifadə olunur. Rəqəmsal məlumatlar üçün biz əvvəlcə onların orta dəyərini hesablayırıq, sonra desensitləşdirilmiş dəyərləri təsadüfi olaraq orta dəyər ətrafında paylayırıq və beləliklə, verilənlərin cəmini sabit saxlayırıq.
Ofset və yuvarlaqlaşdırma: Bu üsul rəqəmsal məlumatları təsadüfi yerdəyişmə yolu ilə dəyişir. Ofset yuvarlaqlaşdırılması, əvvəlki sxemlərə nisbətən real məlumatlara daha yaxın olan və böyük verilənlərin təhlili ssenarisində böyük əhəmiyyət kəsb edən verilənlərin təhlükəsizliyini qoruyarkən diapazonun təxmini həqiqiliyini təmin edir.
Tövsiyə olunan Model "ML-NPB-5660"Məlumatların Maskalanması üçün
4. Ümumi istifadə edilən Məlumatların Maskalanması Texnikaları
(1). Statistika Texnikaları
Məlumatların seçilməsi və məlumatların toplanması
- Məlumatların seçilməsi: Məlumat toplusunun təmsilçi alt çoxluğunu seçməklə orijinal məlumat dəstinin təhlili və qiymətləndirilməsi de-identifikasiya üsullarının effektivliyini artırmaq üçün mühüm üsuldur.
- Məlumatların toplanması: Mikroməlumatlarda atributlara tətbiq edilən statistik üsulların (məsələn, toplama, sayma, orta hesablama, maksimum və minimum) toplusu olaraq, nəticə ilkin məlumat dəstindəki bütün qeydləri təmsil edir.
(2). Kriptoqrafiya
Kriptoqrafiya desensibilizasiyanın effektivliyini artırmaq və ya desensibilizasiya etmək üçün ümumi bir üsuldur. Şifrələmə alqoritmlərinin müxtəlif növləri müxtəlif desensitizasiya effektlərinə nail ola bilər.
- Deterministik şifrələmə: Təsadüfi olmayan simmetrik şifrələmə. O, adətən identifikator məlumatlarını emal edir və lazım olduqda şifrəli mətni orijinal ID-yə qaytara və bərpa edə bilər, lakin açar lazımi qaydada qorunmalıdır.
- Geri dönməz şifrələmə: hash funksiyası adətən ID məlumatları üçün istifadə olunan məlumatları emal etmək üçün istifadə olunur. O, birbaşa deşifrə edilə bilməz və Xəritəçəkmə əlaqəsi saxlanmalıdır. Bundan əlavə, hash funksiyasının xüsusiyyətinə görə məlumatların toqquşması baş verə bilər.
- Homomorfik şifrələmə: Şifrə mətninin homomorfik alqoritmi istifadə olunur. Onun xarakterik cəhəti ondan ibarətdir ki, şifrəli mətn əməliyyatının nəticəsi deşifrədən sonra açıq mətn əməliyyatı ilə eynidir. Buna görə də, adətən ədədi sahələri emal etmək üçün istifadə olunur, lakin performans səbəbləri üçün geniş istifadə edilmir.
(3). Sistem Texnologiyası
Supressiya texnologiyası məxfiliyin qorunmasına cavab verməyən məlumat elementlərini silir və ya qoruyur, lakin onları dərc etmir.
- Maskalama: rəqib nömrəsi, şəxsiyyət vəsiqəsi ulduzla işarələnmiş və ya ünvan kəsilmiş kimi atribut dəyərini maskalamaq üçün ən ümumi desensitizasiya metoduna aiddir.
- Yerli bastırma: xüsusi atribut dəyərlərinin (sütunların) silinməsi, vacib olmayan məlumat sahələrinin silinməsi prosesinə aiddir;
- Qeydin dayandırılması: xüsusi qeydlərin (sətirlərin) silinməsi, vacib olmayan məlumat qeydlərinin silinməsi prosesinə aiddir.
(4). Təxəllüs Texnologiya
Pseudomanning birbaşa identifikatoru (və ya digər həssas identifikatoru) əvəz etmək üçün təxəllüsdən istifadə edən de-identifikasiya üsuludur. Təxəllüs üsulları birbaşa və ya həssas identifikatorlar əvəzinə hər bir fərdi məlumat subyekti üçün unikal identifikatorlar yaradır.
- O, orijinal ID-yə uyğun gəlmək üçün müstəqil olaraq təsadüfi dəyərlər yarada, xəritəçəkmə cədvəlini saxlaya və xəritəçəkmə cədvəlinə girişə ciddi nəzarət edə bilər.
- Siz həmçinin təxəllüslər yaratmaq üçün şifrələmədən istifadə edə bilərsiniz, lakin şifrə açma açarını düzgün saxlamalısınız;
Bu texnologiya, müxtəlif tərtibatçıların eyni istifadəçi üçün fərqli Openids əldə etdiyi açıq platforma ssenarisində OpenID kimi çoxlu sayda müstəqil məlumat istifadəçiləri vəziyyətində geniş istifadə olunur.
(5). Ümumiləşdirmə üsulları
Ümumiləşdirmə texnikası verilənlər toplusunda seçilmiş atributların qranularlığını azaldan və məlumatların daha ümumi və mücərrəd təsvirini təmin edən de-identifikasiya texnikasına aiddir. Ümumiləşdirmə texnologiyasını tətbiq etmək asandır və rekord səviyyəli məlumatların həqiqiliyini qoruya bilər. O, adətən məlumat məhsullarında və ya məlumat hesabatlarında istifadə olunur.
- Yuvarlaqlaşdırma: 100, 500, 1K və 10K nəticələri verən yuxarı və ya aşağı kriminalistika kimi seçilmiş atribut üçün yuvarlaqlaşdırma əsasının seçilməsini əhatə edir.
- Yuxarı və aşağı kodlaşdırma üsulları: “X-dən yuxarı” və ya “X-dən aşağı” nəticə verən həddən yuxarı (və ya aşağı) dəyərləri yuxarı (və ya aşağı) səviyyəni təmsil edən həddi ilə əvəz edin
(6). Randomizasiya üsulları
Bir növ de-identifikasiya texnikası olaraq, randomizə texnologiyası, təsadüfiləşdirmə yolu ilə atributun dəyərinin dəyişdirilməsinə aiddir ki, təsadüfiləşdirmədən sonrakı dəyər orijinal real dəyərdən fərqli olsun. Bu proses təcavüzkarın eyni məlumat qeydindəki digər atribut dəyərlərindən atribut dəyəri əldə etmək qabiliyyətini azaldır, lakin istehsal testi məlumatlarında ümumi olan nəticə məlumatlarının həqiqiliyinə təsir göstərir.
Göndərmə vaxtı: 27 sentyabr 2022-ci il