Hjem Sikkerhet Hva er dataperturbasjon? - definisjon fra techopedia

Hva er dataperturbasjon? - definisjon fra techopedia

Innholdsfortegnelse:

Anonim

Definisjon - Hva betyr dataperturbasjon?

Forstyrrelse av data er en form for personvernbevarende datautvinning for elektronisk helsejournal (EHR). Det er to hovedtyper av dataforstyrrelse som er passende for EHR-databeskyttelse. Den første typen er kjent som sannsynlighetsfordelingstilnærmingen, og den andre typen kalles verdiforvrengningsmetoden. Datapertubasjon anses som en relativt enkel og effektiv teknikk for å beskytte sensitive elektroniske data mot uautorisert bruk.

Techopedia forklarer Data Perturbation

Datapertubasjon er blitt hyllet som en mer effektiv anvendelse av databeskyttelse i helsevesenet enn avidentifisering / reidentifisering på grunn av større sannsynlighet for at angrep kan finne sted som kobler offentlige datasett til opprinnelige identifikatorer eller forsøkspersoner. Nettopp av dette blir datapertubasjon hyllet som en mer solid applikasjon når det gjelder EHR-sikkerhet.


Sannsynlighetsfordelingstilnærmingen tar dataene og erstatter dem fra den samme distribusjonsprøven eller fra selve distribusjonen. Verdiforvrengningsmetoden forstyrrer data ved multipliserende eller additiv støy, eller andre randomiserte prosesser. Det anses for å være mer effektivt enn den tidligere typen forstyrrelse. Denne tilnærmingen bygger beslutnings-treet klassifisatorer der hvert element tildeles tilfeldig støy fra Gauss-distribusjonen, for eksempel. Ved data mining blir den opprinnelige datadistribusjonen gjenoppbygd fra den forstyrrede versjonen. Kritikere peker imidlertid på det faktum at tilfeldig additiv støy kan filtreres, noe som kan føre til EHR-personvernskompromisser.

Hva er dataperturbasjon? - definisjon fra techopedia