Innholdsfortegnelse:
Definisjon - Hva betyr kanonisering?
Canonicalization er prosessen med å konvertere data som involverer mer enn en representasjon til et standardgodkjent format. En slik konvertering sikrer at data samsvarer med kanoniske regler. Dette sammenligner forskjellige representasjoner for å sikre ekvivalens, for å telle antall forskjellige datastrukturer, for å pålegge en meningsfull sorteringsrekkefølge og forbedre algoritmens effektivitet, og dermed eliminere gjentatte beregninger.
Canonicalization brukes i en rekke internett- og dataprogrammer for å generere kanoniske data fra ikke-kanonisk informasjon. Kanonisk representasjon av data er mye brukt i
søkemotoroptimalisering (SEO), webservere, Unicode og XML.
Dette begrepet er også kjent som C14N, standardisering eller normalisering.
Techopedia forklarer Canonicalization
I SEO handler URL-kanonisering av nettinnhold med mer enn en mulig URL. Dette kan skape avvik i søk fordi søkemotoren kanskje ikke er klar over hvilken URL som skal vises. Canonicalization velger den beste URLen fra flere valg, vanligvis refererer til hjemmesider. Selv om visse nettadresser ser ut til å være de samme, returnerer webservere forskjellige resultater for nettadressene. Søkemotorer vurderer bare en URL i kanonisk form.
Datasikkerhet er basert på filnavn kanonisering. Noen webservere kan ha en sikkerhetsregel for å utføre filer bare under en bestemt katalog. Filen blir deretter bare kjørt hvis banen har den angitte katalogen i navnet. Spesiell forsiktighet må tas for å sjekke om filnavnet er en unik representasjon. Slik sårbarhet kalles katalogovergang.
De fleste tegnene i Unicode-standarden har koding med variabel lengde. Dette krever en vurdering av hvert strengkarakter og gjør strengvalideringen mer kompleks. Hvis alle karakterkodinger ikke blir vurdert i programvareimplementeringen, oppstår det en mulighet for feil. Dette problemet kan elimineres ved å bruke en enkelt koding for hvert tegn. Det beste alternativet, som all programvare kan ta, er å sjekke om strengen er kanonisert. Strenger som ikke er kanonisert, kan avvises.
Et kanonisk XML-dokument er et XML-dokument i XML-kanonisk form. Det er definert av kanonisk XML-spesifikasjon. Canonicalization i XML eliminerer hvitt mellomrom i koder, sorterer referanser til navneareal og eliminerer overflødige, og bruker spesielle tegnkodinger. Det fjerner også XML- og DOCTYPE-erklæringer, i tillegg til å transformere relative URL-er til absolutte URL-er.