Innholdsfortegnelse:
Definisjon - Hva betyr innholdsskraping?
Innskraping er en ulovlig måte å stjele originalt innhold fra et legitimt nettsted og legge ut det stjålne innholdet til et annet nettsted uten kunnskap eller tillatelse fra innholdets eier. Innholdsskrapere prøver ofte å gi bort stjålet innhold som sitt eget, og unnlater å tilskrive innholdets eiere.
Innholdsskraping kan utføres ved manuell kopiering og liming, eller kan bruke mer sofistikerte teknikker, for eksempel bruk av spesiell programvare, HTTP-programmering eller HTML- eller DOM-parsere.
Mye av innholdet som faller på for skraping er opphavsrettsbeskyttet materiale; å ompostere den uten copyrightinnehaverens tillatelse er en straffbar handling. Imidlertid hostes skrapersider over hele verden, og skrapere som blir bedt om å fjerne opphavsrettsbeskyttet innhold kan bare bytte domener eller forsvinne.
Techopedia forklarer Content Scraping
Innholdsskrapere kan føre trafikk til nettstedene sine ved å skrape innhold av nøkkelord av høy kvalitet fra andre nettsteder. Bloggere er spesielt utsatt for dette, sannsynligvis fordi det ikke er sannsynlig at enkeltbloggere vil sette i gang et lovlig angrep mot skrapere. Skrapere oppfordres til å fortsette denne praksisen fordi søkemotorer ennå ikke har funnet en effektiv måte å filtrere ut unikt innhold fra skrapt innhold, slik at skrapere kan fortsette å dra nytte av det.
Nettstedsadministratorer kan beskytte seg mot skraping gjennom enkle tiltak, for eksempel å legge til lenker til deres eget nettsted innenfor innholdet. Dette vil i det minste tillate dem å få litt trafikk fra skrapt innhold. Mer sofistikerte metoder for å håndtere skraping av bots inkluderer:
- Kommersielle anti-bot applikasjoner
- Fanger roboter med en honeypot og blokkerer IP-adressene deres
- Blokkering av roboter med JavaScript-kode
