Decadimento digitale: anche i contenuti online spariscono?

Il web è come una gigantesca biblioteca online, con centinaia di miliardi di pagine indicizzate. Ma sapevate che questa conoscenza accumulata può svanire nel nulla? Un recente studio del Pew Research Center ha messo in luce un fenomeno davvero particolare: la fragilità dei contenuti online.

Lo studio del Pew Research Center

Lo studio analizza la “vita” delle pagine web in un arco temporale di dieci anni, dal 2013 al 2023. I risultati sono sorprendenti:

  • Un quarto di tutte le pagine web esistenti tra il 2013 e il 2023 non sono più accessibili (ottobre 2023). Spesso si tratta di singole pagine cancellate all’interno di siti ancora funzionanti.
  • Il dato è ancora più allarmante per i contenuti più vecchi: il 38% delle pagine del 2013 è oggi irreperibile, contro l’8% di quelle del 2023.
Decadimento digitale - Piano Sito Web

Questo fenomeno, chiamato decadimento digitale, colpisce diverse tipologie di siti:

  • Siti istituzionali e news: il 23% delle pagine di news e il 21% di quelle governative contengono almeno un link rotto. I siti locali sono particolarmente colpiti.
  • Wikipedia: ben il 54% delle pagine di Wikipedia ha almeno un riferimento ad una pagina inesistente.
  • Social media: quasi uno su cinque i tweet sparisce entro pochi mesi dalla pubblicazione. Nel 60% dei casi, l’account che li ha postati è stato disattivato o sospeso.

Come è stato condotto lo studio?

I ricercatori hanno utilizzato due approcci principali. In primis sono state analizzate pagine web archiviate da Common Crawl, un servizio che periodicamente “fotografa” lo stato di internet. Confrontando gli archivi dal 2013 al 2023, si è scoperto che il 25% delle pagine non è più accessibile oggi.

Lo studio è stato inoltre condotto analizzando un campione di tweet pubblicati su X (ex Twitter) nella primavera del 2023 e monitorandoli per tre mesi, si è riscontrato che quasi il 20% non è più visibile.

Cos’è il decadimento digitale?

Questo fenomeno, definito decadimento digitale, rappresenta la progressiva perdita di informazioni e contenuti online. Le cause sono diverse: siti web che chiudono, contenuti che vengono rimossi, URL che cambiano e pagine che diventano inaccessibili a causa di problemi tecnici.

Il decadimento digitale ha conseguenze negative su diversi fronti:

  • Perdita di informazioni: Milioni di pagine web contengono informazioni preziose per la ricerca, il giornalismo e la storia. La loro scomparsa rappresenta una perdita irreparabile di conoscenza.
  • Difficoltà nella navigazione: Link rotti e pagine inaccessibili rendono la navigazione online frustrante e dispersiva.
  • Danno alla reputazione: Per le aziende, la scomparsa di contenuti online può danneggiare la reputazione e ostacolare la comunicazione con i clienti.
Riproduci video