Una recente ricerca condotta dal Pew Research Centre ha rivelato che circa il 40 percento delle pagine web create nel 2013 non sono più accessibili a causa del deterioramento digitale. Questo fenomeno evidenzia quanto sia effimero il contenuto online, soggetto a degradazione, corruzione o obsolescenza nel tempo.
Il team di ricerca ha analizzato campioni casuali di quasi 1 milione di pagine web provenienti dagli archivi di Common Crawl, un repository internet che effettua snapshot del web in momenti diversi. I risultati hanno mostrato che il 38 percento del contenuto del 2013 non è più disponibile oggi.
Interessante è il fatto che un quarto di tutte le pagine web esistenti tra il 2013 e il 2023 non sono più accessibili. Questo perché molte pagine sono state eliminate o rimosse dai siti web, rendendole “inaccessibili” in quanto non più presenti sul server host.
Il rapporto ha evidenziato che il 16 percento delle pagine era “individualmente inaccessibile” ma si trovava su domini di livello radice altrimenti accessibili, mentre il restante 9 percento era inaccessibile perché l’intero dominio radice non esisteva più.
Analizzando i diversi tipi di pagine web, è emerso che anche i siti di notizie e i social media non sono esenti da questo problema. Ad esempio, su Twitter, il 18 percento dei tweet pubblicati tra il 2013 e il 2023 non è più disponibile, principalmente a causa della rimozione degli account o dei singoli tweet.
Complessivamente, il deterioramento digitale rappresenta una sfida significativa per la conservazione e l’accessibilità del contenuto online nel lungo termine, evidenziando la necessità di strategie di archiviazione e preservazione più efficaci.
Links:
L’articolo Deterioramento digitale: la fragilità del contenuto online nel tempo sembra essere il primo su Scienze Notizie.