loader

Badanie: ile zasobów polskiego internetu z lat 90. utraciliśmy?

Tylko 22 proc. polskich adresów URL skatalogowanych w przewodniku z 1997 r. jest jeszcze dostępnych. A prawie 80 proc. zasobów przetrwało jako kopie w archiwach Webu – wynikło z badań Marcina Wilkowskiego z Centrum Kompetencji Cyfrowych UW.

Marcin Wilkowski z UW, doktorant Instytutu Badań Literackich PAN, zbadał stan zachowania zasobów polskiego internetu z 1997 roku. Przeanalizował 951 adresów URL, skatalogowanych i opisanych w wydanym w 1997 roku, drukowanym przewodniku „Polish World” autorstwa Martina Miszczaka.

„Współcześnie dostępnych jest jedynie niecałe 22 proc. z nich. W archiwach Webu istnieją kopie prawie 80 proc. badanych linków, przy czym ani współczesna dostępność, ani obecność w archiwum Webu nie gwarantuje, że możemy korzystać z oryginalnej postaci strony WWW z początków 1997 roku”- podsumowuje Wilkowski w przesłanym PAP komunikacie o swoich badaniach.

Wyniki jego pracy ukazały się w czasopiśmie naukowym „Archiwa – Kancelarie – Zbiory”.

Wilkowski tłumaczy, że badania historycznego Webu z wykorzystaniem drukowanych przewodników z lat 90. były już podejmowane, przy czym jest to pierwsze takie badanie dla polskiej domeny krajowej.

„Ponieważ nie możemy skorzystać z indeksu wszystkich stron WWW dostępnych w określonym czasie, chcąc sprawdzić, ile z nich wciąż jest dostępnych, musimy szukać innych źródeł informacji. Obok drukowanych katalogów i przewodników są nimi katalogi internetowe, popularne przed tym, jak Google zdominowało sposób wyszukiwania w Internecie, czasopisma, w których publikowano recenzje stron WWW czy artykuły naukowe, gdzie linki do zasobów internetowych umieszczano w przypisach” – zwraca uwagę Marcin Wilkowski.

Badacze dawnego internetu korzystać mogą niekiedy z indeksów i zasobów archiwów Webu, serwisów na bieżąco gromadzących kopie stron WWW i agregujących dane na ich temat. Archiwa takie powstają od połowy lat 90. – największe z nich tworzone jest przez amerykańską fundację Internet Archive, chociaż większość z nich prowadzona jest przez biblioteki i archiwa narodowe.

„W Polsce takie archiwum nie funkcjonuje, chociaż podejmowano próby jego zainicjowania – badacze polskiej domeny krajowej muszą więc korzystać z zasobów Internet Archive, chociaż archiwum to zabezpiecza zasoby internetowe bez wyraźnego planu, dość przypadkowo, często także na żądanie użytkowników – każdy może zgłosić tam link do zabezpieczenia” – tłumaczy autor badań.

Badanie stron WWW skatalogowanych w „Polish World” to próba rozpoznania wielkości straty związanej z niedostępnością i zmiennością zasobów polskiej domeny krajowej.

author avatar
Capital24.tv
Capital24.tv - Nakręcamy biznes! Capital24.tv to pierwsza w Polsce internetowa telewizja biznesowa, która dostarcza wartościowe informacje, analizy oraz ekspertyzy związane z rynkiem gospodarczym i finansowym. Serwis został stworzony przez zespół doświadczonych dziennikarzy i ekspertów, którzy prezentują treści w przystępnej i atrakcyjnej formie. Platforma umożliwia firmom założenie bezpłatnych profili, na których mogą publikować wiadomości, zdjęcia, podcasty oraz wideo, a także zintegrować je z kontem na YouTube. Dzięki licencji Creative Commons, treści zamieszczone na Capital24.tv są dostępne dla dziennikarzy i blogerów do bezpłatnego pobierania i udostępniania, co sprzyja szerzeniu wiedzy na temat polskiego biznesu i rynku kapitałowego.

1 2

O autorze