Изменения

3780 байт добавлено ,  2 года назад
м
автоматическая отмена правки участника 149.27.124.222 (0.957/0.046)
Строка 31: Строка 31:  
</ref>.
 
</ref>.
   −
== Создани ==
+
== Создание ==
В  английский учёный  создал  — систему, позволяющую передавать данные через подключённые к интернету компьютеры. Однако с распространением всемирной паутины были выявлены две основные проблемы. Первая состояла в нехватке мест для хранения всех данных, из-за чего многие документы и веб-страницы удалялись. Другая проблема заключалась в том, что после редактирования веб-страницы (например, по юридическим причинам) пользователи не могли посмотреть её изначальную версию. Решить эти недостатки стремилась американская цифровая библиотека «» — некоммерческая организация, созданная программистами  и в 1996 году. При сотрудничестве с  ( , занимающейся веб-индексированием) «Архив» инициировал создание и хранение копий существующих сайтов для развития «универсального доступа к знанию». Организация предоставляла  к оцифрованным материалам, таким как веб-страницы, книги, аудиозаписи, включая живые концерты, видео, изображения и программное обеспечение. На 2021 год штаб-квартира «» находится в , в здании бывшей христианской церкви, расположенной в районе . Журналист местной радиостанции в 2019 году сравнивал офис «Архива» с римским храмо. Организация ставит перед собой цель спасти интернет от исчезновени.
+
[[Файл:Internet Archive mirror servers - Bibliotheca Alexandrina.jpg|thumb|250px|right|Серверы «Архива Интернета», 2008 год]]
 +
[[Файл:Brewster Kahle 2009.jpg|thumb|250px|right|[[Кейл, Брюстер|Брюстер Кейл]] в 2009 году]]
   −
Wayback Machine стал самым известным проектом «Архива». Онлайн-сервис был назван в честь машины времени из мультсериала 1960-х годов «». Он предоставляет доступ к цифровой коллекции из более чем 550 млрд веб-страни. Проект Wayback Machine был задуман как решение проблемы , означающей, что сервер не может найти данные по запрошенному адресу. Это связано с так называемым  — нарастающей недоступностью некогда опубликованных данных. Так, в 1997 году средняя продолжительность жизни веб-страницы составляла 44 дня. В 2003 году этот показатель составил 100 дней. Проведённый в 2008 году анализ ссылок на 2700 цифровых ресурсов, большинство из которых не имеет печатных аналогов, показал, что около 8 процентов ссылок переставали работать через год. К 2011 году, по прошествии трёх лет, 30 процентов ссылок в коллекции были неработающим. Благодаря интеграции с Alexa, столкнувшийся с сообщением об ошибке пользователь мог получить доступ к заархивированной версии страницы через внедрённую в браузер панель инструментов. Если копия недоступной страницы присутствовала в базе данных Wayback Machine, то загоралась специальная кнопка. При этом пользователи могли предоставить браузеру разрешение на просмотр и регистрацию активности — в таком случае все посещаемые сайты архивировались на портал.
+
В [[1989 год]]у английский учёный [[Бернерс-Ли, Тим|Тим Бернерс-Ли]] создал [[всемирная паутина|всемирную паутину]] — систему, позволяющую передавать данные через подключённые к интернету компьютеры. Однако с распространением всемирной паутины были выявлены две основные проблемы. Первая состояла в нехватке мест для хранения всех данных, из-за чего многие документы и веб-страницы удалялись. Другая проблема заключалась в том, что после редактирования веб-страницы (например, по юридическим причинам) пользователи не могли посмотреть её изначальную версию. Решить эти недостатки стремилась американская цифровая библиотека «[[Архив Интернета]]» — некоммерческая организация, созданная программистами [[Кейл, Брюстер|Брюстером Кейлом]] и {{iw|Галлиат, Брюс|Брюсом Галлиатом|en|Bruce Gilliat}} в 1996 году. При сотрудничестве с [[Alexa Internet]] ([[Дочернее общество|дочерней компанией]] [[Amazon]], занимающейся веб-индексированием) «Архив» инициировал создание и хранение копий существующих сайтов для развития «универсального доступа к знанию». Организация предоставляла [[открытый доступ|бесплатный публичный доступ]] к оцифрованным материалам, таким как веб-страницы, книги, аудиозаписи, включая живые концерты, видео, изображения и программное обеспечение. На 2021 год штаб-квартира «[[Архив Интернета|Архива Интернета]]» находится в [[Сан-Франциско]], в здании бывшей христианской церкви, расположенной в районе [[Ричмонд (район Сан-Франциско)|Ричмонд]]. Журналист местной радиостанции {{iw|Kawl|||}} в 2019 году сравнивал офис «Архива» с римским храмом<ref>{{cite web
 +
|url=https://theconversation.com/dominic-cummings-how-the-internet-knows-when-youve-updated-your-blog-139517
 +
|title=Dominic Cummings: how the internet knows when you’ve updated your blog
 +
|date=2020-05-28
 +
|publisher=The Conversation
 +
|accessdate=2021-06-03
 +
|lang=en
 +
|archive-date=2021-07-25
 +
|archive-url=https://web.archive.org/web/20210725222234/https://theconversation.com/dominic-cummings-how-the-internet-knows-when-youve-updated-your-blog-139517
 +
|deadlink=no
 +
}}</ref>{{sfn|Odgen|2017}}<ref>{{cite web
 +
|url=https://www.kalw.org/show/crosscurrents/2019-09-11/in-an-old-church-the-internet-archive-stores-our-digital-history
 +
|title=In An Old Church, The Internet Archive Stores Our Digital History
 +
|date=2019-09-11
 +
|publisher=Kalw. San Francisco local public radio
 +
|accessdate=2021-06-03
 +
|lang=en
 +
|archive-date=2021-05-06
 +
|archive-url=https://web.archive.org/web/20210506120243/https://www.kalw.org/show/crosscurrents/2019-09-11/in-an-old-church-the-internet-archive-stores-our-digital-history
 +
|deadlink=no
 +
}}</ref>. Организация ставит перед собой цель спасти интернет от исчезновения{{sfn|Price|2011}}.
   −
Wayback Machine был запущен в мае 1996 года, однако стал доступным для общественности только в 2001-м — до этого вся записанная на цифровых магнитных лентах информация была открыта только для ограниченного числа учёных и исследователе. К моменту «открытия» архив содержал более 10 млрд заархивированных страни. К декабрю 2014 года руководство Wayback Machine сообщило, что сохранило 435 млрд веб-страниц по всему мир. С технической точки зрения программное обеспечение Wayback Machine не является архивом, а скорее общедоступным интерфейсом к ограниченному подмножеству всех хранили. Так, Wayback Machine нельзя считать поисковой системой коллекции организации, так как она не осуществляет поиск по базе данных другой крупной виртуальной библиотеки — , позволяющей пользователям бесплатно получать доступ к цифровым копиям книг, которые загружаются и архивируются в рамках проект.
+
Wayback Machine стал самым известным проектом «Архива». Онлайн-сервис был назван в честь машины времени из мультсериала 1960-х годов «[[Шоу Рокки и Буллвинкля]]». Он предоставляет доступ к цифровой коллекции из более чем 550 млрд веб-страниц<ref name=Bryant/><ref>{{cite web
 +
|url=https://www.theguardian.com/technology/2007/nov/19/archive.internet
 +
|title=The Time Machine
 +
|author=Jack Schofield
 +
|date=2007-11-19
 +
|publisher=The Guardian
 +
|accessdate=2021-06-01
 +
|lang=en
 +
|archive-date=2021-04-19
 +
|archive-url=https://web.archive.org/web/20210419133845/https://www.theguardian.com/technology/2007/nov/19/archive.internet
 +
|deadlink=no
 +
}}</ref><ref name=McKinnon>{{cite web
 +
|url=https://wpmudev.com/blog/archiving-with-wayback-machine/
 +
|title=Using the Wayback Machine to Archive (and Backup) WordPress
 +
|author=Jenni McKinnon
 +
|date=2017-05-25
 +
|publisher=WPMudev
 +
|accessdate=2021-05-29
 +
|lang=en
 +
|archive-date=2021-04-13
 +
|archive-url=https://web.archive.org/web/20210413234350/https://wpmudev.com/blog/archiving-with-wayback-machine/
 +
|deadlink=no
 +
}}</ref>. Проект Wayback Machine был задуман как решение проблемы [[Ошибка 404|ошибки 404]], означающей, что сервер не может найти данные по запрошенному адресу. Это связано с так называемым [[вымирание ссылок|вымиранием ссылок]] — нарастающей недоступностью некогда опубликованных данных. Так, в 1997 году средняя продолжительность жизни веб-страницы составляла 44 дня. В 2003 году этот показатель составил 100 дней. Проведённый в 2008 году анализ ссылок на 2700 цифровых ресурсов, большинство из которых не имеет печатных аналогов, показал, что около 8 процентов ссылок переставали работать через год. К 2011 году, по прошествии трёх лет, 30 процентов ссылок в коллекции были неработающими<ref>{{cite web
 +
|url=https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/
 +
|title=Raiders of the Lost Web
 +
|author=Adrienne LaFrance
 +
|date=2015-10-14
 +
|publisher=The Atlantic
 +
|accessdate=2021-06-07
 +
|lang=en
 +
|archive-date=2017-05-07
 +
|archive-url=https://web.archive.org/web/20170507173716/https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/
 +
|deadlink=no
 +
}}</ref>. Благодаря интеграции с Alexa, столкнувшийся с сообщением об ошибке пользователь мог получить доступ к заархивированной версии страницы через внедрённую в браузер панель инструментов. Если копия недоступной страницы присутствовала в базе данных Wayback Machine, то загоралась специальная кнопка. При этом пользователи могли предоставить браузеру разрешение на просмотр и регистрацию активности — в таком случае все посещаемые сайты архивировались на портале{{sfn|Rogers|2017|pp=160—172}}.
 +
 
 +
Wayback Machine был запущен в мае 1996 года, однако стал доступным для общественности только в 2001-м — до этого вся записанная на цифровых магнитных лентах информация была открыта только для ограниченного числа учёных и исследователей{{sfn|Hartelius|2020|p=378}}. К моменту «открытия» архив содержал более 10 млрд заархивированных страниц<ref name=Bryant/>. К декабрю 2014 года руководство Wayback Machine сообщило, что сохранило 435 млрд веб-страниц по всему миру{{sfn|Arora|2015}}. С технической точки зрения программное обеспечение Wayback Machine не является архивом, а скорее общедоступным интерфейсом к ограниченному подмножеству всех хранилищ{{sfn|Bowyer|2021|pp=43—57}}. Так, Wayback Machine нельзя считать поисковой системой коллекции организации, так как она не осуществляет поиск по базе данных другой крупной виртуальной библиотеки — [[Open Library]], позволяющей пользователям бесплатно получать доступ к цифровым копиям книг, которые загружаются и архивируются в рамках проекта<ref name=Vox>{{cite web
 +
|url=https://www.vox.com/2020/6/23/21293875/internet-archive-website-lawsuit-open-library-wayback-machine-controversy-copyright
 +
|title=A lawsuit is threatening the Internet Archive — but it’s not as dire as you may have heard
 +
|author=Aja Romano
 +
|date=2020-01-23
 +
|publisher=Vox
 +
|accessdate=2021-05-29
 +
|lang=en
 +
|archive-date=2021-08-18
 +
|archive-url=https://web.archive.org/web/20210818211013/https://www.vox.com/2020/6/23/21293875/internet-archive-website-lawsuit-open-library-wayback-machine-controversy-copyright
 +
|deadlink=no
 +
}}</ref><ref name=Forbes>{{cite web
 +
|url=https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/?sh=533ba6e282e0
 +
|title=The Internet Archive Turns 20: A Behind The Scenes Look At Archiving The Web
 +
|author=Kalev Leetaru
 +
|date=2016-01-18
 +
|publisher=Forbes
 +
|accessdate=2021-06-05
 +
|lang=en
 +
|archive-date=2021-08-15
 +
|archive-url=https://web.archive.org/web/20210815171017/https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/?sh=533ba6e282e0
 +
|deadlink=no
 +
}}</ref>.
    
== Характеристика ==
 
== Характеристика ==
С запуском Wayback Machine «Архив Интернета» стал одним из самых популярных и узнаваемых онлайн-порталов и главным сервисом [[Архивирование веб-сайтов|веб-архивирования]]<ref name=Bryant/>{{sfn|Price|2011}}. В 1999 году «Архив» начал расширять коллекцию за пределы архивного веб-контента, чтобы обеспечить статус как к оцифрованным, так и изначально цифровым ресурсам, в том числе книгам, аудио, фильмам, изображениям, документам, программному обеспечению и видеоиграм{{sfn|Odgen|2017}}. Некоторые сканирования выполняются поисковыми роботами самого архива, а другие — партнёрскими организациями. Отдельные базы данных могут приобретаться за счёт пожертвований пользователей и целевых приобретений<ref name="Forbes">{{cite web|lang=en|url=https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/?sh=533ba6e282e0|title=The Internet Archive Turns 20: A Behind The Scenes Look At Archiving The Web|author=Kalev Leetaru|date=2016-01-18|publisher=Forbes|archive-url=https://web.archive.org/web/20210815171017/https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/?sh=533ba6e282e0|archive-date=2021-08-15|accessdate=2021-06-05|deadlink=no}}</ref>. Сами создатели организации сравнивали свою коллекцию с [[Александрийская библиотека|Александрийской библиотекой]]{{sfn|Odgen|2017}}. На 2021 год Wayback Machine содержал более 424 млрд веб-страниц{{sfn|Bowyer|2021|pp=43—57}} — больше, чем документов в [[Библиотека Конгресса|Библиотеке Конгресса]]{{sfn|O'Connor|2008|p=64}}{{sfn|Odgen|2017}}<ref name=Forbes />.
+
С запуском Wayback Machine «Архив Интернета» стал одним из самых популярных и узнаваемых онлайн-порталов и главным сервисом [[Архивирование веб-сайтов|веб-архивирования]]<ref name=Bryant/>{{sfn|Price|2011}}. В 1999 году «Архив» начал расширять коллекцию за пределы архивного веб-контента, чтобы обеспечить статус как к оцифрованным, так и изначально цифровым ресурсам, в том числе книгам, аудио, фильмам, изображениям, документам, программному обеспечению и видеоиграм{{sfn|Odgen|2017}}. Некоторые сканирования выполняются поисковыми роботами самого архива, а другие — партнёрскими организациями. Отдельные базы данных могут приобретаться за счёт пожертвований пользователей и целевых приобретений<ref name=Forbes/>. Сами создатели организации сравнивали свою коллекцию с [[Александрийская библиотека|Александрийской библиотекой]]{{sfn|Odgen|2017}}. На 2021 год Wayback Machine содержал более 424 млрд веб-страниц{{sfn|Bowyer|2021|pp=43—57}} — больше, чем документов в [[Библиотека Конгресса|Библиотеке Конгресса]]{{sfn|O'Connor|2008|p=64}}{{sfn|Odgen|2017}}<ref name=Forbes />.
    
== Принцип работы ==
 
== Принцип работы ==
Строка 104: Строка 182:  
|accessdate=2021-06-05
 
|accessdate=2021-06-05
 
|lang=en}}
 
|lang=en}}
</ref>. Помимо этого, каждый пользователь может использовать специальную форму на портале и вызвать краулер, который сохранит страницу в текущем состоянии{{sfn|Lerner|2017|pp=1741—1755}}. Wayback Machine сканирует только общедоступные веб-страницы и не может получить доступ к контенту, защищённому паролем или расположенному на частном сервере<ref name="McKinnon">{{cite web|lang=en|url=https://wpmudev.com/blog/archiving-with-wayback-machine/|title=Using the Wayback Machine to Archive (and Backup) WordPress|author=Jenni McKinnon|date=2017-05-25|publisher=WPMudev|archive-url=https://web.archive.org/web/20210413234350/https://wpmudev.com/blog/archiving-with-wayback-machine/|archive-date=2021-04-13|accessdate=2021-05-29|deadlink=no}}</ref>{{sfn|Bowyer|2021|pp=43—57}}<ref name=Bryant/>.
+
</ref>. Помимо этого, каждый пользователь может использовать специальную форму на портале и вызвать краулер, который сохранит страницу в текущем состоянии{{sfn|Lerner|2017|pp=1741—1755}}. Wayback Machine сканирует только общедоступные веб-страницы и не может получить доступ к контенту, защищённому паролем или расположенному на частном сервере<ref name=McKinnon/>{{sfn|Bowyer|2021|pp=43—57}}<ref name=Bryant/>.
    
=== Интерфейс ===
 
=== Интерфейс ===
Анонимный участник