Изменения

Нет изменений в размере ,  3 года назад
кирлат
Строка 35: Строка 35:  
[[Файл:Brewster Kahle 2009.jpg|thumb|250px|right|[[Кейл, Брюстер|Брюстер Кейл]] в 2009 году]]
 
[[Файл:Brewster Kahle 2009.jpg|thumb|250px|right|[[Кейл, Брюстер|Брюстер Кейл]] в 2009 году]]
   −
В 1989 году английский учёный [[Бернерс-Ли, Тим|Тим Бернерс-Ли]] создал [[всемирная паутина|всемирную паутину]] — систему, позволяющую передавать данные через подключённые к интернету компьютеры. Однако с распространением всемирной паутины были выявлены две основные проблемы. Первая состояла в нехватке мест для хранения всех данных, из-за чего многие документы и веб-страницы удалялись. Другая проблема заключалась в том, что после редактирования веб-страницы (например, по юридическим причинам) пользователи не могли посмотреть её изначальную версию. Решить эти недостатки стремилась американская цифровая библиотека «[[Архив Интернета]]» — некоммерческая организация, созданная программистами [[Кейл, Брюстер|Брюстером Кейлом]] и {{iw|Галлиат, Брюс|Брюсом Галлиатом|en|Bruce Gilliat}} в 1996 году. При сотрудничестве с [[Alexa Internet]] ([[Дочернее общество|дочерней компанией]] [[Amazon]], занимающейся веб-индексированием) «Архив» инициировал создание и хранение копий существующих сайтов для развития «универсального доступа к знанию». Организация предоставляла [[открытый доступ|бесплатный публичный доступ]] к оцифрованным материалам, таким как веб-страницы, книги, аудиозаписи, включая живые концерты, видео, изображения и программное обеспечение. На 2021 год штаб-квартира «Архива Интернета» находится в [[Сан-Франциско]], в здании бывшей христианской церкви, расположенной в районе [[Ричмонд (район Сан-Франциско)|Ричмонд]]. Журналист местной радиостанции {{iw|Kawl|||}} в 2019 году сравнивал офис «Архива» с римским храмом<ref>{{cite web
+
В 1989 году английский учёный [[Бернерс-Ли, Тим|Тим Бернерс-Ли]] создал [[всемирная паутина|всемирную паутину]] — систему, позволяющую передавать данные через подключённые к интернету компьютеры. Однако с распространением всемирной паутины были выявлены две основные проблемы. Первая состояла в нехватке мест для хранения всех данных, из-за чего многие документы и веб-страницы удалялись. Другая проблема заключалась в том, что после редактирования веб-страницы (например, по юридическим причинам) пользователи не могли посмотреть её изначальную версию. Решить эти недостатки стремилась американская цифровая библиотека «[[Архив Интернета]]» — некоммерческая организация, созданная программистами [[Кейл, Брюстер|Брюстером Кейлом]] и {{iw|Галлиат, Брюс|Брюсом Галлиатом|en|Bruce Gilliat}} в 1996 году. При сотрудничестве с [[Alexa Internet]] ([[Дочернее общество|дочерней компанией]] [[Amazon]], занимающейся веб-индексированием) «Архив» инициировал создание и хранение копий существующих сайтов для развития «универсального доступа к знанию». Организация предоставляла [[открытый доступ|бесплатный публичный доступ]] к оцифрованным материалам, таким как веб-страницы, книги, аудиозаписи, включая живые концерты, видео, изображения и программное обеспечение. На 2021 год штаб-квартира «Архива Интернета» находится в [[Сан-Франциско]], в здании бывшей христианской церкви, расположенной в районе [[Ричмонд (район Сан-Франциско)|Ричмонд]]. Журналист местной радиостанции {{iw|Kawl|||}} в 2019 году сравнивал офис «Архива» с римским храмом<ref>{{cite web
 
|url=https://theconversation.com/dominic-cummings-how-the-internet-knows-when-youve-updated-your-blog-139517
 
|url=https://theconversation.com/dominic-cummings-how-the-internet-knows-when-youve-updated-your-blog-139517
 
|title=Dominic Cummings: how the internet knows when you’ve updated your blog
 
|title=Dominic Cummings: how the internet knows when you’ve updated your blog
Строка 117: Строка 117:     
== Характеристика ==
 
== Характеристика ==
С запуском Wayback Machine «Архив Интернета» стал одним из самых популярных и узнаваемых онлайн-порталов и главным сервисом [[Архивирование веб-сайтов|веб-архивирования]]<ref name=Bryant/>{{sfn|Price|2011}}. В 1999 году «Архив» начал расширять коллекцию за пределы архивного веб-контента, чтобы обеспечить статус как к оцифрованным, так и изначально цифровым ресурсам, в том числе книгам, аудио, фильмам, изображениям, документам, программному обеспечению и видеоиграм{{sfn|Odgen|2017}}. Некоторые сканирования выполняются поисковыми роботами самого архива, а другие — партнёрскими организациями. Отдельные базы данных могут приобретаться за счёт пожертвований пользователей и целевых приобретений<ref name=Forbes/>. Сами создатели организации сравнивали свою коллекцию с [[Александрийская библиотека|Александрийской библиотекой]]{{sfn|Odgen|2017}}. На 2021 год Wayback Machine содержал более 424 млрд веб-страниц{{sfn|Bowyer|2021|pp=43—57}} — больше, чем документов в [[Библиотека Конгресса|Библиотеке Конгресса]]{{sfn|O'Connor|2008|p=64}}{{sfn|Odgen|2017}}<ref name=Forbes />.
+
С запуском Wayback Machine «Архив Интернета» стал одним из самых популярных и узнаваемых онлайн-порталов и главным сервисом [[Архивирование веб-сайтов|веб-архивирования]]<ref name=Bryant/>{{sfn|Price|2011}}. В 1999 году «Архив» начал расширять коллекцию за пределы архивного веб-контента, чтобы обеспечить статус как к оцифрованным, так и изначально цифровым ресурсам, в том числе книгам, аудио, фильмам, изображениям, документам, программному обеспечению и видеоиграм{{sfn|Odgen|2017}}. Некоторые сканирования выполняются поисковыми роботами самого архива, а другие — партнёрскими организациями. Отдельные базы данных могут приобретаться за счёт пожертвований пользователей и целевых приобретений<ref name=Forbes/>. Сами создатели организации сравнивали свою коллекцию с [[Александрийская библиотека|Александрийской библиотекой]]{{sfn|Odgen|2017}}. На 2021 год Wayback Machine содержал более 424 млрд веб-страниц{{sfn|Bowyer|2021|pp=43—57}} — больше, чем документов в [[Библиотека Конгресса|Библиотеке Конгресса]]{{sfn|O'Connor|2008|p=64}}{{sfn|Odgen|2017}}<ref name=Forbes />.
    
== Принцип работы ==
 
== Принцип работы ==
Строка 157: Строка 157:  
Изначально коллекция архива пополнялась за счёт браузерного [[плагин]]а от [[Alexa Internet]], который автоматически фиксировал и сохранял каждую веб-страницу по мере её посещения, затем передавая всю собранную информацию в «Архив Интернета». Пользователи также могли установить бесплатную панель инструментов, позволявшую проверять статус архивирования выбранного веб-сайта<ref name=Forbes/>.
 
Изначально коллекция архива пополнялась за счёт браузерного [[плагин]]а от [[Alexa Internet]], который автоматически фиксировал и сохранял каждую веб-страницу по мере её посещения, затем передавая всю собранную информацию в «Архив Интернета». Пользователи также могли установить бесплатную панель инструментов, позволявшую проверять статус архивирования выбранного веб-сайта<ref name=Forbes/>.
   −
В 2002 году «Архив» запустил собственного поискового робота с [[Открытое программное обеспечение|открытым исходным кодом]] — {{iw|Heritrix|||}}. Коды краулеров записаны с помощью комбинации [[Си (язык программирования)|программных языков ]] и [[Perl]]. Помимо этого, «Архив Интернета» также принимает данные сканирования от других доноров{{sfn|Odgen|2017}}. Отсканированные копии веб-сайтов автоматически конвертируются в файлы размером около 100 МБ, которые затем сохраняются на серверах. Общая скорость пополнения архива составляет около 10 [[терабайт]] в месяц<ref name=Kahle>{{cite web
+
В 2002 году «Архив» запустил собственного поискового робота с [[Открытое программное обеспечение|открытым исходным кодом]] — {{iw|Heritrix|||}}. Коды краулеров записаны с помощью комбинации [[Си (язык программирования)|программных языков Си]] и [[Perl]]. Помимо этого, «Архив Интернета» также принимает данные сканирования от других доноров{{sfn|Odgen|2017}}. Отсканированные копии веб-сайтов автоматически конвертируются в файлы размером около 100 МБ, которые затем сохраняются на серверах. Общая скорость пополнения архива составляет около 10 [[терабайт]] в месяц<ref name=Kahle>{{cite web
 
|url=https://www.xml.com/pub/a/ws/2002/01/18/brewster.html
 
|url=https://www.xml.com/pub/a/ws/2002/01/18/brewster.html
 
|title=How the Wayback Machine Works
 
|title=How the Wayback Machine Works
Строка 567: Строка 567:  
}}</ref>.
 
}}</ref>.
   −
В июне 2022 года [[Таганский район|Таганский]] [[Районный суд (Россия)|райсуд]] Москвы оштрафовал Internet Archive на 800 тыс рублей за неудаление из WayBack Machine видео о способах изготовления [[коктейль Молотова|коктейля Молотова]]<ref>{{cite web
+
В июне 2022 года [[Таганский район|Таганский]] [[Районный суд (Россия)|райсуд]] Москвы оштрафовал Internet Archive на 800 тыс. рублей за неудаление из WayBack Machine видео о способах изготовления [[коктейль Молотова|коктейля Молотова]]<ref>{{cite web
 
|url=https://www.kommersant.ru/doc/5435373
 
|url=https://www.kommersant.ru/doc/5435373
 
|title=Машину времени увезли на штрафстоянку
 
|title=Машину времени увезли на штрафстоянку
Анонимный участник