Совместное сканирование Интернета
Posted: Thu Jul 10, 2025 3:10 am
Сегодня первая фаза версии 5.0 веб-приложения Archive-It была выпущена для использования 326 партнерами, использующими сервис Archive-It.
В 1996 году, когда был основан Архив Интернета, мы использовали автоматизированные поисковые роботы для сбора информации в Интернете, сканируя миллионы веб-страниц и сохраняя их для истории. По иронии судьбы, цифровая летопись человечества создавалась с помощью компьютерных алгоритмов.
С годами стало ясно, что нам нужны люди и сообщества, которые Данные телеграммы будут собирать и сохранять то, что действительно важно. Поэтому в феврале 2006 года мы запустили сервис Archive-It версии 1.0, который позволил библиотекарям и архивистам стать веб-архивистами, инициируя целенаправленные, курируемые сканирования живой сети с помощью простого веб-приложения при поддержке партнёров и технической поддержки. Запуск Archive-It означал, что мы можем помочь нашим коллегам создавать собственные веб-коллекции для их библиотек, а также сформировать сообщество, занимающееся веб-архивированием, для совместной работы над созданием глобальной цифровой публичной.
Теперь, переходя на новое поколение Archive-It с версией 5.0, мы надеемся предоставить ещё более совершенные инструменты для разработки коллекций. Выпущенная на этой неделе версия 5.0 первой фазы отличается новым, ярким пользовательским интерфейсом и значительно улучшенными отчётами по результатам сканирования, включающими инфографику с визуальным представлением данных.
представитель данных
Рисунок 1: Скриншот раздела «Отчеты» нового пользовательского интерфейса Archive-It 5.0
В 2006 году понимание сути веб-архивирования было недостаточным, и многие организации сомневались, является ли эта деятельность обоснованной и может ли или должна ли она быть частью их более масштабных институциональных стратегий сбора информации. Ведь проблемы были ошеломляющими: качество веб-контента было разным; противоречивые политики и организационные структуры создавали трудности; никто ещё не разработал оптимальные методы отбора контента, обработки метаданных и интеграции этого нового типа контента в другие фонды и существующие каталоги учреждения. Кроме того, тогда мы не могли предсказать, насколько часто материалы, ранее существовавшие на физических носителях, теперь будут появляться в интернете только в цифровом формате.
Мы запустили сервис Archive-It с небольшой группой единомышленников и сторонников, среди которых были библиотекари и архивисты из Университета Индианы, Техасского университета в Остине, Библиотеки Вирджинии, Библиотеки штата Монтана, а также Архивов штата Северная Каролина и Библиотеки штата. Партнеры были очень терпеливы с нами и с Archive-It 1.0, который был ещё совсем пустым. Сотрудничество и работа с библиотечным и архивным сообществом всегда были главным приоритетом для Интернет-архива и определяющей характеристикой сервиса Archive-It. За последние 8+ лет много раз случалось, что мы не знали ответа на вопрос, и мы говорили: «Давайте спросим сообщество и посмотрим, что они думают!» И сообщество всегда возвращалось к нам с поддерживающими ответами — как наглядными, так и конкретными.
В 1996 году, когда был основан Архив Интернета, мы использовали автоматизированные поисковые роботы для сбора информации в Интернете, сканируя миллионы веб-страниц и сохраняя их для истории. По иронии судьбы, цифровая летопись человечества создавалась с помощью компьютерных алгоритмов.
С годами стало ясно, что нам нужны люди и сообщества, которые Данные телеграммы будут собирать и сохранять то, что действительно важно. Поэтому в феврале 2006 года мы запустили сервис Archive-It версии 1.0, который позволил библиотекарям и архивистам стать веб-архивистами, инициируя целенаправленные, курируемые сканирования живой сети с помощью простого веб-приложения при поддержке партнёров и технической поддержки. Запуск Archive-It означал, что мы можем помочь нашим коллегам создавать собственные веб-коллекции для их библиотек, а также сформировать сообщество, занимающееся веб-архивированием, для совместной работы над созданием глобальной цифровой публичной.
Теперь, переходя на новое поколение Archive-It с версией 5.0, мы надеемся предоставить ещё более совершенные инструменты для разработки коллекций. Выпущенная на этой неделе версия 5.0 первой фазы отличается новым, ярким пользовательским интерфейсом и значительно улучшенными отчётами по результатам сканирования, включающими инфографику с визуальным представлением данных.
представитель данных
Рисунок 1: Скриншот раздела «Отчеты» нового пользовательского интерфейса Archive-It 5.0
В 2006 году понимание сути веб-архивирования было недостаточным, и многие организации сомневались, является ли эта деятельность обоснованной и может ли или должна ли она быть частью их более масштабных институциональных стратегий сбора информации. Ведь проблемы были ошеломляющими: качество веб-контента было разным; противоречивые политики и организационные структуры создавали трудности; никто ещё не разработал оптимальные методы отбора контента, обработки метаданных и интеграции этого нового типа контента в другие фонды и существующие каталоги учреждения. Кроме того, тогда мы не могли предсказать, насколько часто материалы, ранее существовавшие на физических носителях, теперь будут появляться в интернете только в цифровом формате.
Мы запустили сервис Archive-It с небольшой группой единомышленников и сторонников, среди которых были библиотекари и архивисты из Университета Индианы, Техасского университета в Остине, Библиотеки Вирджинии, Библиотеки штата Монтана, а также Архивов штата Северная Каролина и Библиотеки штата. Партнеры были очень терпеливы с нами и с Archive-It 1.0, который был ещё совсем пустым. Сотрудничество и работа с библиотечным и архивным сообществом всегда были главным приоритетом для Интернет-архива и определяющей характеристикой сервиса Archive-It. За последние 8+ лет много раз случалось, что мы не знали ответа на вопрос, и мы говорили: «Давайте спросим сообщество и посмотрим, что они думают!» И сообщество всегда возвращалось к нам с поддерживающими ответами — как наглядными, так и конкретными.