Искусственный интеллект работает в архиве цензором?

Алгоритмы скрывают сведения даже о вполне публичных фигурах, что затрудняет доступ к источникам по новейшей истории и в итоге искажает саму историю.

Показать больше
Хотите читать швейцарские СМИ с нами? Подпишитесь на рассылку
Кто контролирует доступ к архивам, тот управляет прошлым. В Швейцарии таким главным управляющим является директор бернского Федерального архива Швейцарии (Bundesarchiv) Филипп Кюнцлер (Philipp Künzler). По его словам, сказанным в интервью телеканалу SRFВнешняя ссылка, задача архива — не только обеспечивать сохранность документов, но и гарантировать их доступность. «Я не склонен ограничивать без необходимости доступность архивных материалов», — подчёркивает он.
С активным развитием и внедрением цифровых технологий историки получили возможность осуществлять удалённый поиск по архивным фондам. Однако в то же время архив обязан соблюдать положения законодательства о защите персональных данных: в течение установленного срока секретности сведения, позволяющие идентифицировать ту или иную личность, должны быть анонимизированы.
Чтобы справиться с огромным объёмом такой работы, Федеральный архив применяет искусственный интеллект. Алгоритмы автоматически редактируют метаданные — скрывают имена, должности, государственные учреждения и другие идентификаторы. Историки, однако, подчёркивают, что алгоритмы склонны «перегибать палку», скрывая даже ту информацию, которая по закону должна быть общедоступной. В результате описания фондов или отдельных дел становятся неполными, а многие документы — невидимыми для системы поиска.
От полного каталога — к фильтрованному отображению
«Раньше, когда документы находились в архивах, они были в свободном доступе», — говорит профессор новой и новейшей истории Саша Цала (Sacha Zala), президент Швейцарского исторического общества (Schweizerische Gesellschaft für Geschichte) и директор исследовательского Центра дипломатических документов Dodis. Его команда много работает с документами из Федерального архива. Но часто они в своей работе наталкиваются на невидимый барьер, играющий роль своего рода «вышибалы» на входе в клуб.
Читайте по теме:

Показать больше
Карты Google Maps и их швейцарская история
Саша Цала говорит в этом случае о «парадоксе Google»: «Сегодня информацию можно легко найти в Интернете, и именно поэтому часто раздаются громкие крики о необходимости усиления защиты персональных данных». И в самом деле: по данным Федерального архива, с тех пор как стал возможен поиск в Интернете, фонды этого архива стали куда более востребованным источником информации. Сегодня в этом архиве анонимизированы более 1,4 миллиона дел, многие из которых больше не выводятся в результатах поиска, при том, что зачастую не имелось объективных оснований для такой обработки.
Однако, как подчёркивает Саша Цала, среди них немало документов, в которых были анонимизированы даже общедоступные сведения, не подпадающие под особую защиту. «Скрываются общеизвестные имена послов, государственных секретарей, даже имя бразильского президента было заретушировано», — отмечает он. При этом такие имена и данные, в соответствии с действующим законодательством, не должны подлежать ограничениям по доступу — но алгоритм не делает здесь никакого различия.
Невидимые документы — искажённая историческая картина
Значит ли это, что искусственный интеллект затрудняет работу в Федеральном архиве? Филипп Кюнцлер так не считает, хотя и признаёт: иногда нужные документы не сразу появляются в результатах поиска. Однако при поддержке архивных специалистов можно провести углублённый поиск по всей структуре фондов и найти нужный документ. Это занимает больше времени, но технически возможно. Историк Саша Цала считает, что такой порядок слишком сложен и требует неоправданных временных затрат.
А вы знали?

Показать больше
Швейцария рассекретила архивы за 1994 год
Федеральный уполномоченный правительства Швейцарии по защите данных (Eidgenössischer Datenschutzbeauftragte) Адриан Лобзигер (Adrian Lobsiger) разделяет эту обеспокоенность и призывает к осторожности. По его словам, автоматическая обработка должна использоваться разумно: «Если ИИ помогает быстрее находить персональные данные, которые действительно требуют защиты, — это хорошо. Но его цель не в том, чтобы скрывать всю информацию подряд, особенно ту, которая должна быть доступной».
Федеральный архив утверждает, что ошибочно был обработан лишь небольшой процент документов, то есть в них были скрыты данные, которые должны были бы оставаться в открытом доступе. Однако даже 1–2% от общего объёма в 1,4 миллиона дел означают десятки тысяч единиц хранения, в которых могли быть скрыты общеизвестные имена значимых исторических личностей — дипломатов, президентов, государственных секретарей. А именно такие документы особенно важны для исследовательского сообщества.
Читайте также:

Показать больше
Военные и прочие тайны швейцарских топографических карт
В конце концов, «вышибалы» в Федеральном архиве работают так же, как и на входе в элитные клубы: они обоснованно дотошны в своих проверках — но иногда даже чересчур. И даже если вы прошли внутрь, то входной контроль всё равно может оказаться чрезмерно строгим. «Это с точки зрения научных исследований серьёзная проблема, потому что после бесплодных поисков можно ошибочно прийти к выводу, что по данному человеку вообще нет никаких документов. А на самом деле они есть — просто их невозможно найти». Исправить такую ошибку можно лишь случайно, ведь чаще всего исследователи даже не узнают, что интересующий их документ был автоматически отредактирован при помощи ИИ.
Сроки секретности документов
Согласно Федеральному закону «Об архивном деле» (Bundesgesetz über die Archivierung), в Швейцарии действуют три уровня ограничений доступа к архивным фондам:
30 лет — стандартный срок секретности: документы становятся полностью доступными по его истечении;
50 лет — срок защиты дел, содержащих персональные данные, включая «чувствительную» информацию (медицинские, семейные, социальные сведения);
Неограниченный срок — применяется в исключительных случаях, когда существует угроза общественным интересам (например, в отношении документов, связанных с действующими военными объектами).

Показать больше
Кратко о Культуре от swissinfo.ch

В соответствии со стандартами JTI
Показать больше: Сертификат по нормам JTI для портала SWI swissinfo.ch
Обзор текущих дебатов с нашими журналистами можно найти здесь. Пожалуйста, присоединяйтесь к нам!
Если вы хотите начать разговор на тему, поднятую в этой статье, или хотите сообщить о фактических ошибках, напишите нам по адресу russian@swissinfo.ch.