Агентство национальной безопасности США с середины 2000-х активно использует системы распознавания речи для слежки — и способно с высокой точностью установить личность человека, обладая только записью голоса. Издание The Intercept, основанное автором нескольких расследований о системах слежки в АНБ Гленном Гринвальдом, рассказывает, как устроена система распознавания голоса у американских спецслужб — и она куда более совершенная, чем коммерческие разработки.
Голос — самый надежный способ идентифицировать человека. Его трудно подделать, образец, в отличие от ДНК и отпечатков пальцев, легко получить незаметно, голос нельзя так легко изменить, как внешность или паспортные данные. Вокруг любого человека постоянно есть микрофоны, взять хотя бы мобильный телефон.
Для того, чтобы опознать человека по голосу, иногда достаточно нескольких слов. Чем больше база образцов голоса, тем быстрее и надежнее работает распознавание. Вместе с системами идентификации по голосу в АНБ разработали также так называемый «Google для голоса», автоматически переводящий разговорную речь в текст. По этой базе данных можно осуществлять поиск, существует и возможность следить за конкретными ключевыми словами в речи.
Агентство национальной безопасности с 1996 года финансирует исследования в области разработки технологий распознавания речи. Впервые их стали масштабно применять во время войны в Ираке, был даже создан голосовой профиль Саддама Хусейна; также система применялась для поиска укрытия Осамы бен Ладена и во многих других контртеррористических операциях.
«Правительство практически не обсуждает эту технологию, потому что к ней есть много вопросов, на которые оно не хотело бы отвечать. Это самое важное, что случилось с нами и нашими правами со времени терактов 11 сентября 2001 года. Чтобы эта технология работала, нужно только открывать рот», — рассказывает The Intercept бывший сотрудник американских спецслужб на условиях анонимности.
О том, как работает система сбора данных о переписке пользователей в интернете, созданная в АНБ, мы знаем с 2013 года благодаря Эдварду Сноудену. Как следует из материалов, которые он передал журналистам, американские спецслужбы создали масштабную систему сбора метаданных о переписке, которая позволяет узнать многое о человеке — и по решению суда, которое не предается огласке, читать и саму переписку. Для создания этой системы АНБ совместно с британскими спецслужбами организовали масштабную сеть перехвата интернет-трафика при содействии крупнейших онлайн-компаний.
В перехват попадались и аудиофайлы, в том числе телефонные разговоры. Уже как минимум с 2006 года автоматические системы перехвата аудиоданных умели определять, на каком языке и диалекте говорит человек, его пол, а также сравнивать образец голоса с тем, что уже есть в базе данных. Уже в 2010-м система распознавала речь на 25 языках. В 2007-м во время визита президента Ирана Махмуда Ахмадинежада в США спецслужбы получили образцы голосов всех 143 членов делегации; система посылала уведомления, если они говорили о чем-то потенциально важном.
С годами технология развивалась и совершенствовалась. К примеру, уже к 2010 году АНБ научилось выявлять случаи, когда люди говорят по телефону с помощью фильтров, маскирующих голос для конспирации. В Йемене было найдено 80 таких случаев на один миллион проверенных аудиозаписей. Такой анализ позволил спецслужбам выявить несколько человек, которые скрывались от американских агентов. Развернутая в том же году система анализа переговоров в Мехико научилась вычленять из обычных записей слово «бомба» и уведомлять об этом.
АНБ применяет систему распознавания речи не только для поиска террористов за рубежом, но и для выявления потенциальных предателей внутри спецслужбы, пишет The Intercept. Как именно она использовалась и помогла ли найти людей, планировавших утечки секретных документов, достоверно неизвестно, но, судя по всему, в спецслужбе создали базу данных из образцов голосов сотрудников.
Американские законы запрещают сбор данных о гражданах страны без разрешения суда, но при массовой слежке за онлайн-перепиской информация неизбежно попадает в базы данных и анализируется. Пока, по данным издания, нет сведений, что АНБ начало собирать образцы речи американцев. Если же спецслужба сможет доказать, что по закону имеет на это право, то получит мощный инструмент для установления личности любого человека, который по каким-либо причинам этого не хочет — анонимного источника журналистов, самих журналистов, преступников или активистов и многих других.
Ситуация осложняется распространением домашних голосовых помощников типа Amazon Echo, которые постоянно анализируют все разговоры в квартире на случай, если владелец к ним обратится. АНБ уже доказало, что может получать доступ к трафику крупнейших компаний и анализировать его по своему усмотрению.