— Алгоритмы разглядели в этом более глубокий смысл. Сознательно или нет, инопланетяне явно помещают ценные для них вещи с той стороны, где у них одна рука. Мы назвали их «моносторона» и «бисторона», и всё, имеющее большую ценность и нуждающееся в защите, всегда находится на моностороне.
— И всё это сделали алгоритмы? Начав с нуля?
— Не с нуля. Они начали с сотен миллионов изображений, каждое из которых просмотрели с терпением и вдумчивостью, недоступной человеку.
* * *
Наконец, пришла очередь Эмили занять место свидетеля. Ханна Плакстон задала ей серию отрепетированных вопросов об алгоритмах извлечения данных, открывших для человечества Ретикулум. Но потом Пётр Судейко начал перекрёстный опрос.
— Доктор Чу, — сказал он, — я был впечатлён естественностью речи Урсулы.
— Спасибо.
— Вы в самом деле проделали великолепную работу, создав ИИ-аватар инопланетянина, с помощью которого можно осуществлять поиск в Ретикулуме так же легко, как в нашей Всемирной паутине.
— Спасибо. Это была командная работа.
— Это правда поражает воображение. Я считал, что универсальная трансляция того сорта, что выполняет Урсула, невозможна. Не могли бы вы пояснить нашему достойному жюри присяжных, каким образом это было достигнуто?
— Конечно. Мы достигли первого прорыва в деле распознавания спонтанной речи в 2010 году, воспользовавшись полностью связными глубинными нейронными сетями, или ГНС. Для глубинного обучения вы даёте нейронным сетям всё новые и новые образцы, и сравнивая их, сети в конце концов догадываются о семантике слов, семантике предложений и модели знаний.
Одним из ключевых факторов оказалось понимание того, что семантическое намерение лучше определяется на уровне фразы/предложения, а не уровне отдельного слова. В конце концов, слова часто многозначны: «лук» — это овощ или метательное оружие? Но фраза или предложение, а ещё лучше документ целиком, содержат богатую контекстную информацию, которой мы можем воспользоваться. И, разумеется, целая сеть, неважно, их или наша, содержит бесчисленные розеттские камни. К примеру, есть лишь несколько способов представления периодической системы элементов, а любая технологически развитая цивилизация должна как-то это делать.
Так что наши нейронные сети просто смотрят, какие инопланетные слова часто соседствуют с изображениями каких объектов. Это статистическая игра, но если играешь в неё достаточно долго, то выигрываешь.
— Понятно. И для простых вещей оказывается довольно легко составить таблицу перевода.
— Верно. К примеру, они прислали тысячи фотографий образцов минералов, и, просматривая тексты, связанные с этими фотографиями, нейронные сети способны не только выяснить названия конкретных минералов — как на их языке называется кварц или алмаз — но и со временем догадаться об их более общих терминах, в том числе таких, что подчёркивают различия, о которых даже большинство людей не имеет понятия, как к примеру, о разнице между «горной породой» и «минералом».
— Должна признаться, что я и сам не знаю, в чём разница.
— Минерал однороден и имеет специфическую кристаллическую структуру; горная порода сложена из множества минералов.
— Вот как, — сказал Судейко. — Значит, я полагаю, пользуясь той же самой методикой, ваши алгоритмы опознали слова, которыми инопланетяне называют, скажем, «ручей» и «реку»?
— Точно так.
— «Пруд» и «озеро».
— Верно.
— «Море» и «океан». |