Изменить размер шрифта - +

— Алгоритмы разглядели в этом более глубокий смысл. Сознательно или нет, инопланетяне явно помещают ценные для них вещи с той стороны, где у них одна рука. Мы назвали их «моносторона» и «бисторона», и всё, имеющее большую ценность и нуждающееся в защите, всегда находится на моностороне.

— И всё это сделали алгоритмы? Начав с нуля?

— Не с нуля. Они начали с сотен миллионов изображений, каждое из которых просмотрели с терпением и вдумчивостью, недоступной человеку.

 

 

* * * 

 

Наконец, пришла очередь Эмили занять место свидетеля. Ханна Плакстон задала ей серию отрепетированных вопросов об алгоритмах извлечения данных, открывших для человечества Ретикулум. Но потом Пётр Судейко начал перекрёстный опрос.

— Доктор Чу, — сказал он, — я был впечатлён естественностью речи Урсулы.

— Спасибо.

— Вы в самом деле проделали великолепную работу, создав ИИ-аватар инопланетянина, с помощью которого можно осуществлять поиск в Ретикулуме так же легко, как в нашей Всемирной паутине.

— Спасибо. Это была командная работа.

— Это правда поражает воображение. Я считал, что универсальная трансляция того сорта, что выполняет Урсула, невозможна. Не могли бы вы пояснить нашему достойному жюри присяжных, каким образом это было достигнуто?

— Конечно. Мы достигли первого прорыва в деле распознавания спонтанной речи в 2010 году, воспользовавшись полностью связными глубинными нейронными сетями, или ГНС. Для глубинного обучения вы даёте нейронным сетям всё новые и новые образцы, и сравнивая их, сети в конце концов догадываются о семантике слов, семантике предложений и модели знаний.

Одним из ключевых факторов оказалось понимание того, что семантическое намерение лучше определяется на уровне фразы/предложения, а не уровне отдельного слова. В конце концов, слова часто многозначны: «лук» — это овощ или метательное оружие? Но фраза или предложение, а ещё лучше документ целиком, содержат богатую контекстную информацию, которой мы можем воспользоваться. И, разумеется, целая сеть, неважно, их или наша, содержит бесчисленные розеттские камни. К примеру, есть лишь несколько способов представления периодической системы элементов, а любая технологически развитая цивилизация должна как-то это делать.

Так что наши нейронные сети просто смотрят, какие инопланетные слова часто соседствуют с изображениями каких объектов. Это статистическая игра, но если играешь в неё достаточно долго, то выигрываешь.

— Понятно. И для простых вещей оказывается довольно легко составить таблицу перевода.

— Верно. К примеру, они прислали тысячи фотографий образцов минералов, и, просматривая тексты, связанные с этими фотографиями, нейронные сети способны не только выяснить названия конкретных минералов — как на их языке называется кварц или алмаз — но и со временем догадаться об их более общих терминах, в том числе таких, что подчёркивают различия, о которых даже большинство людей не имеет понятия, как к примеру, о разнице между «горной породой» и «минералом».

— Должна признаться, что я и сам не знаю, в чём разница.

— Минерал однороден и имеет специфическую кристаллическую структуру; горная порода сложена из множества минералов.

— Вот как, — сказал Судейко. — Значит, я полагаю, пользуясь той же самой методикой, ваши алгоритмы опознали слова, которыми инопланетяне называют, скажем, «ручей» и «реку»?

— Точно так.

— «Пруд» и «озеро».

— Верно.

— «Море» и «океан».

Быстрый переход