Kitabı oku: «Искусственный интеллект – для вашего бизнеса. Руководство по оценке и применению», sayfa 4
Что такое машинное обучение?
Итак, мы рассмотрели четыре основных фактора, способствующие исключительно быстрому прогрессу искусственного интеллекта и его активному внедрению во все сферы бизнеса: «большие» данные, дешевые носители информации, быстрые процессоры и сети электронных коммуникаций по всему миру. Уберите любой из этих компонентов – и искусственный интеллект все еще пытался бы с трудом «выбиться в люди» на фоне очередного «ледникового периода». Кроме того, каждое из перечисленных достижений компьютерных технологий выступало как катализатор для всех остальных – не располагай мы столь дешевыми носителями, мы бы не смогли хранить такие огромные массивы данных, а следовательно, не было бы стимула для разработки более быстрых процессоров. И все же в самом сердце деятельности, питающей искусственный интеллект, лежит машинное обучение.
Тем, кто хочет иметь дело с искусственным интеллектом, необходимо ясно понимать, что такое машинное обучение и зачем оно существует; при этом вам вовсе необязательно разбираться в технических деталях его работы. Как следует из названия, основа этого подхода в том, что именно машина выполняет всю сложную вычислительную работу, нацеленную на понимание и решение той или иной проблемы. По сути, в этом случае «код» пишет не человек, а машина. Разработчик-человек лишь «засевает поле», определяя тот алгоритм (или группу алгоритмов), которые подлежат обучению, а затем машина уже сама использует те или иные данные для разработки решения, специфического для конкретной задачи. Мы уже видели, что проблема для алгоритма может изначально быть неопределенной (это напоминает обучение без учителя при помощи шаблонов) или определенной (тогда это контролируемое обучение, при котором алгоритм тренируется с помощью больших наборов данных, чтобы ответить на конкретный вопрос). Большинству людей проще представить себе контролируемое обучение: таков, скажем, описанный мною выше пример алгоритма для выявления разницы между изображениями собак и изображениями кошек.
В предыдущей главе я описал технологию DNN (глубокие нейронные сети) – послойную сетевую архитектуру, которая используется для так называемого «глубокого» машинного обучения. Любая DNN состоит из нескольких отличающихся друг от друга слоев; чем сложнее решаемая проблема, тем больше нужно слоев. Большое количество уровней (слоев) нейронной сети означает также, что обучение требует большей вычислительной мощности и займет гораздо больше времени для полного завершения. Входной уровень нейронной сети принимает данные и приступает к их кодированию. Выходной слой – это место, в котором формируется ответ, и в нем всегда будет столько же узлов, сколько существует классов (вариантов) ответа. Таким образом, в примере с собакой и кошкой было бы два выходных узла – один для собаки и один для кошки (рис. 2.1), хотя в принципе мы могли бы назначить и три узла, если бы у нас были картинки, в которых нет ни собаки, ни кошки.
Между входным слоем и выходным слоем расположены так называемые скрытые слои. Именно здесь происходит вся основная работа с данными. Каждый скрытый слой будет искать различные детали в данных с возрастающей сложностью, иначе говоря, при распознавании изображений разные слои будут искать контуры, тени, формы, цвета и т. д. В этих скрытых слоях будет больше узлов («нейронов»), чем во входных или выходных слоях, причем эти узлы связаны друг с другом через каждый слой, но не имеют связей внутри слоя. Каждое из соединений имеет определенный «вес» или «силу», которые определяют, сколько информации в одном узле переносится на следующий уровень. Так называемая «сильная» связь, которая в процессе обучения привела к «правильному» ответу на выходе, подразумевает, что информация активно распространяется через нее на следующий уровень. Наоборот, «слабая» связь с низким весом, которая привела к «неправильному» ответу в процессе обучения, не передает много информации (рис. 2.2).
Поскольку модель обучается с использованием все большего и большего количества данных, «вес» связей постоянно корректируется в процессе тренировки (это, собственно, и есть машинное обучение), пока не будет достигнуто оптимальное решение. Чем больше данных мы передадим в модель, тем больше у машины шансов уточнить «вес» тех или иных связей и тем более точным будет решение, однако это означает и большую нагрузку на компьютер. Окончательная (обученная) версия модели называется «функцией сопоставления» (англ. «matching function») – ее уже можно использовать для классификации данных, не использовавшихся в тренинге: например, я могу дать ей фотографию собаки, которую она раньше не «видела», и она будет в состоянии идентифицировать ее правильно, то есть как собаку (рис. 2.3).
Это краткое описание принципов машинного обучения еще раз демонстрирует зависимость искусственного интеллекта от прорывов, свершившихся в четырех технологических областях, о которых шла речь выше. Нам нужно как можно больше данных для обучения скрытых слоев, чтобы правильно скорректировать «вес» связей, и это означает, что мы должны иметь возможность хранить те самые данные дешево и компактно, и как можно быстрее обрабатывать их, тренируя наши модели, и, наконец, иметь доступ к разнообразным данным из максимально возможного количества источников. Без любого из этих факторов машинное обучение осталось бы нежизнеспособным – либо из-за низкой точности, либо из-за трудностей проектирования и реализации (что само по себе уже достаточно сложно даже для современных машин).
Выгоду из современного технологического прорыва извлекло не только машинное обучение, но и другие виды ИИ, в том числе классический «символический» искусственный интеллект, наиболее успешной формой которого являются экспертные системы.
Что препятствует развитию искусственного интеллекта?
Итак, со всеми нашими массовыми данными, дешевыми накопителями информации, молниеносно считающими процессорами и глобальной коммуникационной «паутиной» мы можем не опасаться, что прогресс искусственного интеллекта будет прерван новым периодом застоя? Кто знает… Существует несколько проблем, которые вполне способны испортить праздник всем «фанатам» искусственного интеллекта.
На мой взгляд, самым серьезным препятствием на пути разгона искусственного интеллекта до космических скоростей являются, как и прежде, завышенные ожидания. Слишком много всего написано и сказано о том, на что способен совершенный искусственный интеллект, особенно когда речь идет об универсальном искусственном интеллекте, а не об узкоспециализированном ИИ, которым мы располагаем сегодня. Оба предыдущих «оледенения» уже были спровоцированы чрезмерными, точнее нереалистичными ожиданиями, и поэтому с нашими желаниями и упованиями нужно обращаться осторожно. Главной мотивацией написания этой книги было для меня стремление спустить искусственный интеллект «на землю», чтобы его можно было оценивать по его реальной стоимости сегодня и завтра, а не фантазировать о том, сколько он будет стоить лет через двадцать.
Еще один негативный фактор, искажающий восприятие искусственного интеллекта и вызванный в первую очередь нездоровым ажиотажем вокруг далеко не очевидных проблем, – это страх перед событиями в гипотетическом мире, где искусственный интеллект работает повсеместно. Особенно когда дело касается ожидаемых фундаментальных изменений в характере занятости людей. За последнее время уже многое изменилось в том, как люди работают и что именно они делают. Это было связано, например, с внедрением персональных компьютеров, развитием фриланса и аутсорсинга, однако искусственный интеллект угрожает переменами гораздо большего масштаба. Так, умозрительные прогнозы ученых и даже целых учреждений регулярно предупреждают о предстоящем уничтожении касты «белых воротничков» и ликвидации всего среднего класса вместе с его рабочими местами. Правда это или нет – большой и сложный вопрос, но страх, который порождают подобные прогнозы, поневоле заставляет всех тех, кто занимается бизнесом и боится пострадать от повсеместного внедрения искусственного интеллекта, вставать в защитную позу.
Третий аспект, который напрямую связан с первыми двумя, – это самое обычное невежество. Как люди могут рассчитывать на выгоду от внедрения искусственного интеллекта (или бояться, что он все у них отнимет), если они не владеют достаточным пониманием того, что это вообще такое? Шумиха вокруг данной темы совершенно не способствует вдумчивому отношению к искусственному интеллекту, а между тем это очень сложное явление, и деловому человеку, не имеющему технического образования, совсем не просто разобраться в его природе. Максима, гласящая, что дилетантизм опаснее незнания, как нельзя более подходит для случая с искусственным интеллектом, однако обладание всеми знаниями из этой области тоже едва ли необходимо, если только вы не хотите стать специалистом по информатике или разработчиком искусственного интеллекта. Эта книга призвана сформировать у вас «среднезолотой» уровень понимания искусственного интеллекта – достаточного, чтобы вы могли эффективно использовать искусственный интеллект на практике, но не перегружающего ваш мозг техническими деталями и специальной лексикой.
Наконец, последний фактор, который может затормозить развитие искусственного интеллекта, – это регулирование со стороны государства, банков и других учреждений, обладающих властью. Как я уже упоминал, большая часть вычислительной работы, выполняемой системой искусственного интеллекта, скрыта и от разработчика, и от пользователя, поэтому, как правило, искусственный интеллект не оставляет никаких следов, позволяющих подробно проследить, как именно алгоритм пришел к определенному решению. Например, я могу ради обучения «скормить» ИИ-алгоритму большое число заявок на получение кредитов с пометками о том, какие из них были одобрены, а какие – нет, и на этой основе создать сложную систему, дающую рекомендации по утверждению или отклонению заявок на кредиты. Однако никто не сможет узнать, как и почему эта система рекомендует или отклоняет ту или иную конкретную заявку, а это уже создает проблемы для регулирующих органов, которым необходимо зафиксировать процесс принятия решений. Существует несколько подходов, которые позволяют смягчить эту проблему, но все-таки принципиальная непрозрачность искусственного интеллекта может стать серьезной проблемой для его распространения в деловой сфере.
Я расскажу обо всех этих аспектах более подробно в главе 8, однако полагаю, что для пользы дела некоторое представление о них следует получить уже сейчас.
Некоторые примеры использования искусственного интеллекта
Пусть даже вызванный чрезмерной шумихой, факт остается фактом: сейчас на рынке искусственного интеллекта происходит настоящий прорыв. Но кто именно получает выгоду от всех этих новых достижений? Только ли исследовательские лаборатории и отдельные стартапы, с успехом занимавшиеся компьютерными играми, или же существует нечто более серьезное? Предоставляет ли сегодня искусственный интеллект реальную ценность для бизнеса?
В своей области деятельности я вижу множество примеров использования различными компаниями технологий искусственного интеллекта для поиска новых подходов к работе и повышения ее эффективности. ИИ действительно обеспечивает такие преимушества, которые люди едва ли могут создать себе сами.
Одна из лучших сфер применения искусственного интеллекта сегодня – это обслуживание клиентов. Скажем, некая английская железнодорожная компания использует искусственный интеллект для классификации писем, приходящих от клиентов. Суть работы заключается в том, что искусственный интеллект «читает» письмо, написанное в произвольной форме, и определяет, что именно хотел сообщить клиент. Например, если я не смог получить заранее оплаченное место в поезде 08:06 от станции Юстон в Лондоне до Центрального Глазго, я бы написал железнодорожной компании что-то вроде: «Не могу поверить – я заплатил деньги за билет в 08:06 из Лондона в Глазго и не смог получить место. В этот раз вы буквально превзошли сами себя!» Вся существенная информация извлекается искусственным интеллектом из моего неструктурированного текста и проверяется (Был ли поезд в 08:06? Жаловались ли другие люди на ту же услугу? Является ли клиент постоянным автором жалоб? и т. д.), после чего мой запрос немедленно направляется соответствующему лицу в отдел по обслуживанию клиентов. Обратите внимание, что моя формулировка во втором предложении имеет саркастический тон, поэтому искусственный интеллект должен понимать разницу между завуалированной жалобой и настоящим комплиментом. Работа этой системы позволяет оператору сразу иметь под рукой все данные, чтобы ответить на мое письмо.
Аналогичным образом действует одна британская страховая компания, которая предоставляет своим клиентам автоматизированные услуги по обработке претензий. Этот сервис обеспечивает ввод неструктурированных и полуструктурированных данных (жалоб, предложений, корреспонденции, отчетов страховщиков, чеков и всех других документов, относящихся к страховым претензиям), чтобы они направлялись в соответствующие системы и очереди ожидания. Используя решения, принимаемые искусственным интеллектом, команда из четырех человек обрабатывает таким образом около 3000 документов в день, четверть из которых – в бумажном виде. Инструмент ИИ-автоматизации обрабатывает отсканированные и электронные документы, идентифицирует информацию о заявках и другие метаданные и помещает результаты в базы данных и другие хранилища документов, после чего они уже готовы для рассмотрения людьми, обрабатывающими корреспонденцию. Он также добавляет к документам метаданные службы обработки, так что ее производительность можно непрерывно контролировать. Некоторые документы могут быть обработаны без какого-либо вмешательства человека, а другие требуют взгляда со стороны команды операторов, чтобы подтвердить решения, принятые искусственным интеллектом, или заполнить недостающие детали.
Хорошим примером работы искусственного интеллекта в юридическом секторе является система ROSS, построенная вокруг платформы IBM Watson. Эта система использует целый ряд возможностей искусственного интеллекта, включая распознавание естественного языка (англ. Natural Language Understanding, NLU), поиск и оптимизацию. Когда у адвоката возникает вопрос, требующий дополнительного поиска и исследования (например, существуют ли судебные прецеденты того, что сотрудника увольняли за грубое нарушение в течение первых нескольких дней после окончания испытательного срока), он может обратиться к системе ROSS и ввести запрос на обычном английском языке (без чрезмерных усложнений). Затем система проводит «опрос» всего свода законов о занятости и в течение нескольких секунд предоставляет юристу ответы, ранжированные по релевантности. Альтернативой этому автоматическому анализу могли бы быть разве что многие часы, потраченные самим юристом (или его помощником, или младшим юристом) на изучение текстов законов, причем, скорее всего, они не смогут проверить все доступные документы. Как и все хорошие системы искусственного интеллекта, ROSS является самообучающейся: юристы могут оценить качество ответов, показанных ROSS, и научить систему давать в будущем более точные или полные ответы.
Некоторые компании используют искусственный интеллект для создания совершенно новых направлений бизнеса. Американская банковская и брокерская компания «Чарльз Шваб» (англ. Charles Schwab) создала инвестиционный инструмент под названием Schwab Intelligent Portfolios, который использует искусственный интеллект для управления инвестиционными портфелями клиентов (его иногда называют «робоконсультантом»). Он ориентирован на недорогие биржевые фонды и не имеет консультационных тарифов, платы за обслуживание счета или комиссионных сборов. После запуска «робоконсультации» в 2015 году появилось и еще несколько фирм с аналогичными ИИ-моделями для анализа инвестиционного рынка в интересах вкладчиков, в числе которых Betterment, Wealthfront и FutureAdvisor (все они взимают плату за администрирование, но очень небольшую). Привлекательность низких или нулевых комиссий и простота работы с искусственным интеллектом привели к тому, что эти виды услуг широко распространились среди начинающих инвесторов, а банки заполучили новых клиентов, которых они, скорее всего, не смогли бы привлечь иными способами.
Заключение
Таким образом, искусственный интеллект сейчас успешно используется компаниями по всему миру. Шквальный рост объема массовых данных, дешевые носители информации, высокоскоростные процессоры и глобальная информационная сеть позволили ученым разработать принципы машинного обучения, которое со стороны выглядит почти как магия. Но искусственному интеллекту удалось вырваться из лаборатории и войти в повседневную жизнь. Сейчас его коммерциализируют все – от малобюджетных стартапов до интернет-гигантов. У руководителей почти любых компаний существуют реальные возможности использовать преимущества искусственного интеллекта для создания новых источников стоимости в своем бизнесе и даже для того, чтобы бросать вызов существующим бизнес-моделям, вплоть до полного их разрушения. Но для этого, конечно, необходимо сначала понять, что это за возможности и как их можно использовать.
Академический взгляд на проблему
Вот небольшая выдержка из интервью с доктором Уиллом Вентерсом, доцентом в области информационных систем Лондонской школы экономики.
ЭБ: Чем подпитывается нынешняя суета вокруг искусственного интеллекта?
УВ: Здесь существует несколько главных тенденций. Разумеется, основные алгоритмы, обеспечивающие работу искусственного интеллекта, стали намного умнее и используются более эффективно. Но все-таки главный прорыв случился не здесь. Что действительно изменило мир искусственного интеллекта, так это сильно возросшая вычислительная мощность компьютеров, а также возможность обрабатывать гораздо большие объемы массовых данных.
В свое время мы наблюдали, как шахматная система IBM Big Blue победила Гарри Каспарова, затем платформа Watson даже без доступа к интернету выиграла у лучших соперников-людей в игре Jeopardy! (российский аналог – «Своя игра»). Это, конечно, впечатляет, однако по сути речь шла всего лишь о системах, которые могут очень быстро просматривать большие базы данных. Но то, что делает система AlphaGo – обыгрывает игрока номер один в мире в китайской игре го, – это и в самом деле поразительно, ведь предварительно электронный игрок наблюдал за партиями, а затем миллионы раз играл в го против самого себя. Сложность и количество данных, которые он смог проанализировать, феноменальны, и я уверен, что будущее искусственного интеллекта связано именно с такими мощными системами.
Интересно сравнить сложность данных со сложностью задач для процессов, которые выполняют современные компьютеры: теперь мы можем справляться со сложностями в обоих аспектах. Например, управление лифтами является сложной задачей, но используемые при этом данные довольно просты. Беспилотные автомобили не занимаются сложными операциями (просто ездят, поворачивают и останавливаются), но для этих процедур необходимы огромные по объему данные. Но теперь мы можем управлять сложными ситуациями как с точки зрения данных, так и с точки зрения задач. У нас появились для этого механизмы, и притом довольно неожиданно.
ЭБ: Вы также упомянули в качестве ключевого фактора вычислительную мощность?
УВ: Да, графические процессоры [видеокарты] внесли в это значительный вклад. Но и широкое использование облачных вычислений позволяет предприятиям управлять большими массивами данных без дополнительных рисков и инвестиций в инфраструктуру. Многие компании сейчас делают ставку на управление массовыми данными, которое они осуществляют и своими силами, и через облако. Искусственный интеллект позволяет им оперировать данными максимально эффективно.
ЭБ: Как вы считаете, ажиотаж помогает или мешает развитию искусственного интеллекта?
УВ: Искусственный интеллект, конечно, «раскручен» сверх всякой меры, но определенная польза здесь тоже есть. Это стимулирует дальнейшие исследования и инновации и заставляет бизнес обсуждать чрезвычайно масштабные вопросы. Не стоит видеть в рекламной шумихе лишь отрицательные стороны.
ЭБ: Какую область вы считаете самой важной для использования искусственного интеллекта?
УВ: Искусственный интеллект умеет эффективно работать с «грязными» данными, или, так сказать, размытыми данными, такими как фотографии, речь на естественном языке и неструктурированные документы. Массовый сбор данных обещает человечеству горы информации, но работа с ними требует целой армии статистиков. Роботизированная автоматизация обработки данных отлично подходит для профессионалов в области анализа: она создает структурированную и «очищенную от примесей» информацию. Если же в нее проникает беспорядок, искусственный интеллект готов вмешаться и рассортировать все заново.
ЭБ: Что, по вашему, нужно делать предпринимателям, если они хотят использовать искусственный интеллект в полной мере?
УВ: Они должны сосредоточить внимание не на самой технологии, а на ее экономическом обосновании. А еще они должны понимать, как они собираются управлять ИИ и рисками, связанными с любыми новыми технологиями. К тому же у людей есть «этический компас», которого, конечно, нет у искусственного интеллекта. Это потребует дополнительного контроля за работой моделей искусственного интеллекта, поскольку в них отсутствует должная прозрачность. Нужно следить и за тем, чтобы система принятия решений не сделалась предвзятой: очень легко внести элемент предубежденности в любую сферу коммерческой деятельности. Риски, связанные с необъективностью, очень быстро приобретают большие масштабы, потому что используются глобальные массовые данные и механизмы влияния на их источники.
ЭБ: Каким вы видите будущее искусственного интеллекта?
УВ: Я думаю, что мы увидим появление еще более совершенных алгоритмов для обработки больших объемов данных. С другой стороны, искусственный интеллект – жертва своего собственного успеха: каждый шаг вперед вместо захватывающего приключения становится рутинным делом, и это вызывает внутреннее разочарование. Посмотрите хотя бы на нынешние достижения – Siri и Alexa. Да и сам термин «искусственный интеллект» со временем станет излишним, так как люди привыкнут к этой технологии и не будут смотреть на нее как на аналог собственного интеллекта.
Но пока что компании будут вкладывать средства в искусственный интеллект как разумным, так и неразумным образом. Ставки с каждым годом все выше, и руководителям следует внимательно анализировать свои подходы, пользоваться консультациями экспертов и добиться того, чтобы постоянно быть на пике технологий, а не плестись в хвосте.