Kitabı oku: «Просчитать будущее. Кто кликнет, купит, соврёт или умрёт», sayfa 6
Прогнозирование для внутренних нужд
Чем больше становится известно историй, подобных истории Джона, тем больше организаций присоединяются к победному маршу прогнозной аналитики. Так, одна крупнейшая международная компания сосредотачивает всю силу прогнозирования на самой себе, окидывая зорким взглядом ПА собственных сотрудников. Читайте дальше, чтобы узнать о том, какие могут возникать положительные и отрицательные последствия, когда ученые осмеливаются обратить свой взор на людей. Нравится ли людям, когда их поведение прогнозируют?
Глава 2
С властью приходит ответственность
Hewlett-Packard, Target и полиция выведывают ваши секреты
Как можно безопасно использовать прогнозную машину, способную предвидеть увольнения, беременность и преступления? Не ущемляет ли это наши гражданские свободы? Насколько это в порядке вещей, что одна ведущая компания медицинского страхования прогнозирует смерть своих страхователей? Отдельно рассматривается вопрос, посвященный выявлению мошенничества: как может искусственный интеллект перевернуть суть мошенничества с ног на голову?
Что будет, если вашего босса уведомят, что вы собираетесь уволиться – даже если вы никому об этом не говорили? Если вы являетесь одним из более чем 330 000 сотрудников компании Hewlett-Packard, то знайте, что ваш работодатель на регулярной основе оценивает вас и всех ваших коллег по шкале «риск ухода». Эта оценка показывает, какова вероятность того, что вы можете покинуть компанию. Если вы работаете в HP и не знали об этой практике, повремените выходить из себя от гнева, пока не прочитаете в этой главе объяснение такому поведению вашего работодателя.
Эта история с HP всплыла на волне шумихи, поднятой в средствах массовой информации вокруг компании Target в связи с вскрывшимся фактом, что этот крупнейший оператор гипермаркетов занимается прогнозированием беременности своих покупателей. В этом торнадо смешалось все – вводящие в заблуждение обвинения, страх перед могуществом корпораций, громкие заявления известных личностей и, конечно же, прогнозная аналитика (ПА). К моему удивлению, я оказался в самой гуще событий.
Несмотря на то, что средства массовой информации любят огульную пальбу, они часто выбирают для атаки в целом правильное направление. Нападки СМИ были реакционным и дезинформирующими, но для всех было очевидно, что они не лишены законных оснований. Связанная с прогнозированием деятельность HP и Target поднимала чрезвычайно сложный и актуальный этический вопрос. А в контексте неприкосновенности частной жизни ставки повышались еще больше.
Почему? Потому что прогнозирование сует нос в ваше частное будущее. В обоих вышеописанных случаях компании узнавали ранее неизвестные чувствительные факты: вы собираетесь уволиться? Вы беременны? И дело даже не в возможности злоупотребления этими данными, их утечки или кражи. Дело в том, что таким образом помимо воли человека происходит косвенное раскрытие фактов, касающихся его частной жизни. Организации генерируют эти важные новые сведения из существующих безобидных данных, буквально создают их из воздуха. Но умеют ли они правильно управлять этой своей способностью?
Хотя мы уже признали всю силу прогнозирования и поставили его себе на службу, мы только сейчас начинаем осознавать риски, которые это влечет с точки зрения неприкосновенности частной жизни. Однако цепная реакция запущена и удивляет даже экспертов: организации вовсю используют новые возможности, потребители протестуют, СМИ подливают масло в огонь, ученые уворачиваются от нападок и подвергают пересмотру этические принципы.
Будем честны: в конце концов, прогнозная аналитика используется не только для того, чтобы выявлять будущих мам и нелояльных сотрудников. Она может применяться и в куда более неоднозначных целях. ПА помогает выявлять потенциальных преступников и активно используется правоохранительными органами для принятия решений о том, кто должен сидеть в тюрьме, а кого можно отпустить на свободу.
Далее я расскажу вам о том, как однажды невольно превратился из беззаботного аналитика в телезвезду и как организации были вынуждены сменить высокомерие на смирение. Затронем мы и тему использования прогнозной аналитики в сфере асоциальной деятельности.
Что прогнозирует Target и зачем
В 2010 году я пригласил эксперта из Target Эндрю Поула выступить с докладом на конференции Predictive Analytics World, где я был председателем программного комитета. Поул руководит целой армией профессиональных аналитиков, управляющих различными ПА-проектами для Target. В октябре того же года он сделал великолепный доклад, осветив в нем широкий спектр областей применения ПА в Target. Поул вышел на сцену и сразу же захватил внимание аудитории своей динамичной речью, в которой были и детальные примеры, и увлекательные истории, и демонстрация впечатляющих результатов в бизнесе. Аудитория была в восторге. Его выступление можно посмотреть на сайте www.pawcon.com/Target.
Ближе к концу выступления Поул рассказал о проекте по прогнозированию беременности среди покупателей. Маркетинговый потенциал таких прогнозов очевиден, принимая во внимание потребности семьи, ожидающей рождение ребенка.
Но это было чем-то принципиально новым, и я повернул голову, чтобы посмотреть на реакцию аудитории. Ничего. Абсолютно ничего. Как правило, в маркетинговых проектах ПА используется для прогнозирования покупательского поведения. Но в данном случае предмет прогнозирования не относился к вещам, непосредственно интересующим маркетологов, а сам был значимым предиктором широкого спектра покупательских потребностей. В конце концов, задача маркетолога состоит в выявлении спроса и использовании открывающихся возможностей. И эту цель прогнозирования можно считать «суррогатной матерью» (извините за сравнение) для соответствующих покупательских потребностей, за выявление которых розничный торговец и платит своим маркетологам.
Применение ПА: прогнозирование беременности
1. Предмет прогнозирования: кто из покупательниц в ближайшие месяцы ожидает рождения ребенка.
2. Цель прогнозирования: делать соответствующие маркетинговые предложения для будущих родителей.
На основе каких данных Target научилась прогнозировать беременность, учитывая, что прогнозное моделирование требует некоторого количества прецедентов, из которых оно могло бы получить данные для анализа? Как вы помните, прогнозное моделирование – это одна из форм автоматизированной обработки данных, сопровождающейся обучающими примерами, которые должны включать как положительные, так и отрицательные варианты. Другими словами, необходимо, чтобы в прошлом компания выявила ряд положительных примеров того, что она хочет спрогнозировать в будущем. Понятно, что для составления прогнозов наподобие «может купить стереосистему» у розничного продавца есть масса положительных примеров. Но как научиться определять, какие из покупательниц Target могут быть беременны?
Вас может удивить, насколько прост ответ на этот вопрос. Попробуете догадаться сами? Для этого проекта не используется никакой медицинской или фармацевтической информации. Каким же образом покупательницы информируют Target о том, что они беременны? Через сервис Baby Registry на сайте Target. (Baby Registry – это список вещей, которые потребуются при рождении ребенка.) Заполняющие список посетительницы сайта не только раскрывают факт своей беременности, но и указывают сроки. По словам Target, есть и другие маркетинговые программы, через которые будущие мамы дают о себе знать, таким образом выступая в качестве положительных примеров для обучения.
Используя сервис Baby Registry и другие источники данных о покупателях, Target сформировала массив данных и создала «довольно точную» прогнозную модель. Теперь компания может применять эту модель и к тем покупательницам, которые не сообщают о своей беременности. Это позволяет выявлять гораздо больше беременных покупательниц, поскольку очевидно, что большинство из них не регистрируется на вышеуказанном сервисе.
Модель составляет прогноз в отношении конкретной покупательницы на основании приобретаемых ею товаров, которые могут включать товары для новорожденных или же некую комбинацию других товаров, не обязательно напрямую связанных с рождением ребенка. Работа модели построена на автоматическом выявлении тенденций через исследование широкого разнообразия факторов. Не думаю, что модель Target подтвердила, что покупка мороженого и соленых огурцов является надежным индикатором беременности, но были проанализированы и учтены все до единой категории товаров. В результате модель выявляет на 30 % больше покупательниц, которым Target может предложить ориентированные на беременных рекламные материалы, – значительный успех с точки зрения маркетинга.
Многозначительная пауза
Гордо расхаживая по сцене, Поул расхваливал этот неортодоксальный маркетинговый подход, применяемый Target. Его ценность для бизнеса была очевидна, и к тому же Поул был харизматичным оратором. Скорее всего, он уже выступал с этой речью на внутренних презентациях в Target, где та была хорошо принята, и вот теперь произносил ее на открытой конференции. В любом случае материал был превосходным, и аудитория слушала его очень внимательно.
На мгновение у меня возникли некоторые сомнения, но, увлеченный самой технологией, я решил, что этот проект, как и полагается, был подвергнут тщательной проверке в самой Target и все поводы для опасений были устранены. Когда прогнозный аналитик выбирается из темной пещеры данных на свет божий, ему зачастую бывает трудно представить, как отреагируют на его очередной проект обычные люди, которые, ни о чем не подозревая, ходят по улице. Поул заверил аудиторию, что Target строго соблюдает все законы, регулирующие неприкосновенность частной жизни и использование данных: «Target хочет быть уверена, что не попадет под обстрел средств массовой информации из-за того, что использует то, чего не должна использовать». На тот момент никто из присутствующих на конференции даже представить себе не мог, во что выльется этот доклад.
Мои 15 минут славы
Поскольку как эксперт в области ПА я оказался в центре разразившегося в СМИ скандала вокруг прогнозирования беременности, которым занималась Target, я из первого ряда мог наблюдать за тем, как один журналист бросает провоцирующую искру, комментаторы и эксперты разжигают из нее костер, а новостные выпуски раздувают пламя.
Кто же первым разболтал эту тайну? Несколько месяцев спустя после презентации Поула я дал интервью журналисту New York Times Чарльзу Дахиггу. Он спросил меня о том, какие интересные открытия были сделаны благодаря ПА. Я перечислил несколько из них и упомянул о прогнозировании беременности, дав ему ссылку на видеозапись выступления Поула, которое до тех пор привлекало к себе мало внимания, а также познакомил его с Поулом. Надо признать, что к тому времени я уже практически забыл, что эта тема может быть связана с вопросом о неприкосновенности частной жизни.
Через год, в феврале 2012 года, в New York Times Magazine вышла статья Дахигга «Как компании узнают ваши секреты», которая и послужила той искрой, из которой разгорелось пламя скандала вокруг истории с прогнозирование беременности. В написанной разоблачительным тоном статье противоправный характер действий Target представлялся как доказанный факт. Чтобы усилить воздействие, в статье приводилась анонимная история о том, как один отец узнал о беременности своей дочери-подростка, увидев рекламу товаров для беременных, присланную ей Target. При этом подспудно подразумевалось, что это было результатом проекта по прогнозированию беременности. New York Times Magazine даже подготовил в дополнение к статье короткое видео, в котором демонстрировались драматически замедленные кадры стоящих у кассы покупателей Target, в то время как на фоне тревожной музыки Дахигг вещал устрашающим голосом: «Они могут узнать о любых переменах в вашей жизни… они могут манипулировать вами… чтобы вы отдавали им еще больше долларов». Дахигг называет опирающийся на данные маркетинг «шпионажем» за клиентами.
Эта хорошо продуманная сенсация вызвала широкий резонанс в прессе, на радио и телевидении; многочисленные журналисты и комментаторы слепо принимали на веру то, что было всего лишь бездоказательными утверждениями, механически повторяя их и нагружая эмоциями. Случайно или нет, но именно в это время вышла книга Дахигга «Сила привычки: Почему мы живем и работаем именно так, а не иначе» (Random House, 2012 год)8, которая немедленно оказалась в списке бестселлеров New York Times.
Поскольку в той пресловутой статье цитировались мои слова, я тоже оказался в эпицентре торнадо. Поул и Target молчали, словно набрали в рот воды. Я же, будучи независимым консультантом, наслаждался неограниченной свободой публичных выступлений. У меня не было мудрого работодателя, чтобы удержать меня от этого.
В свете софитов
Я не могу смотреть в лицо фактам.
Я напряжен, я нервничаю
И не могу расслабиться.
Из песни группы Talking Heads
Буквально за одну ночь я превратился из технаря в телезвезду, когда ночным рейсом рванул в Нью-Йорк, чтобы предстать в новостной программе на телеканале Fox News перед миллионами телезрителей. Честно говоря, морально я не был готов к этой роли. Плавая в абстрактном океане данных, профессиональные аналитики редко появляются на поверхности, да и то, как правило, по чистой случайности. Их работа большей частью состоит в бесконечных упражнениях в математике и алгоритмике с целью выявления закономерностей, обещающих быть верными в будущем, – странная, магическая игра, бросающая вызов законами физики, которые запрещают путешествия во времени. В своих лабораториях мы изолированы от внешнего мира, ничего не знаем ни о тоске разбитых сердец, ни о нарушенных личных тайнах. Попросив меня сменить лабораторный халат на костюм и галстук, сильные мира сего тем самым признавали, что наша малопонятная эзотерическая деятельность, ранее считавшаяся уделом лишь посвященных, на самом деле по-настоящему важна.
Организаторы утренней новостной программы Fox & Friends усадили меня за стол, и я изо всех сил старался придать себе невозмутимый вид, восседая на этом, совершенно очевидно, «горячем» месте. Перед началом передачи ведущая, знаменитая Гретчен Карлсон, остановила на мне взгляд и громко поприветствовала через всю студию: «Привет, Эрик!» Я тоже поздоровался с ней так, будто каждый день видел ее в этой студии: «Привет, Гретчен!»
Затем мы вышли в прямой эфир, который смотрели около двух миллионов телезрителей. Полностью соглашаясь с позицией Times, Карлсон устроила Target разнос за раскрытие факта беременности молодой девушки. Из ее слов можно было сделать вывод, что такой побочный ущерб присущ любому прикладному применению ПА. Второй приглашенный, профессор медицинской этики, полностью поддержал Карлсон и высказал мнение, что любое применение ПА должно быть запрещено, по крайней мере до тех пор, пока не будет проведено тщательное расследование. Далее миллионам телезрителей канала Fox были показаны кадры с магазинами Target, поверх которых большими буквами был напечатан вопрос «Магазины шпионят за вами?», затем сменившийся надписью «Target держит вас на прицеле».
Очень быстро стало ясно, что я был приглашен в качестве антигероя, поскольку шоу было призвано выставить мою профессию в дьявольском обличье. На данный момент я был лицом ПА, и мне нужно было дать отпор. Если организации подчас небрежно обращаются с той властью над людьми, которой наделяет их прогнозная аналитика, то СМИ не менее небрежно обращаются со своей властью над умами телезрителей, не стесняясь обрушивать на них голословные заявления и ложную информацию. Я сделал глубокий вдох и сказал, что статья в New York Times Magazine вводит в заблуждение, поскольку намекает, что Target обладает «сверхъестественной» способностью со 100 %-ной точностью предсказывать беременность покупательниц, и устанавливает недоказанную взаимосвязь между ПА-проектом и сомнительной историей с беременной девочкой-подростком. Прогнозы Target не являются медицинским диагнозом и не основаны на медицинской информации. Мне удалось втиснуть в отведенные мне пару минут выступления ключевую мысль: нельзя огульно клеймить позором всю прогнозную аналитику. Мое выступление можно посмотреть на сайте www.pawcon.com/Target-on-fox.
В другом интервью меня попросили прокомментировать высказывание Кэтрин Альбрехт, ярой защитницы неприкосновенности частной жизни, которая заявила: «Цель розничных продавцов состоит в том, чтобы узнать о своих покупателях все, что только можно. Магазины превратились в этакие зоопарки, где в роли зверей выступают покупатели». Что я ответил? В отличие от социальных наук, задача ПА – повышение операционной эффективности организаций; ее не интересуют люди как таковые. И, в конце концов, если вы наблюдаете за человеком, это не означает, что вы обращаетесь с ним как с подопытным кроликом.
СМИ активно освещали эту тему, и через несколько недель казалось, что не осталось ни одного человека ни в моем профессиональном кругу, ни за его пределами, который не был бы в курсе этой истории с прогнозированием беременности. Даже комик Стивен Кольбер не смог пройти мимо, заявив, что Target вскоре научится на основе покупательских привычек вашего супруга или супруги прогнозировать, есть ли у них связь на стороне, и будет предлагать вам купон на электроплитку, которая потребуется вам в вашей новой холостяцкой квартире (шутки шутками, но прогнозирование разводов включено в таблицу 1 в приложении D, а также упоминается в примечаниях к этой книге).
Когда пыль уляжется, нам предстоит серьезная задача – разобраться в созданной СМИ мешанине раздутых страхов и обвинений и четко сформулировать реальные риски, которые влечет за собой ПА с точки зрения неприкосновенности частной жизни.
Невозможно посадить под замок того, кто умеет телепортироваться
Наступит время, когда информация о транзакциях станет более важной, чем сами транзакции.
Уолтер Ристон, бывший генеральный директор и председатель совета директоров Citicorp
Данные важны. И в этом причина наших тревог и волнений.
Персональные данные не равноценны реальному человеку – они гораздо лучше. Они не занимают места, их обслуживание почти ничего не стоит, они могут существовать вечно, и их гораздо проще воспроизводить и перемещать. Данные ценятся дороже, чем на вес золота, – и это действительно так, ведь данные ничего не весят, у них нет массы.
Разумеется, данные о человеке не могут сравниться по ценности с самим человеком, но из-за их дешевизны они являются выгодной инвестицией. Как замечает Алексис Мадригал, главный редактор журнала The Atlantic, данные о пользователе можно купить примерно за полцента, тогда как стоимость среднего пользователя для экосистемы интернет-рекламы оценивается в $1200 в год.
Ценность данных – содержащаяся в них информация, возможности их использования – и есть то, что делает их «чувствительными», т. е. требующими особого обращения. Чем ценнее данные, тем более они чувствительны. Поэтому напряженность, которую мы чувствуем, неизбежна. Если какие-то данные никого не интересуют, никто не будет их защищать, никто не будет пытаться получить к ним доступ – да и начать с того, что никто не будет стараться их сохранить. Как выразился Джон Элдер: «Когда что-то воспринимается как опасное, это свидетельствует о его силе. В слабом не видят угрозы».
Проблема защиты данных существует с момента изобретения письменности. Кто-то нацарапал что-то на клочке папируса, и с тех пор начался нескончаемый бой за введение и соблюдение правил доступа к данным.
Но сегодня ситуация кардинально изменилась: цифровые данные способны с мгновенной скоростью перемещаться на любые расстояния между людьми, организациями и странами. И делать это почти бесплатно. Сложите вместе все эти факторы, и вы получите чрезвычайно коварное и проворное существо, рой мух, который невероятно трудно контролировать. Это все равно что пытаться посадить в тюрьму Ночного Змея – персонажа фильма «Люди Икс», мутанта, обладающего способностью телепортации. Его перемещения не ограничены привычными нам тремя измерениями, поэтому его невозможно посадить под замок.
Из-за этой уникальной способности данных к телепортации мы придумали специальное слово для обозначения способа их транспортировки. Мы называем это телекоммуникацией.
Данные склонны распространяться как лесной пожар. Как сказал адвокат Дэвид Собел, специализирующийся на защите неприкосновенности частной жизни: «Когда информация существует, практически невозможно ограничить ее использование. Когда вокруг вас находятся все эти легкодоступные горы данных, рано или поздно кто-нибудь обязательно задаст вопрос: “Что еще можно с ними сделать?”»
Обращение этой новой, ценной валюты трудно контролировать. Чтобы провернуть сомнительную операцию с данными о потребителях, достаточно нажать одну кнопку – никакой физической транспортировки, никаких реальных товаров, никаких материальных улик.
Ücretsiz ön izlemeyi tamamladınız.