Как Google стремится доминировать в искусственном интеллекте

Поисковый гигант делает свой ИИ открытым источником, поэтому любой человек может им пользоваться. В ноябре 2007 года Google выпустила Android – открытую операционную систему для телефонов. Тем самым компания заложила основу для своего доминирования на рынке мобильной связи. Восемь лет спустя Android имеет 80-процентную долю рынка. И сейчас Google использует тот же трюк – на этот раз с искусственным интеллектом.

Сегодня Google анонсирует Tensor Flow – одну из самых мощных платформ для машинного обучения. Она предоставляет открытый доступ любому компьютеру и интернет-соединению. Более 50 продуктов Google приняли Tensor Flow, чтобы использовать глубокое обучение (машинное обучение с использованием глубоких нейронных сетей) в качестве инструмента для совершенствования своей основной поисковой системы.

Что такое Tensor Flow и искусственный интеллект Android?

Tensor Flow – это библиотека файлов. Она дает возможность исследователям и компьютерным ученым создавать системы, которые разбивают данные (фотографии или записи голоса), и позволяют компьютеру принимать будущие решения на основании полученной информации. Это основа машинного обучения: компьютеры осмысливают данные, а затем используют их для принятия решений. Если говорить в общем, то машинное обучение является попыткой сделать компьютеры умнее. Это более широкая и неопределенная область искусственного интеллекта. Tensor Flow – необычайно сложный комплекс точности и скорости в классификации, обработке и выводе данных. Платформа однозначно должна быть помещена в сферу инструментов искусственного интеллекта. Вот подробные детали: система Tensor Flow использует графики потоков данных. Здесь данные с несколькими измерениями (значениями) передаются от одного математического вычисления к другому. Эти сложные биты данных называются тензорами. Математические биты – узлами, а способ изменения данных с узла на узел указывает общие системные отношения в данных. Эти тензоры протекают через график узлов, и именно отсюда происходит название Tensor Flow.

 

Открытый доступ Tensor Flow позволяет исследователям и даже аспирантам работать с профессионально построенным программным обеспечением. Но реальный эффект – это возможность предоставлять данные по всем направлениям для каждого исследования компании машинного обучения. Теперь самые разные организации (от небольших стартапов до огромных компаний) наравне с Google могут взять систему Tensor Flow, адаптировать ее к своим потребностям и использовать, чтобы конкурировать даже непосредственно с самой Google. Более того, релиз данного продукта делает крупнейшей в мире интернет-компании авторитет в области искусственного интеллекта.

Профессор компьютерных наук Стэнфорда Кристофер Мэннинг получил Tensor Flow чуть больше трех месяцев назад, и его ученики имели возможность поработать с системой. Спустя всего несколько недель использования платформы, Мэннинг решил, что он собирается реализовать ее в своей учебной программе. Помимо Android, он также сравнивает платформу с Gmail – вездесущим почтовым сервисом Google. Конкуренты есть, но Gmail чище и имеет больше смысла в приложениях.

«Дело не в том, что до этого не было доступных библиотек высокого уровня для глубокого обучения», – говорит Мэннинг. «Но в целом другие системы – это элементарные вещи, созданные тремя учеными и аспирантами».

Данная система – это не что иное, как следствие работы в полную силу разработчиков, трудящихся в инфраструктуре машинного обучения Google. Мэннинг говорит, что, хотя Tensor Flow является огромным подарком для общества (способного сократить время, затрачиваемое на оптимизацию нейронных сетей в 100 раз), они могут косвенно извлечь выгоду из своих общедоступных инструментов.

«Очень мало компаний пыталось нанять большое количество талантливых людей в области искусственного интеллекта – говорит Мэннинг, – Google не благотворительность. Я уверен: им также пришло в голову, что нужно предоставить это нам. Так у нас в университетах появится много докторов наук, которым уже полюбились инструменты глубокого обучения Google, и этот курс с удовольствием будут преподавать студентам».

Джефф Дин, один из лучших инженеров Google, а также один из двух авторов Tensor Flow (другой – Раят Монга), осторожно оценивает принятие платформы в обществе. Он говорит, что, хотя это то, что Google нашел очень полезным в своей работе, настоящее испытание заключается в том, найдет ли общество его нужным. Необходимо быстрее предоставить пользователям не только идею инструмента, но и его фактическую реализацию. «В основном мы надеемся ускорить исследования и внедрение машинного обучения», – говорит Дин.

Система Tensor Flow представляет собой довольно полный пакет для отдельного исследователя. Это автономная библиотека, связанная с инструментами и лицензией Apache 2.0, поэтому ее можно использовать в коммерческих настройках. Платформа может быть скомпилирована на настольных компьютерах или ноутбуках, а также развернута на мобильных устройствах (Android сначала, а затем iOS). В системе также есть учебники и документация о том, как вносить изменения и играть, пользуясь данной платформой.

 

Мэннинг предполагает, что способность запускать глубокие алгоритмы обучения на мобильных устройствах будет важным фактором, который отделяет Tensor Flow от других систем с открытым исходным кодом.
Для тех, кто хочет использовать систему как есть, Google предоставляет версию, которую исследователи могут начать использовать прямо сейчас (как готовые двоичные файлы). Для разработчиков программного обеспечения существует также интерфейс прикладного программирования (API) для обучения и контроля их моделей Tensor Flow. И это не подделка – это точная система, используемая в приложении Google, и более 50 других продуктов.

В Лаборатории искусственного интеллекта Google

Google открывает платформу миру. Это дает нам возможность увидеть, как компания разрабатывает системы машинного обучения. Последние три года Google работал над созданием огромной платформы для искусственного интеллекта, и теперь выпускает систему в свет. Хотя, Google предпочитает, чтобы вы назвали интеллект машинным. Они считают, что словосочетание «искусственный интеллект» несет слишком много коннотаций. В основном компания пытается создать подлинный разум, но только для машин.

Вот модель, которая использовалась в Google в течение многих лет: любой инженер, который хочет играть с искусственной нейронной сетью, может разблокировать систему и возиться с ней. Это открытая структура, которая позволяет 100 командам внутри компании создавать мощные методы машинного обучения.

«Машинное обучение – это ключевой, преобразующий способ, с помощью которого мы переосмысливаем то, как мы все делаем», – сказал генеральный директор Google Сундар Пичай.

«Мы с первых дней применяем его во всех наших продуктах, будь то поиск, реклама, You Tube или игра».

Трудно выложить конкретную диаграмму исследований интеллектуальных машин в Google, потому что она постоянно меняется. Вице-президент Google по проектированию Джон Джаннандреа назвал это «встроенной моделью». «Я встретил его у одного из многих современников в штаб-квартире Google в солнечном Маунтин-Вью, штат Калифорния, осенью 2015 года. Публика меня не знала. Когда инженер подошел ко мне, заметив, что у меня нет значка сотрудника, он спросил, кто я. В ответ я сказал, что писатель. Но ситуация не сгладилась. Google гордится тем, что делает свои исследования открытыми для публики, но работа в лабораториях скрыта от посторонних глаз. Для меня встроенная модель Google означала большую прогулку. Googleplex содержит 3,5 миллиона квадратных футов офисных площадей на территории около семи акров земли. Сотрудники Google катаются на велосипедах между зданиями, которые окружены ухоженными парками. Здесь гуглеры сидят с ноутбуками, несомненно, борются со сложными головоломками в области компьютерных наук или играют в Minecraft во время обеденного перерыва. Различные команды работают в разных зданиях. Внутри большая часть того, что я видел, выглядит как обычное офисное здание».

 

 

В организационном плане существует множество исследователей, которые всегда работают над общими проблемами машинного интеллекта. Эта работа связана с основными продуктами Google, такими как приложение «Фотографии», «Голосовой поиск» и «Поиск». Есть несколько проектов, которые начинаются именно с того, что Google хочет улучшить.

Например, Джаннандреа предлагает заняться почерком. «Мы, как компания, хотим понять, как люди напишут слово. Так что в это мы будем инвестировать, даже если у нас еще нет такого продукта», – говорит он. Но поскольку Google настолько обширен в своих предложениях, обычно есть инструмент, который может использовать каждый элемент исследования. (Почерк попал в Google Keep, программное обеспечение для заметок). Чтобы помочь в реализации использования этого инструмента, исследователь присоединяется к группе, разрабатывающей продукты. Здесь специалисты создают конкретные приложения, которые все мы используем, например, приложение «Фотографии» или «Переводчик Google». В общих исследованиях команды разделены по интересующей их области.

Есть команда, ориентированная на обучение компьютеров видеть; команда, работающая над пониманием языка; команда, ищущая лучшего распознавания голоса, и так далее.

В Google трудятся более 1000 ученых, работающих на этих машинных интеллектуальных приложениях, постоянно вращающихся между прикладными и теоретическими исследованиями. Некоторые из этих специалистов работают над более простыми проблемами, которые не считаются искусственным интеллектом в строгом смысле этого слова, но являются статистическими методами прогнозирования. По словам представителя Google Джейсона Фрейденфельдса, новая материнская компания Google, Alphabet, не оказывает большого влияния на то, как продолжится изучение машинного интеллекта Google. В то время как исследовательская группа останется в Google Proper, не будет никаких препятствий для работы с Life Sciences или Google в приложениях для машинного обучения.

Голос будущего

Восходящей звездой в каталоге инструментов Google является голосовой поиск. Вероятно, вы столкнулись с этим, даже если не знали точно, что это было – маленький значок микрофона на главной панели поиска Google. При его нажатии, компьютер предлагает вам произнести вслух ваш поисковой запрос, а не вводить буквенные сочетания. Тот же самый маленький микрофон появляется в приложении поиска Google для iPhone и Android, и его можно найти в самой панели поиска Android на многих смартфонах.

 

Несмотря на то, что поиски Google Voice по-прежнему воспринимаются как соперник Сири, сервис Google Voice фактически стал вторичным шлюзом для обширной базы знаний Google. К восторгу команды при распознавании языков он, наконец, становится все более популярным.

В то время как Google не оглашает процент голосовых запросов по отношению к тексту, он говорит о такой статистике: мобильный поиск в настоящее время более популярен, чем c персональных компьютеров. В прошлом году мобильный голосовой поиск удвоился: около 50% американских пользователей телефона и планшета просто знают, что могут задавать вопросы Google, а треть из них действительно это делает. Помимо нескольких сот итераций алгоритма в год, «Поиск» работал почти одинаково в течение многих лет. Но заставить людей достаточно уверенно говорить со своими устройствами, было непросто. Старший исследователь Френсис Бьюфейс трудится над разработкой механизма распознавания голоса и говорит, что повышенная популярность связана с тем, что теперь функция лучше работает.

«Когда мы внедрили опцию распознавания речи, пользователи не были полностью уверены в ней. Они пользовались ею неохотно, да и сама технология была не так хороша, как сейчас», – говорит Бьюфайз.

«Сегодня люди могут, сидя в своем комфортном офисе, посылать компьютеру любые голосовые запросы или команды».

Бьюфайз быстро говорит с французским акцентом и владеет тремя языками. Помимо этого, она свободно говорит о нейронном сетевом строении. Специалист возглавлял команду Speech. Эта группа ученых не использует систему со старым механизмом для распознавания звуков. Ее заменили новой, более совершенной системой, которая использует новый бренд повторяющихся нейронных сетей.

Чтобы машина понимала речь, ей нужно сначала узнать, как звучат слова и фразы. Здесь имеется в виду аудиофайлы и подобные им документы. Эти файлы обрабатываются алгоритмом, который создает огромный график. Его звуки соотносятся со звуками, словами и фразами, понятными нам. Когда аудиоклип представляется компьютеру, машина анализирует клип, нажимая аудиосигнал через график, и пытается найти путь, который лучше всего объясняет звук. На этом пути машина проходит последовательность звуков и слов, соединяя их в конечном итоге в предложение. Но все это зависит от тех исходных аудиофайлов, которые называются данными обучения. Эти данные обучения фактически сделаны из миллионов реальных голосовых запросов пользователей Google.

Всякий раз, когда вы задаете машине голосовой поиск, звук загружается на серверы Google. Этот голосовой файл можно интегрировать в банк клипов, применяемых для обучения машины. Но прежде чем он будет использован, данные пройдут через несколько шагов. Сначала (и, самое главное, для вас) он очистит всю вашу информацию, а именно: отметки времени, данные о местоположении, ваш профиль пользователя и т. п. Затем необработанный сигнал передается человеческому транскриптору, потому что алгоритм нуждается в надежном тексте для связи с клипом. Каждому клипу необходимы эти метаданные, а «плохой» клип – это просто тот, который неправильно транскрибируется. Есть даже случаи, когда исследователи добавляют искусственный шум, чтобы машина умела различать слова в любых ситуациях.

Бьюфайз подчеркивает, что эта программа является согласием на обработку персональных данных. Это важно, учитывая соображения конфиденциальности, поскольку Google продолжает собирать больше информации о мире и о нашей жизни. Но если вы не хотите, чтобы Google использовал ваш голос, то можете просто удалить свои поисковые запросы после факта.

Такие технические приемы сделали голосовой поиск более эффективным. По словам Google, два года назад показатель ошибок составлял 25%. Это означает, что один из каждых четырех запросов был неправильным. Теперь число погрешностей сократилось до 8%.

Компьютерное зрение

Проект AutoML от Google, предназначенный для создания ИИ, ныне разработал систему компьютерного зрения. Она во многом превосходит любую современную модель. Благодаря этой системе можно усовершенствовать функцию «зрения» автономных транспортных средств и роботов ИИ следующих поколений. Весной этого года компьютерные ученые из Google Brain объявили о создании Auto ML. Это искусственный интеллект, который способен сгенерировать собственный ИИ, превосходящий человеческий разум. Специалисты Google автоматизировали разработку моделей машинного обучения с использованием подхода, который называется «подкрепление». Auto ML функционирует как нейронная сеть контроллера, которая разрабатывает дочернюю сеть ИИ для определенной задачи. Для данного ИИ, которому ученые дали название NASNet, задача заключалась в том, чтобы распознать объекты (людей, автомобилей, светофоров, сумок, рюкзаков и т. д.) на видео в режиме реального времени. AutoML оценил производительность NASNet и применил эту информацию для усовершенствования своего дочернего ИИ, повторяя этот процесс тысячи раз. При тестированиях системы на основании классификации изображений ImageNet и наборов данных обнаружения объектов COCO, NASNet оказалась лучше всех других систем компьютерного видения. По словам ученых, NASNet на 82,7 % точнее дает прогноз изображения в наборе проверки Image Net. Это на 1,2% лучше, чем в прежних результатах, а система на 4% эффективнее, с 43,1% средней точностью. Помимо этого, менее требовательная к вычислительной мощности версия NASNet вышла вперед лучших моделей системы аналогичного размера для мобильных платформ на 3,1%.

 

Все это означает, что AutoML может открыть область машинного обучения и искусственного интеллекта для новичков. Касательно NASNet, то точные и эффективные алгоритмы компьютерного зрения будут пользоваться высокой популярностью благодаря количеству потенциальных приложений. Он может быть использован для создания сложных роботов, действующих на искусственном интеллекте, или для того, чтобы помочь людям с ослабленным зрением вернуться в полноценной жизни. Также алгоритмы могут помочь дизайнерам улучшить технологии самостоятельного вождения транспортного средства. Чем быстрее автономный автомобиль сможет распознавать объекты на своем пути, тем быстрее он сможет реагировать на них. Таким образом безопасность автономных транспортных средств станет выше.

Умный почтовый ящик

Недавно Google объявила, что начинает использовать компьютерное обучение, используя вашу электронную почту (если вы пользуетесь приложением «Входящие», которое отделено от Gmail). Кстати, по словам Алекса Гэйли, директора по продуктам Gmail, приложение работает на платформе Tensor Flow.

«Мы увидели некоторые возможности нейронных сетей, которые разработала наша исследовательская группа. Теперь машина может не только понять набранное письмо, но и сама организовать его написание», – говорит Гэйли.

Эта функция называется «Умный Ответ». Одна повторяющаяся нейронная сеть считывает вашу электронную почту и передает ее второй сети, которая генерирует три потенциальных ответа. Вы выбираете подходящий вариант, и электронное письмо отправляется. Но электронная почта столь же приватна, как и фотографии, если не больше в некоторых случаях.

 

Важно помнить, что ни один человек в Google не читает ваши электронные письма. Однако данные о том, какой выбор вы сделали, отправляются обратно, чтобы предоставить информацию глобальной модели. Вот так машина обучается. Исходя из этого, исследователи могут попросить машину ответить на определенные вопросы, а оттуда понять, что требуется устранить в нейронных сетях. Программное обеспечение одинаково для всех функций. «Умный Ответ» дает нам представление о том, как продукты машинного обучения встроены в Google. Команда, которая работает над опциями почтового ящика, развернула эту функцию внутри. Так происходит проверка машины и выясняется, что было правильно и что неправильно. Этот процесс проверки называется «dogfooding». Когда приложение ведет себя правильно в контролируемой среде и может быть масштабировано, оно будет выпущено в свет.

Внутреннее тестирование дает исследователям возможность прогнозировать потенциальные ошибки, когда нейронные сети обрабатывают массовое количество данных. Например, сначала «Умный Ответ» хотел сказать всем: «Я люблю тебя». Но это было просто потому, что в личных письмах «Я тебя люблю» была очень распространенной фразой, поэтому машина считала это важным.

Все это – попытка сделать вашу работу проще. Вот, что делает большинство продуктов компании, особенно Google Now – личный помощник в мире Google. Уловный девиз команды: «нужная информация в нужное время». Апарна Ченнапрагада, глава Google Now, говорит, что машинный интеллект, встроенный в платформу, должен быть продуманным, чтобы дополнить человеческий мозг.

«Вы можете выбрать задачи, которые трудны для людей, но будут легки для машин», – говорит Ченнапрагада.

«Речь идет о том, чтобы заставить технику делать тяжелую работу для вас, вместо того, чтобы делать это самостоятельно»

На данный момент продукт действительно просто исследует, как использовать эти методы, чтобы сделать вашу жизнь проще. Ченнапрагада сравнивает его с тем, на каком уровне были исследования с распознаванием голоса 5 лет назад: все было хорошо, но не работало без ошибок постоянно. Теперь Google подбирает варианты, как использовать три разных типа данных. Гуглеры рассматривают телефон как «устройство частичного внимания», поскольку идеальный сервис не должен перегружать вас информацией.

Конечная цель в смартфоне с машинным интеллектом – это настоящий цифровой персональный много знающий помощник. Чтобы стать таковым, ваш телефон нуждается в данных о вас: о вашем расписании, о том, что вы ищете, какую музыку слушаете и куда идете. Это самый простой вид информации, потому что он уже находится на устройстве. Но когда вы объединяете эту личную информацию через «График Знаний» от Google, а также данные, полученные от других пользователей, мир открывается вам. Например, если вы не знаете, как перемещаться по аэропорту, тогда ваш телефон укажет вам правильный путь.

Другим примером того, как Google использует данные большого количества людей, является измерение дорожного трафика. Извлекая анонимные данные с телефонов о местоположении на шоссе, Google может сказать, что автомобили движутся медленнее или быстрее, чем обычно. Также можно узнать о том, насколько заняты ресторан или кафе. Таким образом, Google Now показывает, как Google приближается к машинному интеллекту. Ученые компании знают, что общая модель интеллекта, которая может рассказать вам, например, что нарисовано на картине, – это годы и годы кропотливой работы. Поэтому пока они создают мозаику инструментов, которые действуют в гармонии, чтобы добиться лучших результатов.

Организация информации

Помните, ранее упоминалось, что Google Now работает с «Графиком Знаний» (Knowledge Graph). Так что же это такое? Джон Джаннандреа, глава исследования Google с 2010 года, ранее основал компанию под названием Metaweb. Она связывала текст и объекты в Интернете. Это была логическая параллель с поиском – не только поиск вещей, но и поиск похожих фрагментов информации. Специалист работал над этим вопросом еще до трудоустройства в Google, когда он был техническим директором Netscape. (Помните Netscape?). Но все эти наработки проявились в Knowledge Graph («График Знаний»). Проект дебютировал в 2012 году как бит информации и текст, которые автоматически всплывают при поиске фактов. Если вы сделаете запрос «Когда было основано научно-популярное издание Popular Science?», Google предоставит ответ: 1872 год.

 

Данный способ помогает не только каталогизировать Интернет, но и сделать его более доступным и полезным для своих пользователей. Это была также первая утечка искусственного интеллекта в основной продукт – поиск. С тех пор Google передал 15% своего ежедневного поискового трафика модели искусственного интеллекта под названием RankBrain. Эта система предназначена для поиска запросов, которые традиционные алгоритмы не могут понять. Помимо интеграции в основные алгоритмы поиска и расширения продуктов, Google также использует некоторые авантюры в работе. Для этого они полагаются на Джеффа Хинтона. Этот ученый является одним из ведущих мыслителей в области искусственного интеллекта. Его часто ставят на одну ступень с другими исследователями высокого уровня, такими как Янн ЛеКун в Facebook, Эндрю Нг Google и Йошуа Бенджио. (ЛеКун, Хинтон и Бенгио в мае этого года провели обзор в Nature по глубокому обучению, который читается как буквальный учебник по ИИ.)

Говорить с Хинтоном – это как разговаривать с человеком из будущего. Он рассказывает о превращении документов в векторы мышления, чтобы машины могли понимать и запоминать длинные версии, а также перерабатывать алгоритм, используемый нашим мозгом для изучения.

Многие компьютерные программы сегодня, например, с большим трудом справляются с анализом текстового документа, путем поиска определений слов и грамматики. Но для того, чтобы понимать документ как человека, компьютер в идеале будет способен разбить документ на ряд различных мыслей.

«Google хотел бы иметь возможность дать документ машине, чтобы она выяснила, что говорится в документе и как одна мысль вытекает из предыдущих», – говорит Хинтон.

«Если бы мы могли начать это делать, тогда компьютер мог бы дать вам гораздо лучшие ответы на запросы, потому что он действительно читает документы и понимает их».

Когда его спросили, почему Google этого не делает, Хинтон ответил, что если мы пытаемся сопоставить понимание машины с мозгом человека, то это вопрос масштаба. Наш мозг гораздо сложнее, чем искусственные нейронные сети. Лучшие из них могут иметь сотни миллионов весов, которые можно манипулировать (ЛеКун использует аналогию с черным ящиком с миллионом ручек снаружи, чтобы объяснить, как работать с весами). Хинтон объясняет, что наш мозг имеет 100 триллионов – это в 100 000 раз больше информации. Компьютерный ученый оптимистично настроен на то, что серия исследований в области искусственного интеллекта не выйдет из строя, как это было в прошлом. (Исследования ИИ пережили «зиму», где прогресс не соответствовал ожиданиям, а инвестиции угасали) Весомым фактором этого является все более популярная идея векторов мысли, упомянутая ранее. Но самым приятным для Хинтона является прогресс за последние пять лет, особенно признание объектов и речь. Эти проблемы часто считались слишком сложными в прошлом, но теперь частота ошибок резко снизилась при стандартизированных тестах.

«Компьютеры приближаются к исполнению функции распознавания объектов на уровне человека. Еще несколько лет назад мы считали, что не достигнем таких результатов за долгие годы. Так что сейчас это причина для оптимизма», – говорит Хинтон.

Но независимо от того, насколько хорошо машина может дополнять или подражать человеческому мозгу, это ничего не даст, если обычный человек не может понять, как для этого правильно использовать компьютер. План Google заключается в том, чтобы доминировать в искусственном интеллекте, делая его простым и доступным, насколько это возможно. Хотя технологические процессы, скрытые от глаз пользователей, сложны и динамичны, их конечным результатом являются повсеместные инструменты, которые работают, чтобы облегчить вам жизнь.

Кажется, Вам понравился этот материал, раз Вы его дочитали до конца. Пожалуйста, поделитесь с нами своими мыслями об этом?

Comment

This post doesn't have any comment. Be the first one!

hide comments
Share
...
Back

Your cart

0

Корзина пуста.

Total
0.00$
Checkout
Empty

This is a unique website which will require a more modern browser to work!

Please upgrade today!