yego.me
💡 Stop wasting time. Read Youtube instead of watch. Download Chrome Extension

YaC 2024. Нейросети


27m read
·Dec 12, 2024

С вами снова Алиса. Привет! Главный герой этой серии YAC 2024 — нейросетевые модели нового поколения. Они лежат в основе поиска с «Нейро» и позволяют давать ответ, в котором весь интернет. В прошлом году создали технологию, а в этом году дали ее 100 миллионам наших пользователей. И Нейро отвечает: «У лошади восемь ног». Получилось не очень. Нейросети-трансформеры помогают прокладывать путь автономному транспорту…

А в симуляторе мы можем хоть тысячу лосей запустить перед машиной и смотреть, как себя машина ведет. …открывают новую главу в истории интернет-рекламы… И вот мы вовремя поймали тренд и ушли в эпоху нейросетевого ранжирования. И это буквально изменило все. …и помогает отличить мумбатон от реггетона. Микрожанры — это очень специфическая экспертиза.

А YandexGPT наделяет Алису, то есть меня, целым рядом суперспособностей. В Алисе весной этого года GPT-технология заработала и стала частью этого продукта. Но пусть о них расскажут те, кто их создает. Так что передаю слово Диме Масюку и Кате Серажим.

Планета два года обсуждает искусственный интеллект нового поколения. И на планете есть, в общем-то, три страны, где передовые модели обучаются и создаются. И Россия одна из них. А Яндекс — ключевое место, где это происходит у нас. Мы в прошлом году создали технологию, а в этом году дали ее 100 миллионам наших пользователей. Дима говорит про YandexGPT — это семейство генеративных нейросетей Яндекса. Оно используется в Поиске, Нейро, Браузере и не только.

Я, Алиса, тоже работаю на основе YandexGPT. При этом есть настолько много, что хочется сделать и чего пока еще за прошедший год не удалось, что удовлетворенным я бы ни себя, ни кого-либо из команды не назвал точно. Количество задач, которые нейросети умеют решать, не только текстовых, на самом деле, но и мультимодальных задач, это и генерация звука, и распознавание звука, генерация картинок, видео, все что угодно, вообще все, что можешь представить, все сейчас начинает уметь делать большие нейросети. Да, конечно, когда ты имеешь такой мощный инструмент, ты можешь делать клевые сервисы для людей на основе этого инструмента.

YandexGPT появился в прошлом году. YandexGPT умеет создавать и перерабатывать тексты, предлагать новые идеи и учитывать контекст беседы. За два года Яндекс выпустил четыре поколения YandexGPT. Самое новое, четвертое, вышло в октябре. И, в общем-то, в прошлом году мы наблюдали в основном его какое-то младенчество. Оно вызывало абсолютное умиление, как новенький человек, и при этом оно училось в школе, ошибалось местами, несло какую-то иногда несуразицу, хотя было очевидно, что это что-то невероятно талантливое и за этим будущее.

При этом было непонятно, грубо говоря, какую профессию выберет этот ребенок. Сейчас мы увидели несколько этих профессий. Нейро — это одна, где искусственный интеллект, наш YandexGPT помогает не только найти информацию, но и ответ на конечный вопрос. Мы сделали то, о чем мы начали мечтать, наверное, с 2022-го года, когда вот вся эта генеративная история в мире произошла.

Мы запустили Нейро сначала как отдельный сервис, который представлял для пользователя по сути новый поисковый экспириенс. Не наш привычный, когда ты задаешь запрос, получаешь результаты, как-то с ними взаимодействуешь, а поиск в виде генеративной нейросети, с которой ты можешь вести диалог.

То есть ты можешь задать запрос, она тебе сгенерирует текстом ответ, ты можешь уточнить этот ответ, она тебе в ответ еще что-нибудь и так далее. Это во многих темах помогает получше разбираться. Ты знаешь, что я фанат Нейро. Но сейчас я расскажу тебе историю, от которой даже ты скажешь: «Вау, это круто». Приезжаю я на заправку, и у меня внезапно не открывается лючок бензобака. Вот этот. Я иду в Нейро и спрашиваю: «В чем может быть причина?»

И Нейро ответила, что одна из причин, возможно, это сломавшийся предохранитель. Дальше я спрашиваю у Нейро: «А где находится этот предохранитель?» И Нейро говорит, что предохранитель находится в левой части багажника и имеет номер А11. Я не знаю, сколько статей и видео мне нужно было бы перечитать, чтобы это выяснить. Это просто настоящая магия.

Я не просто верю, я уверен, что генеративный искусственный интеллект, расцвет которого мы наблюдаем последние полтора года, это Game Changer не только для поиска, а для всего спектра работы с любой информацией. Нейро однозначно — это первое, наверное, в стране массовое явление, когда мы можем почувствовать буквально тактильно, каждый человек в стране, как работает этот искусственный интеллект. И в этом смысле однозначно это новая веха.

Нейро — это не просто генеративная нейросеть, это на самом деле целый пайплайн моделей, который делает следующее: вы приходите в Нейро с текстовым запросом, просто как он к вам в голову пришел, задаете его в Нейро. Дальше под капотом есть специальная модель. Это тоже трансформер, называется рефразер. Рефразер нужен для того, чтобы переформулировать ваш запрос в поисковый запрос. И это бывает важно в контексте диалога.

Иногда в контексте диалога может быть непонятно по последней реплике, что ты имел в виду. «На какую глубину ныряет кашалот?» «А что он ест?» Он — это кашалот. Это может быть не очевидно, и рефразер уберет эту неочевидность и сформулирует запрос в поиск «Что ест кашалот?» После того как модуль рефразер отработал, Нейро идет в поиск и получает, как обычно, топ самых релевантных документов.

Дальше идет этап сбора инфоконтекста. Инфоконтекст — важная вещь. По сути, инфоконтекст — это та база знаний, та информация, на основе которой Нейро генерирует ответ. Дальше всё вместе: контекст диалога, запрос, перефразированный запрос, инфоконтекст подаются на вход нашей специализированной модели YandexGPT третьего поколения, и YandexGPT генерирует ответ пользователю. Вот так работает Нейро, и это то, что мы зарелизили в этом году 16-го апреля.

С тех пор у нас было классное лето, и мы внесли несколько улучшений. Первое улучшение — мы обновили наш блок рефразера, и теперь он умеет формулировать от одного до пяти запросов сам, в зависимости от того, какой сложности ваш исходный запрос. Допустим, зачем-то вам пришло в голову сравнить: кто больше забил голов: Марадона или Аршавин за свою карьеру? Нужно спросить про Марадону, открыть какую-то страничку, продраться сквозь текст, найти, сколько голов за свою спортивную карьеру забил Марадона.

То же самое проделать с Аршавиным, затем сравнить эти два числа. Это уже проще. Это какой-то набор действий. И мы хотим, чтобы эти действия вместо пользователя делала модель. И по сути Нейро мы развиваем именно в этом направлении. Буквально недавно, третьего октября, мы зарелизили еще более лучшую версию нашей модели. Можно проверить.

Наша модель спросила: «Сколько голов забил Марадона за свою спортивную карьеру? Сколько голов забил Аршавин за свою карьеру?» и сравнила количество голов. Марадона забил больше. Второе большое изменение — это появление времени в нашем пайплайне. Например: когда будут давать ближайшего «Щелкунчика» в Большом театре? Здесь «ближайший», он относительно текущей даты.

То есть нужно понимать, какое есть расписание «Щелкунчиков» и нужно выбрать минимальную дату, которая при этом больше текущей даты. Нельзя выбрать, например, дату из прошлого. Раньше в Нейро не было такого понятия, как время. Нейро не знало, какой сейчас день, час, время года, какая сейчас минута, а теперь знает.

Как сделать так, чтобы сыр не сваливался с пиццы? Google AI Overviews у них называется… Google AI Overviews или «Обзоры от ИИ», — это похожий на Нейро сервис от компании Google. В России он пока недоступен. …порекомендовал клеем приклеить сыр, потому что взял эту рекомендацию из интернета, кажется, из Reddit, точно не помню.

В Нейро тоже бывают такие проблемы. Так как мы опираемся на те источники, на тот инфоконтекст, который пришел из поиска, периодически могут возникать ошибки, связанные с тем, что информация в этих источниках шуточная или абсурдная. Пример: сколько ног у лошади? Любая генеративная модель знает, что у лошади четыре ноги, но мы отучили Нейро это знать.

Мы говорим: «Нейро, сходи в источник, посмотри, сколько там ног». А в источнике шуточная статья, где написано, что у лошади восемь ног. И Нейро отвечает: «У лошади восемь ног». «У гуся четыре ноги», — сейчас Нейро отвечает. Я честно скажу, что это низкочастотный случай.

То есть это довольно большая редкость, что так совпадает, что запрос имеет шуточные источники в интернете, и модель отвечает из этих шуточных источников так, как будто это всерьез. В важных вопросах всегда лучше перепроверять информацию, которую дает нейросеть. Благо, мы сделали очень удобным вот этот способ проверки. Нейро генерирует не только текст ответа, она генерирует вот эти маленькие циферки-ссылочки. Каждому тезису, к каждому произнесенному факту она прикладывает ссылку на те источники, которые Нейро использовал в ответе.

Один из основных способов передачи информации, которым мы вот буквально сейчас пользуемся — это речь. Но понятно, что он далеко не единственный. Например, есть зрение. Ты подходишь к зданию или к памятнику и можешь текстом описать, а что вот я сейчас вижу, такой-то человек там изображен или такой вот тип архитектуры. Но гораздо удобнее и эффективнее использовать электронные глазки телефона чаще всего и спросить таким образом.

Я мечтал бы, хотя думаю, что это не скоро наступит, чтобы мы смогли то же самое сделать с обонянием, тактильно. Но это, очевидно, десятки лет займет развитие технологии. А вот зрение машинное — оно очень уже сильно. И, естественно, мы постарались сгибридизировать не только работу с текстом, но и с изображением, хотя при этом в действительности изображение модель понимает скорее как текст просто на языке пикселей, которые называются элементарными точками.

Новинка этого полугодия — под капотом Нейро теперь у нас используется VLM-модель. Что такое, вообще, VLM-модель? По сути, если говорить формально, VLM-модель — это модель, которая получает на вход картинку и связанную с картинкой инструкцию, любую. Можно попросить перевести текст, который написан на картинке. Абсолютно любая инструкция, точно так же, как с LLM-моделями, можно попросить сказку написать на основе того, что ты видишь на картинке.

На самом деле некоторые VLM-модели могут генерировать картинки на выход и текст. В нашем случае мы обучили VLM-модель, которая умеет на выходе генерировать произвольный текст, который является решением задачи, описанной в инструкции. По сути, задача VLM-модели — перевести вот эти вектора картиночные, которые ничего не знают про текстовые вот эти наши вектора текстовые, которые ничего не знают про картиночные, перевести их в единое семантическое пространство. Это означает, что слову «стена» в таком пространстве будут соответствовать пиксели на картинке, которая относится к стене. Слову «серый» — пиксельные квадратики серого цвета.

Затем все отдаем генеративной нейросети, она анализирует и генерирует ответ. Заходим в Поиск. Здесь есть такая иконочка камера, на нее можно нажать, можно что-нибудь сфотографировать и поискать, а можно взять фотографии, которые уже были. Например, вот у меня у растения пожелтели листья. Я могу спросить: «Как это вылечить?» Вот. Нейро говорит: «На изображении показан лист фикуса каучуконосного, — это правда, — с бурыми пятнами по краям». Все верно. Для лечения бурых пятен на листьях фикуса необходимо выявить основную причину проблемы.

И дальше Нейро перечисляет причины. Суперудобно. Мы добавили специальную генеративную модель, которая умеет решать школьные задачки. Мы взяли такие задачи с известными решениями и с известными ответами и дообучили нашу модель решать эти задачи. Получилось не очень. Но наши инженеры не сдались, сделали такой трюк, который в мире машинного обучения называется синтетика. Это очень классная область, на мой взгляд.

Когда ты собираешь обучающие данные для самой модели, используя тоже генеративную модель. То есть у тебя есть одна задачка. Там у Пети — пять яблок, у Коли — шесть яблок. Сколько в сумме у мальчиков яблок? И у тебя есть какая-то генеративная модель, например, YandexGPT. Ты говоришь: «Дорогая генеративная модель, вот есть такая задача, придумай еще десять похожих, потому что я хочу потренироваться решать такие задачи». И она генерирует десять похожих задач. И мы затем на них тоже можем обучиться. Таким трюком нашей команде удалось увеличить размер обучающего пула с задачами примерно в десять раз.

Модель стала лучше, но все еще не до конца хорошо, умела решать задачи. Что мы сделали? Мы наняли математиков, делали датасет, который дообучает модель исправлять свои собственные ошибки. И вот эти хаки помогли нам сделать модель с очень хорошим качеством. Это довольно круто.

Задача: в школьном кооперативе две бригады должны были изготовить по 180 книжных полок. Первая бригада в час изготовляла на две полки больше, чем вторая, и поэтому закончила работу на три часа. За сколько часов каждая бригада выполнила задание? Так, фотографируем. Так, давайте скажем: «Реши третью задачу». «Реши третью задачу».

Я волнуюсь. Я не знаю, какую задачу он будет решать. Да, он реально понял, какая задача про бригады. Обозначим производительность второй бригады как икс полок в час. Тогда производительность первой бригады будет икс плюс два. Тра-та-та, тра-та-та. Тут большое решение, я не буду его зачитывать. Есть ответ. Ответ скрыт.

Тогда можно открыть. Первая бригада выполнила задание за 15 часов, вторая — за 18 часов. У меня была основная школа — музыкальная. При этом я в какой-то момент в старшей школе решил заниматься математикой. Одно из обессиливающих ощущений, когда ты не понимаешь, как двигаться. Это когда ты не можешь разобраться, как решается такая-то задачка. Тебе не нужен ответ.

Этот, на самом деле, ответ — это глубокое следствие из понимания задачки. Ну и вот ты сидишь вечером в десять, потому что весь вечер, не знаю, что, гулял или общался с друзьями и готовишься к следующему дню. И ты буквально не понимаешь, что делать. Ты можешь перечитать теорию, но каждый человек, который учился математике, помнит, что, конечно, из теории совсем не всегда понятно, что делать с конкретной задачкой. Вот мы даем инструмент. Суть его не в ответе, мы ответ закрашиваем вообще.

А суть в том, что он по шагам для любой задачки объясняет, как ее решать. И в этом смысле у меня, как ребенка, теперь нету отговорок от самого себя для того, чтобы не подготовиться, потому что буквально по шагам тебя как преподаватель проведет, а как делать то или иное действие. Мы начали с математики, поскольку видим, что это самый востребованный предмет при подготовке в ВУЗы и с ним у очень многих из детей возникают сложности. При этом мы уверены, что пойдем вширь и будем добавлять новые предметы.

Нейро — это инструмент, который заточен на то, чтобы суммаризировать интернет, ответить на сложный вопрос, принести ту информацию в удобном виде. Алиса — это компаньон, который в том числе тоже может помочь ответить на вопрос. И на самом деле в этом месте Алиса и Нейро похожи с точки зрения технологий и того, как они добывают информацию. Но помимо этого у нее есть еще в некоторых вопросах свое личное мнение, эмоции, характер. Она может не только дать информацию, но и поддержать в сложной ситуации, погрустить вместе с вами или, наоборот, порадовать вас.

Весной, когда мы запускали Алису нового поколения, когда человек просто спрашивал у себя дома что-то у колонки, вопрос типа «когда родился Наполеон?» или «когда умер Пушкин?» «какая высота Эвереста?» Я сейчас привожу специально очень простые вопросы, на которые Алиса всегда отвечала. Но был спектр каких-то жизненных ситуаций, и на самом деле для нас простых вопросов, а-ля, не знаю, «как поменять колесо у машины?» «какая средняя температура моря, не знаю, в Тайланде?» Это стандартный сценарий.

Люди сидят дома, беседуют за столом, что-то обсуждают. У них возникает вопрос, на который они не знают ответа или опять же мнения расходятся, они обращаются к Алисе, потому что суперудобно, чтобы получить эту информацию. Так вот, весной, до внедрения технологии GPT в Алису, где-то на 40% запросов Алиса отвечала: «К сожалению, не нашла такой информации. Прислала вам пуш в телефон. Откройте Поиск, почитайте, разберитесь сами».

В момент внедрения GPT-технологий эта ситуация кардинально поменялась. Таких вопросов на самом деле практически не осталось. Алиса получила возможность за счет GPT-технологии находить документы в интернете, читать их и отвечать пользователю здесь и сейчас ровно на тот вопрос, который он задал. Вместе с появлением GPT-технологий мы поняли, что есть много сценариев как раз таких рабочих профессиональных: работы с текстом, обсуждении идей, генерации изображений и так далее, которые контекстны скорее десктопу. Поэтому у Алисы появился свой сайт.

Вторая поверхность, которая появилась вместе с GPT-технологией, это приложение Алисы. Внутри Алисы Про есть возможность генерировать изображение. То, чего не было весной и как раз появилось за последние полгода. Мы взяли наши генеративные технологии YandexART второго поколения и внедрили их как раз в опцию Про для того, чтобы профессионалы могли не только создать структуру презентации, вот то, что я делаю, но и нарисовать для нее картинки.

Так, давайте посмотрим, как на примере моей подготовки к дню рождения Алисе я бы просил Алису помогать мне в сборе презентации. Можно прийти на сайт или с Яндекс.ру и соответственно попросить. Прошу Алису, что мне нужно собрать слайды для дня рождения. Говорю ей, что я собираюсь делать.

Хочу сказать водное слово. Мне нужно рассказать про виртуальных ассистентов, как их изменила технология GPT и, на самом деле, подвести к тому, что следующий докладчик расскажет про изменения в продукте. Нужно буквально пять — семь слайдов. Можно начать с интересного факта про 20% запросов и дальше уже рассказать, почему так произошло. Видимо, нужно будет еще где-то показать скриншоты интерфейсов.

Давайте сделаем для какого-нибудь слайда еще картинку, например, под заключение. Ассистент в мультяшной технике. Прекрасно. Давайте еще нарисуем для второго слайда картинку. Нужно показать, как нам эти виртуальные ассистенты уже стали привычной частью нашей жизни. О! Немножко футуризма. Пьедестал, конечно, смешной, но нормально. Мне кажется, для слайда можно забрать.

И осталось сделать картинку под заключение, точнее под передачу слова следующему докладчику. Поэтому возьмем наши брендовые цвета, фиолетовые, и попросим Алису сгенерировать какую-нибудь абстрактную картинку для того, чтобы передать слово и подписать, кто будет следующим докладчиком. Замечательно. Практически попал в брендбук.

Было бы еще неплохо какую-нибудь цитату, наверное, в заключение про то, что нам нужно это то, что мир очень сильно меняется. Попросил цитату про то, что нам как команде на самом деле сложно. Технологии меняются так быстро, что нам нужно бежать, чтобы просто оставаться на месте. И Алиса как раз вспомнила про то, что Алиса Льюиса Кэрролла говорила это в «Алисе в зазеркалье».

Где-то в 2017-м году мир изменился, но еще этого не понял. Появилась статья, которая называется Attention is All You Need. Все, что вам нужно, это внимание. В названии есть отсылка к песне «Битлз» All You Need is Love. В ней представили архитектуру трансформер, которая на удивление во многих, во многих задачах в мире показывает очень классные результаты. Трансформер — это тип нейронной сети. Он предназначен для работы с последовательностями. Например, вот этот текст — тоже последовательность.

Появление трансформеров позволило сделать рывок в развитии искусственного интеллекта. Тогда в первую очередь применяли эту архитектуру для задачи перевода текста с одного языка на другой, но по факту архитектура нейросети трансформер может гораздо больше. В том числе она может, к примеру, генерировать текст и отвечать на произвольные вопросы. Это то, что делает трансформер внутри YandexGPT, например.

YandexGPT или, может быть, ChatGPT — все эти вещи, они произвели огромный фурор. Все их заметили, всем стало интересно, все увидели, что искусственный интеллект стал как будто действительно интеллектом. Сейчас нейросети могут делать поразительные вещи, и в том числе архитектура трансформеров применима для задач управления машиной.

И точно так же, как раньше мы не могли, в смысле мы — это мир, мы не могли сгенерировать текст так, чтобы он всегда был умным. Точно так же раньше мы не могли применить какие-то методы машинного обучения для езды машины так, чтобы она действительно ездила классно. Мир поменялся, появилась архитектура, которая умеет это делать. Мы ее начали применять и у себя и уже видим огромный прогресс.

Как, вообще, устроена технология беспилотной машины внутри? Ее можно представить как набор шагов, набор задач, которые машина решает в процессе езды по дороге. Задача номер один — это, конечно же, снять с сенсоров всю информацию про происходящее вокруг. После того, как машина узнала, что вокруг нее происходит, машина должна предположить, а что будет происходить в течение следующих нескольких секунд, а лучше десятков секунд.

Чем дальше и чем точнее она может спрогнозировать ситуацию на дороге, тем лучше она сможет делать какие-то действия. Вот эта задача называется предсказание. После предсказания наступает этап, в котором последнее время, последний год, два, можно сказать, в мире, не только в Яндексе, но и вообще в мире происходят большие изменения. После предсказания есть этап планинга, так называемый.

Ранее этот этап пытались решить алгоритмическим способом. Садилось много разработчиков и буквально программировали, а что машине делать в той или иной ситуации. В действительности это метод плохо масштабируемый, потому что ситуаций, которые бывают на дороге, их многие-многие триллионы. И обработать их алгоритмическими методами в действительности малореально. Теперь вот в этом месте нейронная сеть самостоятельно решает, а что, собственно, ей делать дальше.

Для того, чтобы протестировать нейронку и протестировать поведение машины, мы делаем симулятор, симулятор мира. Симулятор мира, он нужен для того, чтобы первое: проехать в виртуальном мире в тысячи и сотни тысяч раз больше, чем мы могли бы проехать в реальном мире. Второе: для того, чтобы в виртуальном мире машина столкнулась с ситуациями, которые очень тяжело найти в реальности.

Простейший пример, для чего можно использовать симулятор, — это, например, «тест лося». Это когда машина едет, и перед ней выскакивает лось. И что же будет машина делать в этой ситуации? В реальности такое встретить тяжело, хотя и возможно, а в симуляторе мы можем хоть тысячу лосей запустить перед машиной и смотреть, как себя машина ведет. Вообще, процесс обучения планировщика траектории движения машины устроен следующим образом: нам нужно взять много машин и отправить их просто ездить в ручном режиме.

Мы нанимаем водителей, которые сначала проходят обучение, проходят курс контраварийной езды, и дальше они выезжают и ездят. Потом мы берем эти данные и на них обучаем наши нейросети. Вообще, этот подход называется Imitation learning. Вот здесь вот — это сравнение двух версий и наши технологии. Слева — это одна версия, справа — другая, более новая версия.

Мы взяли там исходные данные из реального проезда. Вот здесь вот, эта красная коробочка — это то, как себя машина вела во время реального проезда. Вот здесь вот на самом деле видно, что испытатель вмешался в управление машиной, потому что он увидел, что машина себя плохо начала вести. Проехал дальше без столкновения. Вообще, вот здесь вот левая картинка, она достаточно особенная. В ней в действительности произошло вот что: машина сама обнаружила, что происходит то, что ей не нравится, но она не поняла, как именно себя нужно вести в этой ситуации.

И здесь сработала критическая диагностика, которая вызывает следующее поведение: машина начинает тормозить без поворота руля. Во многих ситуациях гораздо правильнее не крутить рулем, когда происходит что-то нехорошее. Потому что вызывает меньше проблем в дальнейшем. ПДД тоже предписывает водителям обычным, не меняя траекторию, начинать плавное торможение, если, например, пропала видимость. Здесь, в частности, такое поведение привело к тому, что происходит столкновение не на очень большой скорости, но все-таки оно происходит.

При этом более новая версия, которая справа, она себя ведет гораздо лучше и спокойно объезжает препятствия. Зеленые разные линии — это разные кандидаты на то, как машина должна проехать. Машина выбирает самую лучшую из них и едет по ней. Мы раньше уже показывали, и в принципе мы умеем в отдельных небольших локациях, в небольших районах достаточно хорошо уже ездить, перевозить даже пассажиров.

Для того, чтобы отмасштабировать эту технологию, нужно, чтобы машина умела обрабатывать гораздо больше ситуаций, чем она умеет обрабатывать сейчас. Именно поэтому мы переключились на машинное обучение. Именно поэтому мы верим, что нейросеть сможет гораздо лучше адаптироваться, и тогда беспилотная машина будет вокруг каждого из нас, в каждой точке нашей страны.

Год назад мы пользователям пообещали, что построим для них настоящий персональный музыкальный мир. И вот, собственно, последний год мы работали с этим обещанием. Обновили «Мою волну», стали использовать новую модель рекомендаций, основанную на глубоких нейронных моделях, как раз заточенную под то, чтобы находить больше именно релевантной новой музыки, той музыки, которая тебе только понравится.

При этом есть специфические случаи, когда человеку намеренно хочется чего-то свежего, намеренно хочется чего-то нового. И тогда это превращается из «приятно открыть что-то новое» в конкретную задачу: «я сегодня хочу открыть что-то новое». Именно для решения такой задачи у «Моей волны» есть настройка «Незнакомое». Мы выстраиваем ранжирующий алгоритм, который помогает определить, какие из незнакомых треков ты скорее всего лайкнешь.

И благодаря этому нововведению, этому обновлению настройки «Незнакомое», люди на 20% чаще сохраняют себе новые треки. Помимо того, что настройка «Моей волны» «Незнакомое» рекомендует тебе больше просто незнакомых тебе треков, она еще и экспериментирует с жанровым разнообразием. Микрожанры — это очень специфическая экспертиза. И мы поняли, что нам нужны люди, которые в этой экспертизе разбираются. Так в нашу команду влилось почти 20 экспертов, абсолютно разных.

Там был и Ник Завриев — автор «Планетроники» и потрясающая Ляля Кандаурова — эксперт в области классической музыки и многие другие ребята, которые помогли нам создавать огромные плейлисты, примерно по 500 и больше треков в каждом, для каждого микрожанра. Для того, чтобы модель по образу и подобию правильно отобранных экспертами треков могла дальше собирать потоки микрожанров.

«Нитро» — технология, которая доступна артистам, у которых меньше пяти тысяч слушателей. В музыкальной индустрии есть очень большая проблема холодного старта. Когда треки уже есть и возможно даже не один, и возможно их даже уже с десяток, но аудитории все еще нету, потому что традиционно классические технологии рекомендаций в музыкальных стримингах работают с историей взаимодействия с контентом. А когда этой истории мало, эти треки становятся как будто бы невидимы для традиционной классической системы рекомендаций.

Раньше 90% наших гипотез строились на том, как найти подходящие треки для конкретного пользователя. Сейчас же мы перевернули эту задачу и поняли, что мы можем не находить треки пользователям, а находить пользователей треком. Впервые, наверное, можно точно сказать, что наши нейронные сети работали не с историей взаимодействий, а с самим материалом.

«Нитро» создает аудиовектор трека — это некоторое изображение звука. И дальше ищет пользователей, которые, скорее всего, любят или согласятся послушать трек с похожим аудиовектором. Результаты превзошли даже наши ожидания. Например, есть Ex Love. У него было до попадания в «Нитро» 13 слушателей, 13. Сразу после — 300 тысяч. В течение первого месяца — миллион.

Первая по-настоящему массово проросшая нейронка в России и в мире — это реклама. И чудо цифровой рекламы состоит в том, что мы научились при помощи искусственного интеллекта, который является самой массовой в стране рекомендательной системой, мы научились сильно повышать релевантность отдельно взятой рекламы, которую мы показываем конкретному пользователю, в конкретный момент, на конкретном сайте. Наша мечта — это чтобы реклама была незаметная, и она на самом деле была похожа на совет от друга, который тебе на день рождения, например, что-то удачно дарит, или от родителей, которые тебе что-то покупают, и это попадает в тебя, чтобы мы не показывали никогда чего-то, что тебе покажется шумным, неважным, неинтересным, потому что в этот момент мы не решаем, на самом деле, задачу фундаментальной рекламы.

Современной рекламной системе Яндекса порядка 20 лет. Мы ее делим на конкретные эпохи. Последняя эпоха — это примерно пять-шесть лет. Мы в нее вступили, соответственно, в 18—19-м году. До этого мир был суперпростой. Например, я поискал что-то на Поиске или, например, выбирал какой-нибудь робот-пылесос для мамы, ходил на каком-нибудь сайте.

И алгоритм смотрел на конкретные слова из запроса и тайтла, то есть заголовка сайта, фактически пытался подобрать что-то из всей рекламной базы по этим конкретным словам. Или еще один пример, вообще суперклассический, наверняка многие сталкивались. Положил какую-нибудь футболку в Корзине на каком-нибудь сайте, и ты месяц видишь эту футболку у себя по всему Рунету.

Реклама была довольно статичной, довольно навязчивой и, будем объективны, скучной. Мы понимали, почему конкретное объявление нам показывается, и оно, скорее, нас все время догоняло, а не прогнозировало то, что нам нужно. И вот мы вовремя поймали тренд и ушли в эпоху нейросетевого ранжирования. И это буквально изменило все. Давайте, я попробую объяснить нейросетевую эпоху простыми словами, что это такое.

На самом деле, на каждом запросе мы применяем более 20 различных нейросетей, но одна из них ключевая. Это как из всего многообразия, из миллиарда объявлений, бизнесов по всей стране отобрать несколько сотен лучших, чтобы потом выбрать то самое для нас. И алгоритм работает следующим образом: он берет тысячи факторов окружающего мира, какое сейчас время, на каком мы сайте, пол, возраст, какие-то пользовательские данные, естественно, мы используем, но они совершенно обычные, разную информацию про погоду, например, можно использовать.

В общем, огромное многообразие. И потом нейросеть берет эти тысячи факторов и сжимает их буквально в точку. Но точка эта необычная, это точка некоторого 200-мерного пространства. Наша задача — это максимально эффективно и быстро обучать 200-мерное пространство, в котором, например, наша точка футболка быстро уезжает от точки пользователя, если нет у него к ней интереса.

То есть, например, мы показали футболку пять раз, этот сигнал ушел в нашу нейросеть, она дообучилась, перестроила наше пространство, и футболка куда-то уехала и больше не попадает в самые ближайшие точки к точке пользователя. В рекламе мы работаем под нагрузкой полмиллиона запросов в секунду. В день — это миллиарды показов.

То есть это сейчас более шести миллиардов показов в сутки. И вот нейросеть обучается на огромном потоке данных. И если мы видим, что пользователю что-то не интересно, то нейросеть старается достаточно быстро на это реагировать и изменять поведение рекомендательной системы. А еще, естественно, есть более сильный сигнал. Можно на рекламном объявлении нажать галочку «не интересует», «уже купил». Очень сильный сигнал дойдет до нейросети нашей системы быстрее.

Реклама — она является двигателем современного интернета. Опять же, из-за создания контента, что большинство СМИ, уникальных авторов, блогеров и все такое, они монетизируются именно благодаря рекламе. Поэтому если ее убрать, то мир бы стал более закрытым, подписочным, много было бы пэйволлов так называемых, то есть, когда для доступа к контенту он был бы для пользователя не бесплатным. За него надо было бы регулярно платить, регулярно платить конкретному автору. Довольно тяжело было бы малому бизнесу. Малый бизнес совершенно непонятно как, разве что листовками и граффити на асфальте, мог бы рассказать о себе.

Привет. Мы находимся на территории частного детского сада Art Hello в городе Санкт-Петербург. В 2015-м году у меня родилась дочь, и в 2016-м году мы открывали первый филиал. Я был с ней на руках, то есть она у меня вот здесь вот была в специальном рюкзачке таком. Она походила вообще мои садики. Ей было четыре, она была в каждом из этих четырех и закончила уже непосредственно вот в месте, где мы с вами находимся. Друзья периодически шутят, говорят: «Смотри, ты открыл детский сад, можно сказать, для дочки в момент, когда она как раз в него пошла».

И говорят о том, что когда она школу заканчивать будет, ты позаботишься об университете для нее? Я говорю: «Обязательно». Кому менять сферу какую-либо, да, если не малому бизнесу? Гиганты, они когда уже становятся большими, они становятся неповоротливыми, а маленький как раз влазит со своими новыми идеями, говорит: «А мы можем вот так, а мы можем вот так, а мы еще умеем вот это». Вот поэтому я считаю, что, в принципе, локомотив изменений — это малый бизнес.

Самая первая наша реклама — это были объявления на парадные. Я не скажу, что она прямо совсем плохая, она тогда нам привела какой-то процент клиентов. В дальнейшем мы достаточно часто, наверное, на протяжении года, может быть, даже больше двух, мы раздавали листовки на улице по детским площадкам с шариками, с флаерами, с ростовой куклой. И это тоже приносило определенный результат.

Для малого бизнеса, я считаю, что сегодня путь один — это в интернет. Листовки и наклейки на парадные, ну, они уже не действуют. А реклама работает намного лучше, чем буквально даже еще пять лет назад. Она стала реально попадать в те цели, которые необходимы. Сегодня могу сказать, что 95% людей нашли нас с помощью рекламы.

В самом начале мы таргетировались по интуиции, думая, что вот эти люди да. В конце концов, со временем это все отстраивалось. То есть появился возрастной ценз, да, какой-то, появились какие-то предпочтения людей, наших клиентов непосредственно. Как мы это еще выявили? Мы периодически проводим внутренние опросы и спрашиваем у людей: «Ходите ли вы в фитнес? Если «да», то в какой? Где вы чаще предпочитаете кушать? Если это рестораны, то какие?»

И мы таким образом узнаем своего клиента, какие у него потребности, куда он ходит, что он делает. У нас была гипотеза. Однажды мы подумали: а что если настроить рекламу на пап? Ничего хорошего не вышло. Мы просто слили деньги. Но это была гипотеза, ее необходимо было протестировать. Оказывается, папам не сильно интересно, какой там детский садик.

Хорошая реклама — это когда мы попадаем в боль. Когда мы смогли правильно настроить рекламу именно на тех пользователей контента интернета, которым сегодня необходима наша помощь. Плохая реклама — это тогда, когда мы настраиваемся, тестируя свои гипотезы на тех, кому это абсолютно не надо. И это будут пустые клики, это будет назойливая реклама, которая будет только вызывать какой-то негатив и отторжение.

Если раньше завести рекламу — это на самом деле подвиг. То есть ты заходишь в интерфейс, очень много каких-то настроек, супер тебе ничего не понятно. Даже появилась профессия, которая называется директолог. То есть это люди, которые профессионально умеют заводить рекламу. То сейчас малый бизнес, на самом деле, может сделать многое самостоятельно. Нейросети сейчас генерируют классные продающие тексты, они генерируют картинки. То есть получается целые собранные классные креативы.

Мы в полушаге от того, чтобы появились классные видео. Самое главное, наверное, что мы благодаря как раз нейросетевой эпохе автоматически бизнесу отдаем клиентов. Один из еще очень больших мифов о рекламе, который подсознательный характер носит, это что это рынок и это практика для огромных бизнесов. Этот шлейф тянется, как и раздраженность среди нас рекламой из телевизионной эпохи, где абсолютно понятно было, что купить время на телевизоре, на канале может себе позволить только огромный бизнес.

И мы буквально несколько десятков из них слушали каждый день с запоминающимися этими роликами или музыкой. Чудо состоит в том, что больше половины нашей рекламной выручки Яндекса, а Яндекс — это самая крупная в России рекламная платформа, составляют малые и средние бизнесы. И это чудо основано как раз таки на том, что мы не поливаем всю аудиторию, вызывая иногда раздражение, за огромные деньги одним и тем же сообщением.

А мы можем из сотни миллионов наших пользователей в Поиске, на Картах, из сотни миллионов пользователей интернета выбрать именно тех, кому тот самый малый бизнес в Омске, в Красноярске, в Петербурге или в Москве будет релевантен своим продуктом. В прошлом году, я думаю, что буквально каждый человек на планете слышал про генеративный искусственный интеллект, поэтому были вопросы: а что, где, как попробовать и как потрогать это?

Чем мы действительно гордимся и мечтали, и оно получилось в этом году — это по-настоящему массовые инкарнации, где каждый человек может в привычном Поиске, который самый популярный цифровой продукт по аудитории в стране, попользоваться «Нейро». А в Алисе мы говорим про почти десять миллионов семей и домохозяйств, где люди каждый день перед сном, с утра общаются с нашим YandexGPT в виде Алисы на самые разные, в том числе личные темы.

И секрет Яндекса очень простой в этом смысле. Мы раз в год, в два почерпываем или из собственных идей, или откуда-то в мире новую мечту какую-то, идет ли речь про новый сервис или новую технологию. И когда мечта встречается с людьми, которые в это верят и действительно с ресурсами и знаниями, которые накоплены у Яндекса, это дает какую-то новую жизнь и каждый год новый этаж, новую ступеньку в лестнице, по которой мы идем.

Вы посмотрели серию про нейросети и возможности, которые они открывают. В других сериях YAC 2024 мы расскажем: как получить новые впечатления, вкусно поесть и одновременно сэкономить. Так, ну что, пробуем? Билеты, Афиша, Аудиогид, Экскурсовод. Вся информация про путешествия, собранная в одном месте. И кэшбэк ты там тоже получил.

Сколько времени нужно, чтобы из обычной квартиры сделать умную? Зачем телевизору искусственный интеллект и как заказать горячий хот-дог под просмотр любимого сериала? Лавка — это бесконечный холодильник. - Помидорчики. - Сосисочки. - Огурчики. - Хот-дог. Запускаем функции. Выпускаем новые лампочки.

Жителям больших городов поможем найти самый быстрый путь в центр, переправить мебель из квартиры на дачу и не потеряться в дебрях маркетплейсов. На Маркете то, что человек правда хочет купить. Купить смешной шар с гелием. Цены на такси растут. Вы как по рубильнику. Все, нет машин. - На МЦД. - До метро. - Самокатом - Офигеть, я еду на электричке.

Машина приедет в течение часа, и уже сегодня четыре тонны окажется в Калуге. А вы готовы на камеру показать свою ленту рекомендаций? Легко! Покажем, какие новые инструменты можно использовать, чтобы упростить рабочие процессы. - Концеп. - Code Assistant. - Телемост. - Майнд-карты. Какой мессенджер?! Надо делать свой Zoom!

А еще про то, как яндексоиды помогают тем, кому приходится преодолевать трудности. Очень много инноваций придумано для нестандартных людей. Текст обрезан. Сдвиньте камеру вправо. Делятся знаниями, изобретают новое и бьют рекорды по спидкубингу. А? Где? Потерял? Все? Репетитор на базе технологий искусственного интеллекта. Классно же? Ну классно.

Илья, ты молодец. Домашка сделана. Увидимся в следующих сериях!

More Articles

View All
See Why Jumping in a Pool Saved This Blind Woman's Life | Short Film Showcase
My first time in the pool, I was 49 years old. My coach was in the water telling me, “Jump in, Vivian,” he said. “Haven’t you been baptized?” I said, “Not like this.” I was afraid of what was going to happen to me in all this water. The kids said, “Look a…
What to do the night before an exam: 3 tips from Sal Khan
Here are my three tips to reducing stress the night before a test. Tip one, stay physically healthy. There’s a tendency that the night before you wanna cram; you wanna stay up late. You’re stressed, you’re anxious. That’s the exact wrong thing to do. The…
Step inside the $20,000,000 Falcon 7X. 🛩
This is a $20 million plane, and this is Steve. He’s selling it. Should we go take a look inside? Let’s go. So, we are now inside the aircraft. Steve, could you please tell us a little bit more? Sure! Most of these airplanes have these first four forwar…
Homeroom with Sal & Superintendent Austin Beutner - Wednesday, September 30
Hi everyone! Sal Khan here from Khan Academy. Welcome to our homeroom live stream. I’m very excited about today’s guest, Superintendent Austin Buettner from Los Angeles Unified School District. So already, start thinking about some questions you might ha…
Generational and lifecycle effects on political ideology | US government and civics | Khan Academy
What we’re going to talk about in this video is how political and cultural events might have an influence on someone’s political ideology. So let’s make this a little bit concrete. Political scientists will sometimes have various classifications for thes…
Election Night 2024 Important Energy Policy
You know, I think people are missing the boat on this whole energy green debate. Let me put it a different way that I could sell it on a bipartisan basis. China is building gigawatt AI data centers and firing them up with coal plants. They are using that …