Chief Data Scientist компании МТС Виктор Кантор окончил факультет инноваций и высоких технологий МФТИ, в студенчестве пришел разработчиком в компанию ABBYY, где вскоре стал заниматься образовательными проектами. После этого он работал в «Яндексе» и в Mail.ru, а параллельно всегда занимался преподаванием: кроме чтения лекций в вузах, он выступил соавтором онлайн-курсов МФТИ и «Яндекса» по машинному обучению на Coursera и курса Data Mining in Action. В этом году Виктор победил в рейтинге Forbes «30 самых перспективных россиян до 30 лет» в США в категории «Наука и технологии». Мы поговорили с ним о том, что он находит в образовании, как оценивает эффективность своих учебных программ и почему сам не окончил ни одного онлайн-курса.
— Вы начинали как программист. Почему вдруг перешли в образование?
В какой-то момент я понял, что больше удовольствия получаю от преподавания. Образование — это чистый восторг, хотя я долгое время стеснялся работать в этой сфере, пытался ее избегать. В конечном счете я все равно занимаюсь этим.
— А почему стеснялись?
Мне казалось, это перекладывание ответственности за свои знания на других: вместо того чтобы воспользоваться своими знаниями, ты начинаешь их пересказывать студентам, чтобы они уже что-то с этим делали. Важную роль на моем пути к преподаванию сыграл основатель Московской школы программистов Сергей Валерьевич Шедов. Как-то раз мы с ним беседовали, и я спросил, не скучно ли преподавателям все время одно и то же рассказывать. Он ответил: «Актеры один и тот же спектакль играют тысячи раз и им не скучно. Так же и здесь». Тогда я понял, что тоже могу попробовать смотреть на это так.
— Наверное, в преподавании по сравнению с разработкой легче получать обратную связь. Насколько это вас важно?
Очень. Хотя, на самом деле, в программировании ты даже больше получаешь обратную связь: написал программу — она либо заработала, либо нет. С менеджментом и преподаванием все намного сложнее: непонятно, кому верить. Например, приходят к тебе на лекции люди, которые не очень пока разбираются в этой области, и говорят, что все здорово, им понравилось. Первое время допустимо на это вестись, но по-настоящему судить о том, был ли мой курс полезен, можно только, когда студенты начнут работать. То, что они говорят сразу после занятия, — просто эмоциональная реакция, что, конечно, тоже важно — без эмоционального контакта ничего не работает.
— Как вы в таком случае определяете, насколько у вас удачный курс получился?
Это очень страшный вопрос для меня: я всегда считаю что все делаю либо плохо, либо в лучшем случае средне. С одной стороны, всегда хорошо стремиться к лучшему, с другой — это создает дополнительную нервозность. Бывали случаи, когда мне, например, не хотелось доводить занятие до конца, просто потому, что я чувствовал, что проходит оно не очень эффективно. Иногда я смотрю запись занятия и понимаю, что все было намного лучше, чем я думал. Пока я ориентируюсь на свои ощущения об эффективности того или иного курса, но по мере развития проектов нужно будет добавить и какие-то данные.
— Как вы придумали первый курс?
Я начал преподавать еще на Физтехе — вел факультатив по анализу данных, который потом вырос в курс Data Mining in Action. Через некоторое время он начал собирать такие аудитории, которые Физтех уже не мог вместить, и мы начали делать его за пределами университета. Эта история развивается уже девять лет.
— А как появились проекты, которые не были связаны с вузом?
В какой-то момент я пришел в компанию ABBYY программистом, а вскоре начал там работать менеджером образовательных проектов. При этом параллельно читал курс по машинному обучению для разработчиков. Сначала я задавал себе вопрос: почему вдруг разработчики будут слушать лекцию про машинное обучение от менеджера образовательных проектов? Это же какая-то невероятная глупость. В итоге оказалось, что все проще: ты общаешься с людьми, даешь им советы, которые они тут же могут применять в работе, и смотреть, подходит им это или нет. В 20 лет тяжело понять, что тебя могут воспринимать всерьез сильно более опытные люди и прислушиваться к тому, что ты говоришь.
— С чего начать тому, кто хочет запустить свой курс? Скажем, тоже по data science.
Если мы говорим про онлайн, то я бы рекомендовал сначала выйти на платформу, которая будет раскручивать курс. Самый успешный мой проект — курсы на Coursera. Причем, сама Coursera приводит мало людей на русскоязычные программы, значимость маркетинга этой платформы в российском сегменте несколько преувеличена. Что бесспорно, так это ее репутационная оценка: если человек видит, что курс на Coursera, он понимает, что продукт не на коленке сделан. В моем случае важную роль сыграло также то, что курс был запущен под брендами МФТИ и «Яндекс». Благодаря этому курсу меня начали узнавать, на каждой третьей рабочей встрече мне говорили: «О, а мы вас вчера смотрели». После этого преподавать и работать стало значительно проще. Соответственно, второй мой совет — получить минимальную известность среди той аудитории, с которой вы планируете работать. Еще один важный момент: не нужно сразу рассчитывать на эту историю как на источник серьезного заработка. До автора курса доходит ощутимая, но не очень большая доля от общих продаж. Если ваша цель просто распространить знания — можно разместить курс бесплатно на одной из прекрасных платформ типа Stepik. Наконец, можно сделать свой сайт — это здорово и интересно, но непросто: придется самостоятельно решать вопросы маркетинга и продаж.
— Сегодня одни образователи советуют сразу идти на профессиональные курсы, вторые — получить базу в вузе, а потом уже — курсы. Вы какой оптимальный путь видите сегодня для тех, кто хочет связать свою жизнь с машинным обучением?
Основная проблема многих вузов — их программы не ориентированы на современные реалии, они хранят наследие огромного количества лет. Даже на моем любимом Физтехе: программа была составлена давно академиками, нобелевскими лауреатами. Ее придумали для подготовки исследователей физики. Конечно, физика — настолько фундаментальная наука, что все, построенное на ее основе, в дальнейшем может пригодиться для наук попроще, вроде моей. Иногда я достаю с полки томик Ландау-Лифшица, листаю и грущу, на что я променял свою жизнь, чем я вообще занимаюсь. Пример с физикой показывает, что иногда те вещи, которые строились давно, — строились на века, и более менее выживают сейчас. В то же время было бы здорово, если бы мы могли построить образование, рассчитанное на современные потребности. Возвращаясь к вопросу про оптимальный путь: если ваша цель — окончить курс машинного обучения и работать по специальности, необязательно для этого сначала идти в вуз и тратить там несколько лет. База вам потребуется, без знания основ линейной алгебры и матанализа, будет тяжело, но есть более простые способы это выучить, чем университет, хотя он — один из способов получить крепкий фундамент, которого на трехмесячных курсах не заложить.
— У вас есть какой-то вступительный экзамен на курс? Вы кого там рассчитываете увидеть?
Мы ждем человека, который если и не знает, что такое градиент, то в состоянии прочитать об этом в Википедии, разобраться и посчитать его для несложной функции. Другими словами, он не обязан знать все, но должен уметь быстро разобраться.
— Кто к вам в основном на курсы приходит: люди из сферы или, например, дизайнеры, которые решили переквалифицироваться в аналитика данных?
Однажды нам с коллегами пришлось параллельно читать одну и ту же лекцию. У нас было две аудитории, которые вмещали 220 человек, и обе — заполнены под завязку. В обеих аудиториях мы задали вопрос «У кого есть техническое образование?» В первой почти никто не поднял руку, в другой — треть. Не знаю, насколько можно ориентироваться на эту выборку, но кажется, ситуация примерно такая. Возможно, в аудитории были также студенты технических вузов, которые не поднимали руки, ведь у них же еще нет диплома.
— Есть ощущение, что сегодня крупной компании гораздо выгоднее запустить свой образовательный проект, а потом взять на работу человека, которого они сами вырастили. Вы с этим согласны?
Это не всегда выгодно: иногда взять уже готового человека с рынка проще, чем пару лет его растить и тратить деньги на обучение. Все зависит от того, есть ли у компании возможность нанимать людей на хорошие зарплаты. Если нет, то им, конечно, интереснее вырастить.
— Тогда зачем гигантам типа Mail.ru запускать свои академии? Ради имиджа?
«Сбербанк», например, тоже делает свои образовательные проекты. При этом их потребности в кадрах настолько огромны, что при всех возможностях перекупить с рынка всех адекватных специалистов, они все равно не закроют все позиции. В этот момент возникает необходимость вкладываться в развитие среды. Были бы у них потребности поскромнее, они бы просто перекупали специалистов у других компаний и не сильно переживали насчет обучения. Если мы говорим именно о Mail, то у них очень хорошо развито направление образовательных проектов, и цель — не только закрыть актуальные потребности бизнеса, но и подумать немного о будущем. В компании уже думают не как им подготовить джуниоров, а как эффективно развивать качественных миддлов.
— Я читала, что вы в какой-то момент уволились из крупной компании и ушли в свободное плавание. Не страшно было?
Безумно страшно. Я уходил с очень приятной позиции — Chief Data Scientist «Яндекс.Такси». У меня была отличная команда, которую я сам собрал. В какой-то момент я почувствовал, что если не уйду сейчас, то не уйду никогда. Оглядываясь назад, я понимаю, что это был ценный опыт: теперь я не боюсь уйти из любой компании с любой зарплаты и начать делать что-то свое. Возможно, звучит немного пафосно, но я начал мыслить иначе. Когда ты всю жизнь работаешь наемным сотрудником, ты рассуждаешь так: вот моя зарплата, я на нее живу. Сейчас я могу себе сказать: ок, суммы, которая у меня есть, хватит на столько-то времени, которое я могу потратить на интересный мне проект и приобретение нужного опыта, который соответствует долгосрочным целям.
— Вы после увольнения чем занялись?
Корпоративные курсы, консультирование компаний по data science. Интересно: оказавшись в свободном плавании, я понял, что меня мотивирует команда, но набирать людей только, чтобы сохранить свою мотивацию, не понимая, куда именно ты их ведешь, было бы глупо и безответственно. Пришлось некоторое время жить совершенно самостоятельно.
— Насколько часто программистам сегодня нужно учиться? Есть ощущение, что новые методы выходят раньше, чем успеваешь пройти курс.
Так и есть. Когда мы записывали курс для нашей специализации на Coursera, обнаружили, что к тому моменту, когда закончили последнее видео, некоторые методы из библиотек, о которых мы рассказывали в первых видео, уже устарели. Программисту нужно быть готовым постоянно изучать документации библиотек: появляются не только новые методы, но и новые инструменты, а они обновляются намного быстрее, чем выходят какие-то клевые алгоритмические разработки.
— Вы сами как учитесь? Проходите курсы?
Должен признаться, я не читатель, я писатель. Могу составлять курсы, преподавать, но учиться самому довольно непросто. За свою жизнь я не прошел до конца ни одного онлайн-курса. С одной стороны, это забавный факт, с другой — вовсе не повод для гордости. Я восхищаюсь людьми, которые проходят онлайн-курсы, в том числе мои, и тем, как им хватает мотивации. Мне тяжело без ментора, нужно, чтобы все время кто-то направлял. Наверное, это говорит о том, что я не очень сознателен, но что поделаешь. Проблемы, с которыми я сам сталкиваюсь, помогают мне лучше понять процесс получения новых знаний, что бывает весьма полезно в моей работе.