
Андрей Окуньков: о красоте задач и роли математики в технологиях
Математика — это универсальный язык, на котором мы можем одинаково точно описать поведение элементарных частиц и работу нейросетей. Она соединяет фундаментальные законы природы и современные технологии, позволяя нам не просто фиксировать знания, но и открывать новое. В интервью с Андреем Окуньковым, математиком, лауреатом Филдсовской премии, мы говорим о пути современного ученого, о красоте математических задач, о роли математики в развитии искусственного интеллекта и о том, как фундаментальные открытия могут стать основой технологических прорывов.
Вы прошли путь от математической экономики до математической физики, от жизни в России до преподавания за рубежом. Что стало решающим в выборе профессии и какие вехи на вашем пути были особенно яркими?
В математику я пришел из математической экономики, переведясь с экономфака МГУ на механико-математический факультет, после службы в армии. Экономикой я занялся потому, что интересовался людьми и человеческим обществом, а математическая экономика мне представлялась самым строгим и научным способом этот мой интерес утолять. Не то, чтобы я потерял интерес к людям, скорее понял, что математика мне дается легче. И, кстати, всегда советую молодежи выбирать себе ту сферу деятельности, которая им дается легче и естественнее всего.
Экономическому факультету я обязан и встречей со спутницей моей жизни Инной, многими друзьями и первоначальному вектору в моих занятиях математикой. В математике у меня были замечательные учителя — сначала А.А.Кириллов, а потом Г.И.Ольшанский. Они занимались теорией представлений (не путать с цирковыми!). Это важная область математики, которая началась из нужд квантовой физики, и до сих пор помогает в решении многих естественнонаучных проблем.
Мир физический ничуть не менее интересен, чем мир человеческий, и легче поддается математическому описанию. Вот так и занимаюсь всю жизнь математической физикой, что подразумевает и задачи квантовой физики, которую я уже упоминал, и задачи статистической физики, которая изучает поведение систем состоящих из гигантского числа микроскопических частиц (например, молекул в жидкости или газе), и многое другое.
Мехмат я закончил в 1993 году, непростое было время. Математика с тех пор, конечно, сильно изменилась. Численные вычисления уже тогда играли огромную роль, но большинство математиков-теоретиков использовали компьютер только для того, чтобы читать электронную почту и редактировать статьи. Какие возможности для нас с тех пор открылись!...
Сегодня математика охватывает колоссальное количество направлений, и вряд ли возможно описать, что происходит в каждом из них, в нескольких словах. Но если говорить в целом – что сейчас занимает научные умы?
Математика наука совершенно гигантская и вширь, и вглубь, как и подобает науке способной описать и весь наш мир, и все воображаемые миры тоже. Математики в чем-то всесильны, а в чем-то бессильны. С одной стороны, некоторые невообразимо сложные и важные задачи удается по-настоящему решить, а с другой стороны многие, казалось бы, элементарные вопросы, суть которых можно объяснить пятикласснику, стоят практически без движения сотни лет. И зачастую математиков интересует почему некоторые задачи решаются, а некоторые — нет.
К подобным примерам на первый взгляд, элементарных задач, но нерешаемых задач, можно отнести проблему Гольдбаха. На заре цивилизации, люди осознали важность простых чисел, то есть тех целых чисел, которые делятся только на 1 и само себя. Например, к ним относятся 2, 3, 5, 7, 11, 13, 17, 19, 23 и последующие. Еще Евклид доказал, что их бесконечно много. А в 1742 году в переписке российско-прусских математиков Гольдбаха и Эйлера родилась гипотеза: каждое четное число, начиная с 4, есть сумма двух простых. Этот, и бесчисленное множество других "элементарных" фактов, так и остаются для математиков загадкой.
Я бы думал что больше всего математиков интересует, почему некоторые задачи решаются, а некоторые — нет. Звучит, конечно, философски, но на самом деле такая постановка вопроса имеет самое прямое отношение к нашей теме. Если знать общие контуры решения, то поиск и проверку их деталей можно спокойно поручить компьютеру. А вот отсутствие решения тесно связано с таким понятием, как алгоритмическая сложность. Эта алгоритмическая сложность преграждает дорогу не только чересчур оптимистичным первопроходцам, но и мошенникам, которые пытаются подобрать ключи к современным криптосистемам.
Красота математики в том, что трудные задачи всегда требуют привлечения новых идей и понятий для их решения. И нет никакого способа заранее знать, что же может потребоваться. Что только не потребовалось Эндрю Уальсу в его доказательстве теоремы Ферма, а ведь никакого другого доказательства мы не знаем после почти 400 лет поисков.
Кстати, размышляя о теореме Ферма, Эйлер предположил, что нет решений и у уравнения a^4 + b^4 + c^4 = d^4. Люди проверяли это на компьютере, и не нашли контрпримеров. Но, используя теорию эллиптических кривых (которые и у Уальса играют центральную роль, хотя и совершенно иную), Элкис в 1988 г. нашел решение 2682440^4 + 15365639^4 + 18796760^4 = 20615673^4. Если знать, где искать…
Вы упомянули, что компьютеры помогают проверять гипотезы и искать решения, но по-настоящему сложные задачи требуют совершенно новых подходов. Сегодня многие такие подходы рождаются и в машинном обучении. Как вы видите роль математики в развитии ML и в будущем науки в целом?
Это действительно важный вопрос, и отчасти этому будет посвящена моя ближайшая лекция "Математика и язык" на Practical ML Conf. Речь пойдет о том, как абстрактные математические понятия находят свое выражение в человеческом языке, и о том, как люди и машины, оперируя со словами этого математического языка, находят пути развития математического знания и решения задач, перед наукой стоящих.
Это совсем не прямолинейный и многоуровневый процесс. Например, есть в нем и такая, в чем-то очень досадная, составляющая. Все математические книги и статьи, когда ли бы написанные на планете, представляют собой, конечно, с одной стороны, целый океан знания, а с другой — это просто капля в том настоящем море информации которым нынче располагают и манипулируют языковые модели.
Вот, предположим, прочитали мы все эти материалы и задают нам вопрос: решена уже, или ещё не решена какая-то конкретная математическая проблема. Казалось бы, что может быть проще ? Не надо вырабатывать никакого нового знания, просто сказать "да" или "нет", содержится ли данное утверждение в уже пройденном материале?
Но не все так просто. Мы же не просто ищем данное сочетание слов или понятий в литературе. Например, может быть уже решена не данная конкретная задача, а более общая. Зачастую, это совсем не очевидно что данная задача сводится, как частный случай, к чему-то более общему. Это, на самом деле, известное узкое место в процессе познания, замеченное задолго до появления больших языковых моделей.
Людям больше нравится обобщать, и это у них лучше получается. И мало кто хочет тратить время и мыслительные способности на частные случаи. Ну хорошо, раз людям нравится обобщать, но наверное и машины у людей этому быстро научатся и тогда они смогут пытаться обобщить задачу до тех пор пока она не превратится в уже решенную. Но тут есть и много других проблем, более серьезных.
Давно стало общим местом говорить, что математика едина, и что это своего рода единый организм. Это конечно так, но язык, на котором разные области математического знания говорят, очень разный. И вот может сложиться такая ситуация: в области А специалисты уже почти решили важную задачу, осталось только подобрать ключ к последнему замку. Однако специалисты в области Б, используя совершенно другие слова для описания, по сути, тех же самых понятий, давно уже знали как этот замок открывается, но понятия не имели, что это их знание полезно в области А. Приходится ждать или появления человека, который разговаривает на двух языках, или появления алгоритма, способного понять суть дела и ответить, что "да, задача решена".
Насколько облегчится жизнь профессиональных ученых когда подобные алгоритмы станут реальностью! Поиски ответов на такого рода вопросы нам будет казаться настолько же непродуктивной и архаичной составляющей работы ученого, как очинка гусиных перьев.
Возвращаясь к Practical ML Conf, я очень рад шансу снова встретиться с коллегами из Яндекса и принять участие в этом мероприятии. Помню, как меня поразил профессионализм компании в тот период, когда мы вместе работали над подготовкой международного математического конгресса в Санкт-Петербурге. Очень рад что Яндекс продолжает поддерживать и развивать математику в России на самых разных уровнях. В частности, в компании есть своя научная лаборатория Yandex Research, крупные R&D-команды и сильные исследователи.
Большие технологические компании способны инвестировать в исследования: и те, которые могут не привести к практическим решениям, и те, у которых горизонт воплощения может занимать 5–10 лет. Такой союз академии и индустрии позволяет не только создавать продукты "здесь и сейчас", но и закладывать фундамент для будущих технологических стандартов. При этом исследователи получают поддержку со стороны компаний и остаются в диалоге с мировым научным сообществом: публикуют результаты, участвуют в международных проектах, обсуждают идеи с коллегами по всему миру. Это тоже толкает развитие науки.
Какую роль математика играет в нашем понимании мира и в развитии технологий?
Хотя я всю жизнь опираюсь на компьютерные вычисления, я не считаю себя специалистом на стыке математики и компьютерных наук. Но могу сказать: роль математики здесь трояка. Во-первых, она формирует наше мышление о мире. Во-вторых, все алгоритмы, которыми живёт ИТ, сотканы из математических задач — как решённых, так и нерешённых. И наконец, решения по-настоящему сложных задач становятся проверкой и для надежности алгоритмов, и для "интеллектуальности" самих интеллектов.
Главное достоинство математики — ее точность. Она дает правильный ответ не в 51% случаев, не в 99.9% случаев, а всегда. Именно эта строгость во многом позволяет создавать технологии, на которых держится современный мир — от мобильных телефонов до квантовой физики и искусственного интеллекта. При этом крупнейшие открытия науки начинались, образно выражаясь, с небольшой щелки, небольшого просвета в "практически законченных" зданиях тогдашних воззрений. Если бы наши предки закрыли на них глаза, мы бы наверное до сих не знали учения Коперника, не говоря уже о квантовой физике или теории относительности.