Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Институт всегда объединяла математика
Андрей Шмаров: Александр Кулешов математик, академик РАН, директор института проблем передачи информации, и говорить мы будем об информации и некоторых неожиданных аспектах работы этого института.
Александр Кулешов: Математик я только по образованию, потому что вся моя жизнь прошла в инженерной среде, и, по сути, я математик, переучившийся на инженера. Мы живем в эпоху междисциплинарности. Когда я готовил выступление к 50-летию института, я прочел все первичные статьи, которые заложили основу теории информации и связи, и с удивлением понял, что 50 лет назад люди каким-то невероятным образом понимали, что информация это существенно более общая сущность, которая больше, чем «количество символов и сигналов, проходящих по каналу связи».
В живой природе существуют подобные процессы. Представьте, что у меня есть очень много сенсоров, и я их каким-то образом хочу минимизировать энергетически, а они имеют какие-то связи. Как мне найти в таком графе минимального размера подграф, у которого все бы были соседними?
Дан Медовников: Нейронная сеть.
Александр Кулешов: Нет. Я же не знаю структуры. Оказывается, что эта задача компьютерами не решается. Она неисчислимая. И вот масса алгоритмов придумана по этому поводу, но самый лучший был опубликован года полтора назад в журнале Nature и был вдохновлен биологией процессами, которые происходят в клетке. И оказалось, что этот алгоритм очень эффективен. Или другой пример: Sumsung использует сейчас метод, который разработан у нас и запатентован по контракту с ним, для ликвидации засветки экрана телефона на пляже. Для этого используется метод математический, который точно так же навеян анализами процессов, происходящих в живой природе. У нас в институте много биологии, и она очень плотно связана с математикой. Биологические идеи могут быть использованы в математике, и наоборот. Институт всегда объединяла математика.
Андрей Шмаров: А у биологов, которые у вас работают, у них свои лаборатории?
Александр Кулешов: Конечно. И не только у биологов. У нас есть лаборатория компьютерная лингвистики, она очень высокого уровня. Действительно, теория информации и математика как ее основа определяет очень много вещей и лингвистику, и биологию, но прежде всего связи. Развитие нашего института пошло очень странно, основу его создавали математики, которые выходили с мехмата и не могли себе найти работу часто из-за национальных ограничений. На этой основе была создана очень хорошая проблематическая школа. У нас институт изначально оказался мультидисциплинарным. И я очень рад, что нам удалось это сохранить. Важно то, что люди друг друга понимают.
Дан Медовников: А какой язык в основе этого понимания?
Александр Кулешов: Язык математики, разумеется. Вот, например, сейчас в мире накоплено какое-то жуткое количество снимков. Когда тебе интернет выдает вместо одного искомого ответа тысячи это все равно что ничего. Чтобы использовать такую базу данных, чтобы точнее обрабатывать снимки, нужен способ описывать картинки словами. И тут оказывается, что биологическая проблема цветового зрения непосредственно связана с обработкой изображений.
10 миллионов твитов и встревоженная собачка
Андрей Шмаров: Расскажите про социальные медиа.
Александр Кулешов: Сегодня в русскоязычном «Твиттере», «Вконтакте» 10 млн сообщений в день, они не все дают индексировать, конечно. Обрабатывают миллионов семь в день. Обрабатывать значит извлекать какую-то полезную информацию. Но стандартные методы семантического анализа на таком объеме и с этим контентом не работают. И нет уверенности, что когда-то заработают. Слишком быстро все меняется. Тут никакая лингвистика и семантика не помогут. Лингвистика строится на правилах, а сленг это отсутствие всяких правил, мы просто не успеваем за его изменениями.
Андрей Шмаров: А что за полезная информация, которую мы хотим получить из всего этого потока?
Александр Кулешов: Разную. Ну вот, например, мы все знаем, что животные чувствуют приближение стихийных бедствий. Представьте себе наводнение в Крымске. Если моя собачка плохо себя чувствует, беспокоится, жмется к двери это может говорить о чем угодно. Но когда в одном месте оказывается, что и кошечка, и собачка, и куры, и об этом в той или иной форме значительное число людей написало в «Твиттер», это уже содержательная информация. Точнее, содержательной информацией это станет только в том случае, если мы сможем вычленить ее из огромных объемов информации. Это очень сложно. Вот, например, какими параметрами можно описать человеческое лицо? Вы удивитесь, насколько мало этих параметров. Это тоже задача распознавания и вытаскивания информации из пикселей. В основе лежат математические задачи. Математические методы лежат в основе нескольких наук, связанных с информацией. Это теория информации, теория связи, биология, лингвистика.
Мы никогда не знаем, что выстрелит
Дан Медовников: Мы же понимаем, что если посмотреть любые прогнозирования, про новую технологическую волну, там, собственно, будут перечислены те же самые темы и их взаимодействие. Вы ощущаете, что ваш институт находится на пересечении самых горячих трендов? Все говорят, что новая волна будет междисциплинарной.
Александр Кулешов: Об этом не надо говорить в будущем времени мы уже живем в эпоху междисциплинарности. При этом множественные пересечения наук создают крайне сложную картину взаимосвязей. Так что практически невозможно предвидеть, какие направления какой науки будут востребованы и дадут результат. Все получается как-то неожиданно. Поэтому государство должно финансировать фундаментальную науку без четкого понимания, что выстрелит, а что нет. Выстрелить может все. Мы никогда не знаем, что выстрелит. Сейчас, например, самая охраняемая технология семантические алгоритмы.
Андрей Шмаров: Я думал одно время, что лингвистика задвинута в дальний темный угол, а оказывается, она сильно на подъеме.
Дан Медовников: Лингвистика выстрелила, потому что пошла информационная волна. Но она была готова, потому что далеко продвинулась в начале 1960-х.
Александр Кулешов: В 1960-е годы появился интерес, но в 1980-е он ушел практически в ноль. И это судьба многих новаций. В 1960-е годы в задачах распознавания было много идей, но не было технологий, которые могли бы все эти научные инновации реализовать. Были слабые машины, они не могли делать то, что в тот момент могли придумать люди. В итоге тогда все это не дало ощутимого практического результата, но оказалось крайне востребовано сегодня, когда появились практически неограниченные способы передавать, хранить и обрабатывать информацию, которая практически бесполезна без методов распознавания. После теракта в США в десяти аэропортах в Штатах поставили систему распознавания, которая должна была распознавать в толпе террористов. Ее демонтировали через полгода, потому что распознавать она ничего не смогла.
Дан Медовников: В какой ситуации мы сейчас находимся? Провал 19801990-х критичен? Но ведь были же научные публикации, научные школы?
Александр Кулешов: Я всегда говорю молодежи: читайте старые статьи, много нового найдете.
Дан Медовников: А сейчас что, c Шеннона начинать?
Природные ограничения и математические придумки
Александр Кулешов: В его статьях много полезных рассуждений, но не стоит концентрироваться на нем одном. Он первый понял, что здесь есть место точному утверждению. Потом его теорема много раз по-настоящему доказывалась.
Дан Медовников: Можете сформулировать теорему?
Александр Кулешов: На самом деле один и тот же факт, к нему подходили с разных сторон. Каким образом полоса частот, тебе отведенная, связана с тем количеством информации, которую ты через эту полосу частот можешь передать. Не важно как. Это ограничение, и есть фундаментальный закон мироздания. Спектр частот у нас никогда не прибудет, только то, что природа нам дала. Ты можешь выходить в более высокую зону, но там ты теряешь расстояние. Если взять всю информацию, которая сегодня накоплена в мире, начиная от пирамид, за 100%, то 90% будет сгенерировано в последние два года.
Андрей Шмаров: Да ладно? Я не верю.
Александр Кулешов: Но это так. Вот Бостон Брюинз взяла кубок в прошлом году. Полтора миллиона человек фотографировали и снимали. И все это где-то выложено. Представьте себе, сколько они сгенерировали информации. Но я говорю о том, что спектр ограничен, а потребностей у вас все больше и больше.
Дан Медовников: Мы еще в очень узкой полосе спектра работаем.
Александр Кулешов: Природу не обманешь, мы увеличиваем частоту, уменьшается расстояние. А наши желания растут все сильнее и сильнее. Как бы ни развивались сейчас технологии, я свой номер телефона домашний уже вряд ли вспомню, привычка пользоваться домашним номером пропала. Это означает, что мы все больше и больше уходим в беспроводную связь и коммуникации. Но природа нас ограничивает, что за этот предел мы все равно не выйдем. А дальше начинаются математические придумки. Как это использовать максимально эффективным образом?
Дан Медовников: Тут целая область есть.
Александр Кулешов: Мы об этом, собственно, и говорим. Дальше вопрос, как мы сумеем наиболее разумным способом распорядиться тем ресурсом, который у нас есть, а это уже математика.
Дан Медовников: Но математика не работает со смыслом, содержанием сообщений. Может, начать работать со смыслом?
Александр Кулешов: Мы как раз об этом и говорили. Анализ социальных медиа это попытка извлечь информацию математическим путем. Я вижу только нули и единички, но я вижу, что это одно, а это другое. Я не знаю, что это, но знаю, что это разное.
Дан Медовников: А где появляется смысл, если там только нули и единички?
Александр Кулешов: Подождите. Я понимаю, что произошло некое изменение. Я анализирую, например, большое количество твитов и вижу, что что-то произошло.
Дан Медовников: Это математика может сделать. А что именно пошло не так? Это может математика сделать?
Александр Кулешов: Это зависит от того, что ты ищешь. Для того чтобы включить математический аппарат, должны прийти специалисты, которые напишут правильные энграммы комбинации слов, которые знаковые для этой задачи. В примере со стихийными бедствиями, например, «собачки», «кошечки». Когда они написаны, я могу уже их превращать в вероятности и т. д. Их должны написать специалисты гуманитарной области. А дальше в действие вступает математический аппарат, который превращает их в некие процессы. Они анализируются и показывают процесс и вектор изменения. Если изменилось, то где, в какой локации. Это уже тот механизм, с которым вручную справиться невозможно, могут справиться только мощные математические алгоритмы.
http://page42.ru/events/1707-kak-peredat-informatsiyu-.xl