Адрес: https://polit.ru/article/2012/11/09/ostrovki-nauki-rbk/


09 ноября 2012, 10:08

Островки науки в России

Прыжок в будущее

Мы публикуем материалы экспертного семинара ОАО «РВК», состоявшегося 18 октября 2012г. в центре «Цифровой Октябрь». На семинаре было представлен доклад о структуре живых участков российской науки. Докладчики – члены рабочей группы проекта "Корпус экспертовдоктор физико-математических наук, заместитель директора Института теоретической физики им. Л.Д.Ландау РАН, заведующий кафедрой Московского физико-технического института (МФТИ), Михаил Викторович Фейгельман и доктор химических наук, профессор химического факультета МГУ, Галина Александровна Цирлина. Ведущий семинара — один из крупнейших российских специалистов в области технологического бизнеса и стратегического управления современными компаниями, генеральный директор ОАО «РВК» Игорь Рубенович Агамирзян. Семинар продолжил цикл экспертных семинаров, посвященных проблемам венчурного технологического бизнеса, инновационной экономики и организации научки и технологической среды.

Игорь Агамирзян: Мне очень приятно видеть какая аудитория собралась сегодня на наш очередной экспертный семинар. Семинары проходят реже, чем мне и нам хотелось бы. Тем не менее, каждый раз оказываются достаточно интересными и дают почву для обсуждений и раздумий. Надеюсь, что сегодня у нас будет возможность послушать интереснейший доклад и потом обсудить состояние современной российской науки. То, о чем сегодня будет рассказано, чрезвычайно интересно: это отчет об огромной работе, которая была проделана в рамках проекта «Корпус экспертов», такого важного и полезного в нашем нынешнем положении. На мой взгляд, те, кто здесь присутствует, имеют достаточно хорошее понимание того, что сейчас происходит в российской науке. Но то, что нам сегодня расскажут, подводит итоги и дает системный взгляд на это. Без понимания ситуации очень трудно планировать, что и как делать. Мы пригласили на семинар представителей Минобрнауки. Если их нет, это не очень страшно, может быть, они еще к нам присоединятся. Так что предоставляю слово докладчику.

Михаил Фейгельман: Здравствуйте! Мы разделили единый доклад на две части, так что общее введение в то, как строился этот проект, сделаю я, а затем передам слово Галине Александровне, которая продолжит изложение более конкретного материала, полученного за последнее время.

О чем идет речь? Откуда взялся упомянутый в вводном слове проект «Корпус экспертов», результаты которого мы сегодня детально рассмотрим? Он возник из того, что некоторое количество научных работников лет пять назад поняло довольно простую вещь: нас осталось мало и нам необходимо самоорганизоваться, чтобы иметь, по крайней мере, более-менее регулярную среду, в которой можно найти специалистов, действительно знающих толк в своих конкретных научных разделах. В принципе хотелось, чтобы существовали, как и раньше, некоторые обширные коллегии ученых, которые справлялись бы с этой ролью. Такой была Академия Наук, но де-факто она этим механизмом не служит или служит, но неэффективно. С другой стороны, мы исходим из соображения о том, что научные результаты получают отдельные люди или небольшие коллективы. Без участия собственно конкретных научных работников ничего осмысленного сделано быть не может. Полностью автоматизированным образом выяснить, как именно устроена научная среда в России, и сделать на основании этого содержательный вывод невозможно. Другое дело, что обойтись без этих данных невозможно тоже. Иначе говоря, идея этого проекта состояла в том, чтобы, с одной стороны, использовать объективные данные по активности ученых в области публикаций, а также оценки этих публикаций другими учеными (например, цитирование). С другой стороны, применить потенциал экспертных оценок – сделать синтез того и другого. Это реалистический подход к тому, чтобы понять, как устроена научная среда вокруг нас.

Постановка задачи и основные тезисы, из которых мы исходили, представлены здесь. В действительности то, что мы сейчас имеем, – это отдельные более или менее крупные островки или агломерации научной активности, которые нужно выявлять на фоне очень большого количества людей, формально называющихся научными работниками. Априори неизвестно - кто из них действительно получал за последние годы значимые научные результаты, а кто этого вообще не делает. Выяснить, где же на самом деле сейчас находится действующая наука, кто на самом деле может выступать сегодня в качестве экспертов в своей области – это и была задача проекта. Хочу заметить, что два упомянутых множества совершенно не тождественны. Бывают специалисты, которые дают очень хорошие научные результаты, но по тем или иным причинам не считаются среди коллег экспертами, а бывает и наоборот.

Здесь показано, кто работал над этим проектом. Помимо рабочей группы и постоянных технических специалистов, которые перечислены, были и еще участники. Мы неоднократно обращались к коллегам из различных научных областей за консультациями. Проект начался пять лет назад при очень небольшой поддержке тогда еще существовавшего РАО ЕЭС, затем он был поддержан фондом «Династия», и в последний год существует частично на грант «Династии», а частично по контракту с «Российской Венчурной компанией».

В чем заключалась наша задача? Найти способ сформировать множество научных экспертов, одновременно выяснив, по каким именно научным направлениям они являются экспертами. Например, с нашей точки зрения, эксперт в области физики – это плохое наименование, физика – слишком широкая наука. Нужно более подробное деление. В других науках, естественно, все так же.

К тому времени получили достаточное распространение результаты проекта по исчислению индекса цитирования российских ученых, начатого Борисом Штерном. Этот проект содержал в себе немало данных о специалистах, суммарное цитирование работ которых превышало тысячу (за все годы) или сотню («активное» цитирование - ссылки на работы, опубликованные за последние семь лет). Пороги были выбраны более-менее произвольно, интуитивно, но оказались более-менее адекватными. Мы решили, что люди, входящие в такие списки цитируемых, вместе представляют собой массив исходных рекомендателей, у которых мы будем спрашивать, кого они считают надежными экспертами в их научной области.

Естественно, мы начали с того, с чего начать нам было проще – с физики твердого тела и близких вопросов. Всем специалистам в этой области, которых мы нашли в списках Штерна, мы послали письма с просьбой назвать 10-15 экспертов в своей научной области – по возможности уточнив, в какой именно научной области. Мы создали классификатор научных областей, а конкретно для физики использовали классификатор Американского физического общества, упростив его в необходимых пределах. Мы получили ответы примерно от трети опрошенных. Неоднократно названные в письмах люди также включались в опрос, и, в конечном счете, была произвольно выбрана цифра «пять». Если человека называли экспертом пять или более коллег, то он вносился в список предлагаемых членов экспертного корпуса. Всем таким людям посылали письмо с сообщением, что их имена называли пять или более раз, и с вопросом, согласны ли они, чтобы их включили в публично объявляемый список экспертов. Те, кто согласился, попали в этот список.

Таким образом, была использована комбинация формального и рекомендательного принципов. Сугубо формальные показатели цитирования научных статей использовались для отбора исходного множества выборщиков, а из них в результате опроса возникала коллегия, которую мы стали считать возможными экспертами. Для извлечения этих данных мы использовали базу Web of Science, которая поддерживается компанией Thomson Reuters.

Здесь представлены основные этапы проекта. После завершения опроса по физике конденсированного состояния в начале 2008 года, когда мы впервые провели алгоритмическую процедуру по фиксированным правилам, было интересно как воспринимаются результаты, соответствует ли выбранный массив представлениям достаточно большого количества коллег, работающих в исследованной области. Оказалось, что да. Около 90% выбранных ученых, по мнению тех, кому показывали весь список на сайте, оказались вполне подходящими на роль экспертов. Далее (это была уже середина 2008 года) мы продолжили опросы в других областях физики. Потом перешли уже к другим наукам, в частности, к биологии. Здесь также указано применение экспертного корпуса для решения конкретных задач. Надо сказать, что в начале этого проекта меня неоднократно спрашивали, зачем мы все это затеваем, кто этим будет пользоваться. Ясно, что на старте не было никакого ответа, кроме единственного: если никто это не сделает, никто этим пользоваться не будет. Этот механизм явно необходим для любой осмысленной .деятельности по исследованию и организации научной среды.

Будущее постепенно показало, что этот механизм используют. В определенный момент мы заключили договор с компанией Thomson Reuters о возможности открыто публиковать результаты обработки данных WoS. Далее проходили опросы по химии и наукам о материалах, по наукам о Земле. Опрос по физике конденсированного состояния был достаточно простым: ею занималось много людей, и все друг друга знали. Ученые из других разделов физики гораздо менее многочисленны, или у них другие привычки социального взаимодействия. Оказалось, что по многим разделам трудно получить заметное количество экспертов, используя единый подход. Это означало, что нужно уточнять аудиторию, сужать специализацию, заполняя таким образом возникающие дыры. Требовалась гораздо более тонкая работа. К ней мы пришли в последние пару лет.

Кроме того, время от времени необходимо повторять эти опросы, потому что по прошествии нескольких лет возникают новые люди, более молодые ученые, которые постепенно по своим результатам работы и индексу цитирования тоже входят в число опрашиваемых. Параллельно происходила и прикладная работа: например, в прошлом году отдел образовательных программ РосНАНО попросил нас изучить различные варианты программ по NANOscience, имеющиеся на территории РФ. Эта работа была проведена и дала очень много результатов, которые сейчас находятся в отдельной базе данных. Мы очень надеемся сделать ее открытой.

Что надо сказать по поводу «Корпуса»? Нашей первой задачей было сгенерировать списки экспертов, достаточно точно указав их квалификацию и специализацию в науке. Это необходимое, но не достаточное условие для того, чтобы проводить нормальную, надежную экспертизу, потому что вторая обязательная деталь – иметь достаточно четкий регламент проведения таких экспертиз. Опыт сочинения регламентов у нас тоже появился. В частности, мы написали регламент для венчурного фонда «Сколково –Нанотех».

Теперь можно перейти к более конкретным результатам. Имеется достаточно обширная база, в которой люди собраны по двум признакам: (1) цитирование работ выше определенного порога (массив рекомендателей) и (2) рекомендации, полученные от коллег.

Дальше мы будем использовать весь массив (1)+(2). Всего в базе больше 8000 человек, из них работающих постоянно в России – около 5000. Только к группе (1) относятся 1830 человек – это цитируемые, но никем пока не рекомендованные специалисты. Только к группе (2) – 1326 человек, которые имеют цитирование ниже условных порогов, но их рекомендовали коллеги. Остальные 1802 человека – это цитируемые и одновременно кем-то рекомендованные специалисты, пересечение множеств. Для 62% людей во всем массиве основное место работы – институты Академии наук, для 25% - вузы. Остальные работают в организациях других ведомств. Надо сказать, что разделение по ведомствам во многих случаях достаточно условно. Очень часто бывает, что человек работает и в Академии наук, и в вузе. В особенности сильное смешение существует в НГУ и в МФТИ.

Для практического использования этих сведений важно понимать, в какой именно области человек работает. Для этого нужно использовать системы классификации научной деятельности, которые отвечают текущей реальности. Такие системы классификации пришлось делать прямо в ходе этого проекта, используя в качестве консультантов людей из соответствующих научных областей.

Вот крупная классификация по базе Корпуса экспертов. Физика – 2418 человек, астрономия – 347, химия и науки о материалах – 1299, биология – 976, науки о Земле – 491, математика – 92. По математике мы не проводили опросов: не нашлось энтузиастов-консультантов. Ученые из математического сообщества считают, что и так неплохо понимают кто у них эксперты. Они не чувствовали острой необходимости в проекте.

Мы использовали более тонкое деление специальностей, некоторые из них здесь указаны справа. Уровни деления научных областей мы в основном взяли из глобального архива препринтов по естественным наукам: прикладная физика, физика конденсированного состояния, атомная физика, плазма, нелинейная динамика, физика высоких энергий и так далее. На этом слайде показано, в каких областях работают представленные в базе специалисты из институтов разных отделений Российской академии наук. Кстати, я забыл сказать, что все данные, которые использованы в этом проекте, взяты из открытых источников. В отделение физических наук –специалисты по разным разделам именно физики, в разных институтах. В отделении математических наук – специалисты по математике, компьютерным и другим самым разнообразным наукам. Отделение нанотехнологий и информационных технологий – здесь вообще встречаются любые специалисты. Отделение энергетики, машиностроения и механики – компьютерные и технические науки, прикладная физика.

Степень представительности созданной базы проще всего анализировать по институтам Академии, поскольку здесь больше данных в открытом доступе. Всего естественнонаучных и математических институтов РАН – 220, согласно данным на сайте Академии. В базе у нас есть научные сотрудники, так или иначе распределенные по 192 из этих институтов. Технические науки и информационные технологии – всего 82 института, в базе представители 57. 127 гуманитарных учреждений, в базе представлены сотрудники 9 из этих учреждений. Вузов всего а России 2642, в базе корпуса представлены сотрудники всего 159 из них.

Какой из этого всего можно сделать вывод? Массив состоит примерно из 5000 работающих в России ученых. Он, конечно, не полон, но вряд ли он может быть существенно дополнен. Он еще не включает некоторые узкие научные направления, по которым было трудно получить результаты с помощью исходного метода, но этот массив вполне репрезентативен. Он включает научных работников, результаты чьей деятельности заметны коллегам. Это именно те люди, чью работу можно исследовать при обсуждении положения науки и того, какими методами можно ее оживить.

Вот теперь, пожалуй, мы перейдем к более подробному изложению полученных результатов. Я передаю слово Галине Александровне.

Галина Цирлина: Продолжая этот рассказ, я хочу сразу пояснить, что картинки, на которых сопоставляются «формальные показатели» членов и членов-корреспондентов Академии наук, с аналогичными показателями людей, не имеющих этих званий, ни в коем случае не направлены на то, чтобы заниматься разборками с Академией наук. Просто страна привыкла, что вся наука ассоциируется с Академией. Чтобы «раскопать» более глубоко лежащий массив специалистов, нужно сравнивать с ней и понять, есть ли еще компетентные люди. В нашем массиве, разумеется, есть и академики, и члены- корреспонденты – по признаку цитирования около половины, получивших рекомендации коллег – почти треть от всего состава академического клуба. Но они составляют малую часть массива.

Если мы будем делать, как Министерство науки, и сравнивать по формальным показателям цитирования, мы увидим, что распределение цитирования среди членов Академии – синие столбики - отклоняется в сторону существенно меньших значений (по этой оси отложено «активное» цитирование в логарифмической шкале). Это происходит со многими отделениями: вот геологи, вот биологи. А это отделение химии и наук о материалах, здесь разница немного меньше заметна. Желтые столбики – это сотрудники институтов РАН, приписанных к данному отделению, из нашего массива. А зеленые столбики – все специалисты из этого массива, чьи специализации близки к специализации отделения, это в скобках указано. Как будет видно, желтые и зеленые столбики ведут себя качественно одинаково.

Нам пришлось, вопреки законам математики, нанести на логарифмическую шкалу ноль, сделав на ней разрыв. Дело в том, что в составе этой выборки имеются люди с нулевым активным цитированием, то есть их работы, опубликованные в последние семь лет, не цитировались никем ни разу. И эти нули хорошо заметны как раз для членов Академии. Понятно, что среди академиков есть очень немолодые люди, и они недостаточно активны сейчас, поэтому нулевое активное цитирование в данном случае не является чем-то «криминальным».

Что интересно, нам много раз говорили, будто существует некий административный ресурс, что члены Академии становятся соавторами работ других людей и за счет этого повышают свое цитирование. Возможно, этот феномен есть, мы его не исследуем. Но вы видите, что он, даже если и есть, не спасает ситуацию.

В различных отделениях, конечно, мы наблюдаем совершенно разную картину. Например, в случае отделения физических наук распределения среди членов-корреспондентов и академиков и среди более широкой массы научного населения оказываются очень похожими. Если отдельно посмотреть на две секции этого отделения, то есть небольшие различия. В секции общей физики и астрономии распределения наиболее похожие.

Но есть другие отделения, которые по структуре таких диаграмм существенно отличаются. Вот это академическая «инновация» – отделение нанотехнологий и информационных технологий, а это отделение энергетики и машиностроения. В последнем случае много людей из инженерных наук, и они вообще не печатают статей. А в первом случае нам ситуация менее понятна, но мы видим, что столбик нулевого цитирования после разрыва особенно заметен. Довольно сильное смещение распределения «академического» цитирования в нижнюю сторону видно и в отделении математики. Я неоднократно видела в сети публикации крупных математиков о том, что действительно у них есть очень большой ресурс глубоко уважаемых и цитируемых людей, которые почему-то не попадают в Академию.

Полное цитирование – более серьезный показатель, потому что он характеризует работу человека за всю жизнь. Здесь у членов Академии наук могло бы быть дополнительное преимущество перед нашим массивом, потому что в среднем они существенно старше. У нас даже есть данные по возрастному распределению. Тем не менее, в некоторых отделениях это «академическое» распределение все равно смещено в сторону более низких значений. Здесь нули уже встречаются крайне редко, но все равно бывают – например, у металлургов. Мы впервые замечаем ситуации, когда распределения цитирования академиков смещаются в сторону больших значений, чем для всего анализируемого массива. Таким образом, в естественнонаучных отделениях РАН есть выдающиеся люди с очень высоким цитированием, которые составляют правую часть распределения.

Такая же картина наблюдается с распределением для физических наук, с еще более заметными отличиями. Хочу специально отметить, что секция физики высоких энергий и ядерной физики весьма специфична: в этих областях иногда работают коллаборации, в которые входят сотни и тысячи человек. Там довольно сложно нормировать цитирование, я потом подробнее об этом скажу. Так или иначе, в этой секции показатели самые большие, а распределение в нашем массиве более-менее похоже на распределение для академиков. А в секции общей физики и астрономии – явный сдвиг «академического» распределения вправо.

Теперь два самых проблемных отделения. Здесь, как вы видите, опять появляются нули, несмотря на то, что это показатели цитирования за всю жизнь. Очень хорошо заметно, что «рядовые» сотрудники институтов, относящихся к этому отделению, составляют правый край такого распределения. Понятно, что здесь мы не могли рисовать зеленые столбики – только желтые, потому что не вполне понятно к каким областям знаний можно отнести нанотехнологии и информационные технологии. Аналогичное смещение распределения, только в меньшей степени, видно и в математике.

Теперь насчет того, как все это распределено географически. Иногда, когда говорят, что Министерство собирается строить карту науки, ее понимают именно как географическое распределение. Да, географию тоже надо понимать – например, потому, что если мы организуем образовательные процессы с участием активных и результативных работников науки, то совершенно не все равно, где эти люди территориально расположены. Здесь синее поле – это Москва, и конечно на глаз видно, что везде она доминирует, но в разной степени. Наиболее однородно распределение в некоторых разделах физики: московский сектор составляет 40 или даже 30%, а также активны Сибирь, Урал и северо-западные регионы, «привязанные» к Петербургу. Оранжевые сектора – вклад Московской области, он особенно велик в физике высоких энергий. (Дубна, Протвино, Троицк). В молекулярной биологии Москва составляет около 65% массива. Я напомню: это не элитный массив, а всего лишь люди, которые заметны по тем или иным признакам, по публикациям или рекомендациям. Интересно сравнить с тем, как распределен кадровый ресурс, какую долю от реально работающих людей это составляет в разных регионах. Тут мы встретились с проблемой. Наш принцип – использовать только открытые источники – не позволил нам узнать штатного состава довольно многих научных организаций. В частности, когда речь идет о ведомственных и отраслевых научных организациях, такую информацию можно взять в лучшем случае с сайтов институтов. Иногда приходилось определять научный штат буквально по телефонным справочникам, опубликованным на сайтах, и другими трудозатратными способами. Что касается институтов РАН, для них есть самосогласованная информация 2008 года в едином списке, но только для «центральных» институтов. А для институтов региональных отделений такой обобщенной информации нет. Собрав информацию о численности научного штата из всех возможных источников, мы получили по разным отделениям информацию разной степени полноты и нарисовали диаграммы вот так.

Например, отделение физических наук. Мы знаем численность 37 институтов из 43, только научный штат. Если в каком-то секторе региона стоит плюс, это значит, что среди тех шести институтов, для которых мы не знаем численности, есть институт данного региона. Если бы добыть полные данные о научном штате, эти оранжевый, серый и желтый сектора могли бы немного увеличиться, а остальные, соответственно, сжаться.

Самое открытое отделение – отделение биологических наук. Там удалось найти численность научного штата для 53 из 55 институтов. Вы, наверное, видите, что здесь нет такого доминирования Москвы, как на предыдущей схеме распределения результативных людей.

В отделении нанотехнологий фантастическая картина: здесь, видимо, практически все сосредоточено в Москве, но по этой области представлена в открытом доступе наименее полная информация. Это самое засекреченное отделение Академии наук. Добавлю, что мы не рассматривали отделение физиологии и фундаментальной медицины, потому что оно очень сильно сдвинуто в сторону Медицинской Академии, и там другие традиции публикаций. Но часть людей из институтов Медицинской Академии вошли в наш список в составе биологов.

Дальше мы будем говорить об условной карте науки, или, как мы ее ранее назвали в публикации, карте полезных ископаемых на территории российской науки. Мы будем говорить о том, как дополнить этот массив с учетом специфики определенных направлений и минимизировать вред от неизбежного использования формальных показателей. Для этого, к сожалению, надо вникнуть в многочисленные цифры, которые будут на следующих слайдах, а пока я дам к ним комментарии. Индексы цитирования, которые берутся из базы Web of Science, бывают низкими потому что люди работают в очень узких и замкнутых областях. Они бывают низкими также потому, что традиционные журналы и сборники не реферируются в Web of Science и аналогичных базах. Это касается, в частности, математики, «компьютерных» наук, показатели по которым мы вряд ли сможем полностью уточнить. Это означает, что исходные пороги наших рекомендателей для каких-то областей должны быть понижены. Но как именно – это требует исследования.

Есть и другая сторона вопроса. Показатели цитирования бывают высокими, потому что тематика очень модная. Потом выясняется, что это мыльный пузырь. Таким образом, надо очень осторожно относиться к этим показателям. К тому же надо знать, в каком формате их сопоставлять, потому что, например, бывают очень большие коллаборации, которые проводят эксперименты на очень сложных установках – в научной среде такие огромные авторские коллективы иногда называют «братские могилы». В коллаборациях есть сколько-то ключевых авторов, а есть технический персонал. Сейчас подобные схемы коллаборационных исследований начали появляться в меньшем масштабе в молекулярной биологии, в науке о материалах, они всегда были в ядерной физике и физике высоких энергий. Возникает вопрос о том, что формальные показатели цитирования должны быть для больших коллективов еще каким-то образом нормированы.

Я не буду утомлять вас подробностями, но покажу один пример. Не надо пытаться сразу изучить всю эту таблицу. По каждому из разделов естественных наук мы посчитали среднее цитирование в нашем массиве, полное и активное. В одном случае взяли только выборку рекомендателей, во втором случае, для сравнения, взяли полную выборку по разделу, куда входят люди уважаемые, рекомендованные, но не переходящие условный порог цитирования. И это ни в коем случае нельзя рассматривать как средний показатель по данному разделу. Это средний показатель по нашему массиву. Это нельзя рассматривать как планку: если у человека цитирование ниже порога, это не значит, что он плохой специалист. Но видно, что когда мы добавляем группу рекомендованных, имеющих не слишком высокое цитирование, снижение происходит не более, чем в полтора раза.

То есть происходит некое снижение, но не радикальное. И для разных разделов физики показатели различаются максимум раза в полтора. Здесь, где много экспериментальных коллабораций, безусловно, сравнение надо проводить по-другому. И мы специально привели здесь справа цитирование, нормированное на число авторов. Это не сумма цитирования, деленная на какое-то среднее число авторов. Для каждой статьи мы поделили число цитирований на число авторов, а потом просуммировали результаты. Различие между ядерной физикой и физикой высоких энергий довольно заметно, почти в полтора раза.

Тут хорошо видно, что есть науки, в которых всегда меньше авторов - не требуется там много авторов. Поэтому у них показатели без нормирования пониже, а нормированные повыше.

Эти данные можно использовать, чтобы снизить стартовые пороги цитирования. Например, в разделах «нелинейная динамика и хаотические явления», «физика плазмы», потому что там много прикладников. Что касается химии, мы пока заявляем надежные цифры только по синтетической химии, потому что в части физической химии и химической физики еще далеко до завершения опросов.

Очень важны результаты этого анализа по биологии. Сейчас в корпусе экспертов выбраны только молекулярные биологии, активные и высокоцитируемые люди. А есть еще ботаники, зоологи, генетики, физиологи. И вот тут различие, безусловно, очень существенное, особенно в организменной биологии: показатели различаются как минимум в два раза. Хотя различие немного снижается, если цитирование, допустим, нормировать. У молекулярных биологов большие коллективы, а у некоторых других биологов довольно маленькие, может в статье быть даже один автор. Поэтому эти разделы биологии – первые, для которых мы надеемся понизить порог и расширить массив.

Аналогичная ситуация с науками о Земле: явно более низкие формальные показатели. И то, что мы проводили сейчас опрос по наукам о Земле с начальным порогом как для других наук, должно быть скорректировано.

Вот цифры для астрономов – у них самый высокий процент ответов на анкеты. Они собрались и организованно провели дополнительные опросы по пропущенным «низкоцитируемым» направлениям. А сейчас они первыми провели разбор накопившегося массива ключевых основ, чтобы уточнить классификацию. Константин Александрович Постнов, наш консультант по астрономии, который, к сожалению, сейчас в командировке, очень много занимался этим вопросом.

Но даже если мы понизим пороги, дополнительно наберем в корпус экспертов ботаников, зоологов и других специалистов в «низкоцитируемых» областях, мы не решим всех проблем. Потому что структура каждого из этих разделов все равно очень сложная, и в ней есть совсем узкие пропущенные области.

Здесь нарисован третий уровень нашей классификации, коды классификатора по наукам о Земле. Этих кодов несколько десятков. Столбиками показано количество людей, которые есть в базе, а также приславших анкеты и получивших рекомендации. Вы видите, что здесь везде, в одних и тех же местах, то есть на входе и на выходе опросов, имеются одинаковые провалы. Есть области, в которых действительно настолько мало специалистов, что даже нет смысла проводить опросы и выявлять статистику. И здесь есть только два пути. Просить специалистов родственных направлений - тех, кто знает ситуацию в некотором приближении – или, если у нас в стране отсутствуют такие специалисты, а в мире они есть, тогда можно, например, посылать анкеты для начала представителям диаспоры.

В каждой из больших областей знания, в каждом из крупных разделов есть минимум по 3-5 таких провалов. Сейчас мы все их уже знаем, но далеко не о каждом понимаем, что можно с ним сделать.

Это - рассказ про общую ситуацию с точки зрения формальных показателей, про перспективы дополнить информацию. Ну, а ту информацию, которая у нас есть на сегодняшний день, мы используем, чтобы выяснить, в каких организациях находятся активно работающие научные коллективы.

И это нужно пояснить двумя слайдами про числитель и знаменатель. Сначала про числитель. Вы сейчас увидите большие таблицы. Там будут колонки, в которых указано число сотрудников данной организации с цитированием выше порогового, число сотрудников с цитированием ниже порога, но рекомендованных хотя бы кем-то, а далее – число сотрудников, рекомендованных не менее трех раз. Это важно, потому что бывают, конечно, случайные и субъективные рекомендации. Для того чтобы говорить о более серьезном массиве, нужно основываться на нескольких рекомендациях. Числитель – суммарное количество людей с первым, вторым и обоими признаками одновременно. Как его нормировать, что ставить в знаменатель?

Численность научного штата институтов Академии наук взята из единого источника. Найти такие данные по вузам – ужасная проблема, потому что на сайте Минобразования указана суммарная численность, например, докторов и кандидатов по всем факультетам данного университета. Вытащить отдельные факультеты очень трудно, а науки живут именно на факультетах. На сегодняшний день мы смогли разделить по факультетам только три крупных вуза: МГУ, СПбГУ и Южный федеральный университет. Для остальных нормировать фактически бесполезно.

Вот сравнение для некой «топ-группы». Здесь - научный штат, а здесь – вместе с техническим персоналом, для нормирования использовали первый. Мы посчитали, какова доля цитируемых и/или трижды рекомендованных в научном штате институтов. Дальше институты расположили в порядке уменьшения этой доли, и пока взяли первые 50 из получившегося списка. Больше всего оказалось в этой группе физических институтов. Здесь все институты академические, формально кроме двух, а на самом деле – кроме одного. Исключения составили ИТЭФ – это не академический институт, а также Санкт-Петербургский институт ядерной физики им. Константинова в Гатчине, который еще совсем недавно был академическим. Никаких других неакадемических институтов в этой топ-группе не обнаружено.

Можно сравнить эти институты, соответствующие физические факультеты крупных вузов и вузы чисто физического профиля. Здесь, на слайде, очень хорошая иллюстрация того, как лукавы бывают цифры. Понятно, что во многих вузах работают сотрудники РАН и других учреждений. Они иногда упоминают в своих статьях о вузовском месте работы, а иногда нет. Принцип такой: указываешь место работы – оно отмечается в базе, не указываешь – не отмечается. И сейчас много людей из Академии очень хотят, чтобы в базе были данные об их работе в вузах. Уже появились люди, которые присылают нам оттиски свежих статей с указанием университета, чтобы мы срочно это внесли в базу.

Пока ситуация такая. Московский физико-технический институт, который всегда лидирует с точки зрения рейтинга выпускников, попадает, например, в самый конец этого списка, после всех физфаков крупных университетов. И это при том, что все академические институты топ-группы – базовые организации Физтеха! Сотрудники этих институтов работают на Физтехе, но при подобном формальном анализе они не могут быть учтены. Цифры лукавые, так делать нельзя.

Есть и другой перекос. Видите, вверху Международный учебно-научный лазерный центр МГУ им. Ломоносова. В нем, согласно официальному сайту МГУ, работает 10 человек. Они публикуют много работ вместе с сотрудниками, например, физического факультета МГУ, у них получается в некотором роде рекордный показатель среди вузовских структур. Совершенно понятно, что его так прямолинейно рассматривать нельзя. А вот здесь более-менее можно, и видно, что, например питерский физфак оказывается на уровне средней части топ-группы академических институтов. Остальные более массовые организации примерно соответствуют нижней части приведенной на предыдущем слайде таблицы академических институтов, а вот МИФИ находится по этому показателю еще ниже. Надо понимать, что точность этих цифр – около 10% в однородной выборке и около 20% в неоднородной, то есть там, где данные о численности сотрудников взяты из разнородных источников.

Вот слайд, который иллюстрирует ситуацию с химией и науками о материалах – институты и вузы. Похоже, что чем организация малочисленней, тем выше, как правило, у нее показатели. Может быть, работу малого института в принципе проще четко организовать. Здесь довольно известная группа академических институтов, а институтов других ведомств просто нет. Опять лукавые цифры: если формально посчитать рейтинг совсем маленького факультета наук о материалах МГУ, он получается выше, чем у всех академических институтов. Это точно такая же история, как с лазерным центром. Этот факультет работает в тесном сотрудничестве с одной из крупных кафедр химического факультета, с физическим факультетом, вклад в публикации вносят разные сотрудники МГУ.

Дальше вы видите, что питерский химфак находится примерно в середине этой топ-группы, московский смещен ниже, а в конце Южный федеральный университет. Жаль, что мы не смогли нигде найти открытые данные о научном штате НИИ физической и органической химии ЮФУ – это достаточно малочисленная организация, и если бы эта цифра была, то здесь был бы, скорее всего, довольно высокий показатель.

О других науках расскажу менее подробно. С астрономами вообще редкая ситуация, говорят, что их всего около 800 человек на всю страну. У них есть крупные организации, обсерватории и Институт астрономии РАН – это все академические структуры, которые попадают в тот самый «топ-список» 50 институтов. И с ними вполне сопоставим университетский институт им. Штейнберга, а вот с питерскими университетскими астрономами мы не можем провести сравнение, потому что они перемешаны с математиками на матмехе СПбГУ.

В случае с науками о Земле уровень цитирования заметно ниже, чем в других естественных науках. Поэтому, конечно, мы их пока недооцениваем, идя по пути такого первичного сравнительного анализа. У них в списке первых 50 есть пять академических институтов, в основном расположенных в сибирском отделении, плюс знаменитый Палеонтологический институт. К ним «подтягивается» геологический факультет СПбГУ.

По биологии среди 50 - только академические структуры, в значительной степени московские. На очень хорошей позиции, почти вверху этого списка находится Институт физико-химической биологии имени Белозерского в составе Московского университета.

Про математику, как всегда, ничего не можем определенно сказать. Два отделения Математического института имени Стеклова, Институт вычислительной математики РАН, питерский Институт проблем машиноведения. Они попадают в упомянутую группу из 50 институтов, но вполне возможно, что есть и другие такие.

Вполне очевидно, что внутри крупных институтов есть разные научные коллективы, занятые разными делами. Они могут быть одиночными островками, а вовсе не архипелагами. Для того чтобы решить, где искать проекты, где искать людей для осуществления образовательных программ, нужно пойти дальше, разобраться с конкретными научными коллективами, с тем, где они находятся. Для этого нужно проводить анализ уже не по областям знания, а по разделам этих областей. На сегодняшний день мы считаем возможным провести такой детальный анализ в области физики.

Покажем два примера, наиболее показательных благодаря тому, что нашлись активные консультанты и провели аккуратную классификацию внутри разделов. Это атомная физика и физика конденсированных сред. Все разделы физики обитают примерно в 50 городах и наукоградах. В тех областях физики, которые мы здесь обсуждаем, число этих научных центров несколько меньше.

Дальше наш анализ будет устроен так. В таблицах – таких, как показана для примера на этом слайде - при нажатии на цифру (число людей – цитируемых или рекомендованных три и более раз) должно быть видно, из каких эти люди институтов, и сколько в каждом институте таких людей. Например, в Черноголовке по части cond-mat это три института: Институт физики твердого тела, Институт теоретической физики и Институт проблем и технологий микроэлектроники. Это, конечно, очень большая цифра для маленького наукограда; ясно, что это серьезный остров, всего в три раза отличающийся от всей Москвы целиком. Конечно, есть существенный архипелаг в Новосибирске, можно назвать отдельные институты. Есть архипелаги в Екатеринбурге и в Нижнем Новгороде. Далее единичные институты в разных городах. Та карта полезных ископаемых, которую мы собираемся создать, будет включать списки активных групп с очень подробным описанием их специализации и потенциальных возможностей.

Дальше атомная физика – область с совсем иными традициями, которая зародилась в значительной степени в вузах. И сейчас она развивается в вузах, в частности из-за того, что некоторые вещи можно сделать на довольно простом инструментальном уровне. Например, остров этой науки существует в Воронеже, он взаимодействует с питерским архипелагом, но географически он изолирован. Есть острова в Новосибирске – в тех же институтах, где и физика конденсированного состояния. Это разные острова из разных архипелагов.

Это мы вам показываем, как мы видим дальнейший путь проекта с точки зрения использования его результатов в неформальной аналитической работе. Насколько мы понимаем постановку задачи со стороны, например, Российской венчурной компании, которая привлекла нас к такой аналитике, нам нужно создать именно списки результативных людей и групп. Дальше, конечно, бизнес должен понимать, что наши специалисты – не те, которые вынут из кармана готовый проект, и он через три года будет выведен на уровень производства. Надо отдавать себе в этом отчет. Это те, кто потенциально могут сделать высокотехнологичные разработки, если мы хотим, чтобы таковые вообще когда-нибудь возникли в этой стране.

Это наш финальный слайд, предварительное заключение. Я не буду читать все выводы, скажу только, что мы апробировали некоторый подход (принцип выбора людей по науко-метрическим показателям и путем экспертной оценки), показали примеры того, как этот подход может быть использован для построения разного рода карт, и на своей шкуре испытали все проблемы, которые возникают при корректном извлечении информации из баз данных. У нас за это время сложилась богатая внутренняя жизнь, состоящая из многочисленных анекдотов, например, про сорок пять Ивановых, у которых, как правило, одинаковые инициалы если они работаю в одной и той же области, и их публикации особенно трудно разделить. Это универсальный закон: все Ивановы с одним типом инициалов – геологи, с другим – физики, так уж получилось. Есть масса примеров однофамильцев-родственников с одинаковыми именами и отчествами, работающих всю жизнь в одном и том же институте. Они сами порой плохо понимают, какие работы чьи. Мы вступаем с ними в переписку, разбираемся вместе. И мы приходим в ужас оттого, что люди, которые не знают структуры научных публикаций, их специфики, берутся методом формального нажатия кнопок в базе Web of Science или в какой-то другой определять наукометрические показатели. Это серьезная и большая работа, потому что у всех этих баз очень много различных дефектов, технических «глюков». И компании – собственники баз отлично знают: чтобы корректно пользоваться их базами, нужно, чтобы сами авторы проводили разметку своих статей. Для этого в Thomson Reuters завели сервис My Researcher ID, который, к сожалению, пока работает очень плохо. В массовом масштабе такая разборка еще очень долго не будет произведена. Мы имеем некие представления о той методике, которая может быть использована для корректного анализа данных из баз, хотя мы тоже делаем ошибки, но немедленно их исправляем. Поскольку проект публичный, ошибки быстро замечают «зрители». Мы надеемся, что в этом смысле опыт нашего проекта очень существенен. Но даже если бы в массовом масштабе удалось корректно получать данные из базы Web of Science, это не позволило бы получить неискаженную картину научной среды. Все равно помимо формальных показателей нужно иметь в виду массу обстоятельств, которые, как мы пытались продемонстрировать, можно учесть только экспертным путем.

Собственно, содержательная часть нашего выступления завершена. Мы также хотели бы, чтобы все присутствующие знали, где находится наш сайт. Это сайт проекта «Корпус экспертов», на котором находятся открытые списки цитирования. В списках помечено для кого цитирование уже пересчитано в этом году. Часть материалов нашего сообщения опубликована здесь, можно найти ссылку прямо на титульной странице: «Карта полезных ископаемых: поиск на территории российской науки». Эпиграф следующий: «Спасение ископаемых – дело рук самих ископаемых». Спасибо.

Игорь Агамирзян: Спасибо большое, Галина Александровна! Замечательно. Я на правах организатора сегодняшнего мероприятия позволю себе высказать несколько соображений, прежде чем мы перейдем к дискуссии, а потом эту дискуссию буду модерировать.

Так получилось, что я начал отслеживать эту работу буквально с самого начала, хотя мы тогда даже еще не были знакомы. Я наткнулся в 2007 году на ссылку в Интернете. Проект мне с самого начала показался интересным, правильным, перспективным, делом государственной важности. Я тогда работал в бизнесе, связанном с наукой, подбирал математиков для решения сложных задач. Когда три года назад мы поставили задачу формирования экспертно-аналитической службы, выявления экспертов в такой области, я сразу сослался на этот проект и предложил использовать его. В результате у нас установились достаточно доверительные отношения. Я надеюсь, что сотрудничество и взаимодействие продолжатся, потому что этот проект – необыкновенно важная и полезная вещь, которая дает представление о реальности.

Мне чрезвычайно импонирует в этой работе применение строгих методов в естественнонаучном подходе к неестественным областям мира. Наука в целом – это артефакт. Она не может существовать без человека. Наука – следствие длительного развития человеческой цивилизации и в то же время инструмент, продолжающий это развитие. Для российской науки это еще чрезвычайно актуально потому, что у нас есть угроза потерять критическую массу по целому ряду направлений. При этом наверняка есть направления, в которых критическая масса уже потеряна. И если ее можно восстановить, то только ручным методом, через программы, связанные с привлечением экспертов из мировой науки, из глобальной среды. Без интеграции в глобальную науку, без образования за рубежом это само по себе уже не возродится. Впрочем, у меня есть предположение, что на протяжении XX века, в том числе, и в советский период, в нашей науке такие лакуны существовали, возможно, динамически перераспределяясь из одной области в другую. Структура российской науки вообще не имеет никакого отношения к мировым трендам. В России по-настоящему сильная физика, качественно и количественно, а в подавляющем большинстве стран она является маргинальной. Других наук у нас практически нет. На инфографике, если сравнить объемы работ и публикаций в области наук о жизни и в области физики, пропорции будут кардинально разные. Есть, кстати, инструмент, можно будет посмотреть ссылку, который позволяет анализировать соотношение публикаций из разных стран по разным областям науки.

Как мне представляется, очень важно понимать, что разгребать ту ситуацию, в которой оказалась российская наука, предстоит в ручном режиме. Чем быстрее мы осознаем это, чем лучше поймем, как устроена карта полезных ископаемых, тем проще планировать наши действия. Я вижу, что без этого никакого инновационного развития не будет. Мы знаем, что научные разработки длятся длинными циклами в 10 лет. Сейчас начали внедряться технологии, которые базируются на научных открытиях начала-середины 1980-х годов. Если не будет островков генерации знаний, то никакие проекты или институты развития эффективными оказаться не смогут.

Обещаю, что больше не буду длинно высказываться, давайте перейдем к дискуссии.

Наталья Куракова, РАМН: Хочу сказать, что мы выполнили картирование медицины, которую тут абсолютно не затронули. В настоящее время в моем распоряжении есть 8 уникальных инновационных аналитических сервисов. Общая совокупность ресурсов в моих руках в настоящее время составляет 15 миллионов рублей. Мы уже выполнили анализ, к которому только приступает наш Минобр. То картирование, которое он планирует выполнить для российской науки, мы уже сделали для медицины. Я следила за проектом постоянно и склоняю голову перед вашими результатами. Тем не менее я нашла большое количество методологических погрешностей, очень опасных для медицинской сферы. Так, глубоким заблуждением является тот факт, что показатели цитирования позволяют нам анализировать текущие научные тренды, которые станут научными заделами для национальных инновационных проектов. На самом деле я очень ждала, что вы упомянете Essential Science Indicators и фронты мировых исследований, которые как раз идентифицируют восходящие научные тренды. Структура глобальной науки, препарированная на фронты исследования, в настоящее время такова: 1781 фронт приходится на клиническую медицину, на физику – 771 фронт. На химию еще меньше, на биологию 600, на экономику 161, на математику 265. Это структура мировой науки на сегодняшний день. Физика – абсолютная царица и лидер, в 84 фронтах из 774 есть российские исследователи. Показатели активности имеют смысл только на каком-то промежутке времени. Есть науки, которые просто не успели приобрести цитатную мощь в связи с их недавним открытием. Вы пишите, что перспективы высоких технологий зависят от оставшихся островков. А под ними вы понимаете коллективы с высоким цитированием – абсолютно неправильно. И я вам могу показать, почему. Например, после расшифровки генома был всплеск цитирований публикаций, связанных с онкомаркерами. С помощью системы семантического поиска я получила информацию о том, что это совершенно ниспадающий тренд. Истинные специалисты в этой области считают, что действительно имело место большое заблуждение, переоценка этого технологического направления.

Игорь Агамирзян: Все, что было сказано вами, абсолютно правильно, но это совершенно не противоречит сказанному лекторами. Речь, как я правильно понимаю, идет о разных подходах. Одно дело – анализировать существующую среду в устоявшихся науках, и все, что я услышал сегодня и о чем читал раньше, – это действительно разбор и исследование существующей науки. Это само по себе хорошо, потому что избавляет нас от мифов. А есть совершенно другая область, связанная с вновь зарождающимися направлениями. Я абсолютно с Вами согласен, потому что такого положения, как с физикой, по-моему, больше нет нигде в мире, кроме как у нас. А вопрос о прогнозировании трендов не менее важен, чем предыдущий, может быть, даже более важен. Это и есть предмет сегодняшнего дискуссии.

Наталья Куракова: Нормированное цитирование – показатель наукометрии с 2010 года для каждой предметной области. Средний показатель цитируемости – единица, все, что выше единицы, – выше мирового уровня. Почему мы должны устанавливать свои пороги? Почему мы не сравниваем нашу науку с мировой? Вот это я не очень поняла. Не поняла и то, почему вы не смотрите фронты исследования, что существенно более важно, чем пересчет на штатную численность сотрудников. Соотношение национализированного субъекта публикаций к интернационализированному – десять к одному, чего вообще нет ни в одной стране в мире. И вот еще один момент, на который я хотела бы обратить ваше внимание. Я вручную полтора года анализирую русскоязычный массив публикаций. Островками можно назвать не только то, что вы находите всего по одному индексу цитирования в Web of Science. Очень опасно выделять эти островки, потому что наука – это не островки, а газоны. Есть 84 000 кластеров, у каждого из них своя эволюция и синергия. Если мы будем их культивировать по отдельности, в этом не будет ничего хорошего, ни лидерства, ни газонов. Это очень опасная методология.

Михаил Фейгельман: Коротко отвечу. Во-первых, о том, чтобы при помощи наших инструментов прогнозировать развитие научных областей в будущем, вообще не шло речи. Об этом не было сказано ни одного слова. Во-вторых, данные по цитированию научных работников использовались именно как стартовый материал для массива выборщиков – при абсолютном понимании, что самих по себе этих данных недостаточно ни для каких разумных суждений. Неоднократно упоминалось, что в России непропорциональная доля физики среди прочих наук – относительно того, какое место в мире физика сейчас занимает. Не надо забывать, что при этом доля участия российской физики в мировой сильно упала за последние 20-30 лет. На эту ситуацию можно смотреть под разными углами.

Галина Цирлина: Я хочу добавить кое-что по поводу фронтов, кластеров и прочих инноваций. Эти системы поиска фронтов и кластеров по определению рассчитаны на некий безэкспертный анализ, основаны на построении сложных корреляций. И это очень опасная тенденция. Потому что одни и те же слова в разных областях науки часто используются в разных смыслах. Изобилие фронтов производит жуткое впечатление потому, что все они сугубо назывные. Реальная классификация науки – выявление феноменов, а вот эта классификация по фронтам – просто названия, ключевые слова. Не исключаю, что опись всех фронтов полезна, потому что позволяет вовремя заметить новую прорастающую ветвь. Но это должно держаться на каком-то фундаменте. С точки зрения экспертной функции, полный индекс цитирования, который может не учитывать новых направлений, ничем не плох, он просто показывает опыт. Одновременно есть и другой показатель – «активное» цитирование, куда как раз попадают вышеназванные новые направления. С чем категорически нельзя согласиться, так это с показателем, где значение ниже единицы считается значением ниже среднего уровня. Потому что классификация в базах по сравнению с реальной классификацией науки перекошена очень сильно. Эта таблица, которую мы специально взяли с собой как дополнительный слайд, была сделана три года назад, когда мы начинали переговоры о сотрудничестве с Thomson Reuters [показывает таблицу]. Мы сопоставляли их классификатор и реальный научный классификатор в смысле полноты представления разделов. Например, здесь - первый и второй уровни – наш классификатор, отвечающий стандартам международного классификатора по физике Американского физического общества. В Thomson только 8 из 50 разделов второго уровня. По астрономии там вообще нет никакой классификации. Что хорошо представлено в Thomson, так это медицина и некоторые примыкающие к ней разделы биологии. Я специально хочу отметить, что когда по Wwb of Science что-нибудь считают автоматически, то у них статьи из журналов типа Nature или Science, которыми всегда так гордятся авторы, не попадают ни в один из разделов, эти журналы считаются multidisciplinary. То есть то, что можно назвать действительно заметными научными результатами или яркими заявлениями, просто никуда не попадает. В каких-то профильных направлениях можно пользоваться этими формальными инструментами. Мы занимаемся теми разделами естественных наук, в которых ими пользоваться нельзя.

Игорь Агамирзян: Я бы хотел добавить. В процессе обсуждения затрагивался вопрос о точности и чистоте данных. Это проблема, которая касается всех открытых данных. Относительно недавно мне пришлось участвовать в одном обсуждении, связанном с полнотой налоговой информации о гражданах нашей страны. Информация очень грязная, невыверенная, и это обычное дело для больших объемов информации. Такой же процесс, какой наблюдается сейчас в ряде проектов по очищению и выборке информации, предполагает запустить Налоговая служба РФ применительно к данным об имуществе граждан. Они это называют генеральной уборкой данных. Может быть, сейчас зададим вопросы, а потом выступим с более развернутыми комментариями?

Вопрос из зала: У меня два вопроса. Один технический. Вы говорили про так называемые «братские могилы» и из них убирали технических специалистов. Мне хотелось уточнить, какова процедура удаления технических специалистов? И второй вопрос более общий. Вы построили «Корпус экспертов», опираясь на Web of Science. Если предположить, что точкой отсчета был бы Scopus, насколько эти корпуса могли бы совпадать?

Галина Цирлина: Мы не убираем технических специалистов, мы не знаем, кого изначально к ним можно отнести. Мы подсчитываем цитирование, нормированное на число авторов. И если человек систематическим образом работает в этой науке и внес в нее значительный вклад, то он просто переходит порог. А если технический специалист, у которого работ не очень много и все они написаны с тысячью других авторов, то он не переходит порог. На этом сайте есть правила, дано очень много подробностей по поводу критериев отбора. Раньше просто не учитывались работы, где больше 30 авторов. Представители физики высоких энергий, консультанты, сами взялись модифицировать этот критерий – мы бы никогда не стали это делать сами.

Насчет базы Scopus хочу сказать отдельно. С ней этот проект никогда нельзя было бы поднять потому, что у Scopus, в отличие от Web of Science, нет истории, там нет такого количества «скрытых ссылок». Неполные (или «скрытые») ссылки появляются из-за того, что на людей неправильно ссылаются, делают опечатки, или из-за того, что работы не реферируются. Весной этого года мы дали интервью Марии Сергеевне (Аксентьевой), которая представляет здесь редакцию «Успехов физических наук», и там очень подробно описали эти обстоятельства. Если бы мы пользовались Scopus, у нас здесь было бы не 5000 человек.

Я специально хочу подчеркнуть, что все эти базы созданы не для подсчета цифр цитирования, а для поиска научной информации и основной работы научных сотрудников. Из-за того, что формальные рейтинги привлекли к себе такое внимание, все стали думать, что это просто инструмент для подсчета цитирования. Нет, это не так. И теперь отвечаю вам просто как научный работник: в Scopus ошибок и путаницы пока в несколько раз больше, чем в Web of Science.

Мария Аксентьева: У меня не вопрос, а некоторый комментарий и просьба к Галине. Я все-таки думала, что Вы скажете несколько слов о систематической погрешности Web of Science по отношению к русскому цитированию. В советские времена мы были на четвертом месте по рейтингу цитирования, затем резко скатились вниз. Выясняется, что, когда Web of Science руководил Юджин Гарфилд, им было интересно, какие направления в физике мы продвинули. Тогда они честно считали вручную все ссылки на русскую и английскую версии, после чего суммировали их. В начале девяностых эта контора стала коммерческой. Впоследствии оказалось, что некоторое количество русских ссылок они просто выкинули. В результате, например, в 2008 году пишутся работы по свехпроводникам на основе железа – такая топ-тематика, что дальше некуда – в декабре мы печатаем обзор, в январе появляется ссылка в Nature, на русскую версию - потому что английской просто еще нет. Эта ссылка не попала в Web of Science. Чем лучше та или иная область отражена и развита в России, тем серьезнее для Web of Science подобная погрешность. Если это хорошо развитая у нас область, работа печатается во многих русских переводных журналах. Все взаимные ссылки между работами Web of Science чаще всего не учитывает. Такие ссылки приходится считать вручную.

Хочу отметить ту колоссальную работу, которую проделала эта группа. Они с самого начала учитывали все неполные, все скрытые ссылки. Это огромная работа, но систематические ошибки остаются. А по поводу показателей новых направлений могу рассказать небольшой анекдот. На них можно наткнуться, как ни странно, наблюдая за скачиванием статей по конкретным разделам науки. В 1997 году на собрании редколлегии я могла поставить паровоз на то, что никто не догадается, какую статью чаще всего скачивали с сайта журнала УФН. Это была статья ученого по фамилии Гусев из Уральского отделения, в ней говорилось про нанокристаллические структуры в металле. Ученый не был очень популярным, а число скачиваний было огромным. Более свежий пример. В 2008 году, прежде чем был написан обзор литературы о сверхпроводниках, содержащих железо, вдруг была скачана 30000 раз за месяц одна статья 1964 года. Там есть фамилия Гинзбург. Я прихожу к Виталию Лазаревичу и узнаю, что это статья его жены. Она когда-то вместе с Брандтом написала очень точную методику приготовления сверхпроводников под высоким давлением. Именно такое скачивание скорее может давать тренды, возникающие в науке.

То, о чем говорили ребята, то, что они создали, – это экспертный совет, который потом со всей ответственностью сможет сказать: «Да, это тренд, а не мыльный пузырь». Люди, которые могут сказать, что получилось из любых формальных цифр, гораздо важнее, чем любые математические тренды.

Галина Цирлина: Мария Сергеевна принесла нам список журналов, чтобы показать, как уважали нашу науку раньше [показывает список]. В нашей майской публикации в УФН мы с ней обсуждали примеры этого неучета, недоподсчета ссылок на российские журналы. Со следующего года, если ничего не изменится, пользуясь идентификаторами, которые ввел в последней версии скрытого цитирования Thomson, мы начнем суммировать ссылки. Люди просят об этом, чтобы у них были выше так называемые «хирши». Потому что когда ссылки разбиваются на скрытые и явные, недосчитываются хирши. Это интересная задача, которую мы технически уже представляем, как решить.

Мария Аксентьева: А вот китайцы смогли сделать свою базу и индексы, сами считают свои ссылки. Почему?

Комментарий: Потому что в Китае это поддержано на государственном уровне, а у нас об этом пока не задумывались. У нас вместо этого изобретаются самобытные индексы и рейтинги университетов. Я за последние две недели побывал в ведущих вузах на обсуждении того, как бы им попасть в топ-100 рейтингов в соответствии с известным Указом Президента. Нам меня это произвело угнетающее впечатление, они вдруг стали заинтересованы в подгонке определенных индикаторов в рейтингах, которые раньше им были совершенно безразличны.

Михаил Фейгельман: По поводу проекта РИНЦ, который тоже поддержан на государственном уровне. Мы когда-то провели специально исследование, не очень сложное, следующим образом: взяли трех студентов, попросили выбрать из базы Корпуса случайным образом 100 человек и сравнить данные РИНЦ для каждого из этих людей с данными Web of Science. О совпадении речи даже не идет [показывает график из газеты Троицкий вариант, 2011], имеется колоссальный разброс в произвольную сторону, как правило, в сторону занижения – обычно в 10-20 раз. Если к этому относиться как к постепенно накапливаемым знаниям системы, это одно, пусть данные постепенно уточняются. Если же массив информации такого качества используется для того, чтобы принимать решения, то это уже полное безобразие.

Галина Цирлина: Сергей Александрович Крашаков, ученый секретарь Института теоретической физики, у нас систематически занимается тестированием РИНЦ. Сергей берет фамилии людей, у которых по РИНЦ больше 1000 полного и больше 100 «активного» цитирования и проверяет, так ли это. И обнаруживает много интересных ситуаций. Если же эти люди действительно переходят пороги, то новые фамилии включаются в наши списки, это один из источников их пополнения.

Сергей Крашаков: Правда, этот слайд был сделан две недели назад, и РИНЦ эту ошибку уже исправил сам. У нас в институте есть Поляков Александр Маркович, который сейчас живет в Принстоне, в РИНЦе у него две недели назад цитирование равнялось нулю. Зато есть некий Поляков Александр Михайлович из Комплексного Научно-исследовательского Конструкторского Института Водоснабжения и Канализации Технических Сооружений с индексом цитирования 7900, из которых почти все 7900 (за исключением, может быть, 70) – работы Александра Марковича, физика-теоретика в области физики высоких энергий).

Евгений Антипов: Галина Александровна, у меня вопрос к Вам. Почему Вы не учитываете такой важный фактор, как самоцитирование? Еще меня интересует, сколько тех экспертов, которые уже попали в Ваши базы, имеют очень низкие индексы цитирования. Сколько человек попало в список, потому что они хорошие люди?

Галина Цирлина: Почему обязательно хорошие? Может быть, они грамотные люди. Ответ про самоцитирование на сегодняшний день такой: есть люди, которым очень хочется видеть рядом с цифрами цитирования в Web of Science аналогичные цифры без самоцитирования. По моим представлениям, людей, которые набирают высокие индексы полного цитирования с помощью самоцитирования, довольно мало. Людей, которые набирают таким образом активное цитирование, несколько больше. Среднее самоцитирование, по-моему, составляет приблизительно процентов 25-30. И без самоцитирования могут существовать не вполне адекватные способы набрать индекс, есть другие пути. Наша главная идея в том, чтобы все, у кого показатели цитирования есть, в конце концов попали в список.

Если говорить про экспертов, которых рекомендовали более пяти раз, то это единичные случаи. Данные о людях, рекомендованных не менее трех раз, можно увидеть в материалах этой презентации. Посмотрите на слайд 29, сравните между собой колонки r2 и r2’. Например, в первой строке - Институт теоретической физики им. Ландау. 41 человек в списках цитирования, 2 рекомендованных, не проходящих порог, 0 таких, кто был рекомендован не менее трех раз и не проходит порог. Все, кто был рекомендован три и более раз, переходят пороги по цитированию, почти везде так.

Вопрос из зала: У Вас, конечно, очень интересное исследование. Самое интересное то, что Вы здорово поработали с неформальным знанием. Меня как эксперта венчурного фонда интересует простой вопрос. Верно ли, что насчет каждого человека в базе данных я могу понять, в каких областях этот человек популярен? Насколько подробно прописана его специализация? Второй вопрос. Знаменитые исследовательские фронты глобальной науки. В физике на мировом уровне 15% российских фамилий, в других науках – в среднем около 2-3% или вообще никого. Так вот те 2-3% процента людей со своими фронтами могут попасть в этот пул русскоязычных экспертов по современному научному знанию, сформулированному названием этого фронта? Или у вас напротив каждой фамилии есть какие-то другие отличительные слова, идентифицирующие его квалификацию?

Михаил Фейгельман: Квалификация человека указана достаточно подробно для того, чтобы можно было понять, имеет ли смысл предлагать тот или иной проект этому человеку как эксперту. За какой период времени – вопрос более сложный. Мы ведь, когда проводили опросы, узнавали мнение выборщиков о том, кого они считают экспертами в своем направлении сейчас, на данный момент.

Галина Цирлина: [показывает пример карточки в базе данных] Смотрите, первый уровень – физика, второй уровень – раздел физики, третий – коды классификаторов. Помимо этого, есть конкретные ключевые слова. А теперь Вы хотите узнать, когда именно он чем-то из этого занимался. Как видите, данные о специализации довольно подробны.

Вопрос: Мы попробовали проводить через эти фронты экспертизу венчурного проекта по трендам публикаций и патентования. Нашей целью было увидеть, какие технологические платформы для решения этого вопроса развиваются, а какие уходят в прошлое. Формальная сторона может давать какую-то информацию, которая имеет самостоятельную ценность и в разговоре с экспертом, чтобы иметь право на какую-то точку зрения? Сама по себе тенденция с публикациями характеризует жизненный цикл конкретных технологических подходов?

Михаил Фейгельман: Я должен сказать, что мы про эту сторону всерьез не думали. Ответ по существу я дать не могу. На первый взгляд мне кажется, что много пользы таким способом не извлечь, потому что здесь не хватает конкретики. Мы такую задачу не ставили.

Галина Цирлина: Далеко не для любой технологии это возможно. Все зависит от характерных времен. Если развитие происходит медленнее, чем публикации статей, то такой анализ осуществим – в области электрохимических источников тока, например. Есть определенный круг журналов, в которых, если специалист знает, что он ищет, он найдет корректный ответ. Но это происходит только тогда, когда тренд в науке проживает большую жизнь, за которую публикуется много статей на соответствующие темы.

Елизавета Бонч-Осмоловская: Не считаете ли Вы, что нужно учитывать место автора в списке авторов? Я не знаю про все области, но могу точно сказать про молекулярную биологию, что там это важнейший вопрос. Еще статья не написана, а уже идут мучительные обсуждения, как будут выстроены авторы. Первое, второе места, предпоследнее и последнее важны, а серединка, в принципе, не имеет значения. Кстати, таким образом выявятся лидеры и отсеются технические работники.

Галина Цирлина: Скорее всего, Вы говорите не о Корпусе экспертов , а о списках цитирования, да? Во многих областях авторы выстраиваются по алфавиту. В некоторых – наоборот: первый автор – ключевой. Был когда-то дополнительный критерий – что для включения в списки, кроме «перехода порогов», нужно было не менее 10 цитирований статей, в которых человек был бы первым автором. Потом этот критерий был отменен как очень неуниверсальный. Для всех естественных наук порядок авторов разумным образом учесть невозможно, и я вообще плохо понимаю, зачем это нужно.

Вопрос из зала: Вопрос относительно динамики процесса. Количество авторов и ссылок фиксировано. Есть ли на сегодняшний день такие ресурсы, такие третейские системы, где можно добавлять количество цитат? Мы маленькая организация, написали работу, находимся низко в рейтинге, и вот ссылка сделана, но не зафиксирована. Есть ли такие возможности и каким образом можно их реализовать в момент чистки базы?

Галина Цирлина: Этим занимается непосредственно Thomson. Компания очень аккуратно старается добрать все то, что пропустила за прошедшие годы. При пересчете очень у многих людей в наших списках подскочили показатели: Web of Science вернула цифры по русскоязычным цитатам.

Комментарий из зала: Я услышал вопрос таким образом. Существует ли в научной системе взвешивания цитирования некие аналоги того, как накручивают ссылки в Интернете? Методы, используемые поисковиками, очень хорошо известны науке.

Галина Цирлина: Коллеги, мы не занимаемся вопросами, связанными с конъюнктурными аспектами цитирования. В этом проекте цитирование рассматривается как величина для характеристики некоторого квалификационного порога. Мы не интересуемся ни инструментами «накачки» цитирования, ни погоней за теми, кто это делает.

Михаил Фейгельман: Важно заметить еще раз, что далеко не все люди, которые были первичными выборщиками, в результате получили хотя бы одну рекомендацию. В то же время, в экспертный корпус, то есть в число многократно рекомендованных, вошло сколько-то людей, которые не перешли порог цитирования. Рекомендательный механизм крайне существенен.

Игорь Агамирзян: Спасибо большое, коллеги!