Карта научного сообщества: Как данные из статей помогают учёным найти себя и друг друга

Карта научного сообщества: Как данные из статей помогают учёным найти себя и друг друга

 

Учёные всех мастей знают ценность сбора и использования данных для ответов на исследовательские вопросы — от микроскопической жизни до процессов земных систем и физики космоса. Но как насчёт ценности данных, проливающих свет на самих коллег внутри их собственных научных сообществ?

Такие данные могут помочь исследователям лучше понять структуру своей области, найти и установить связи с коллегами. Будучи собранными в актуальный всемирный каталог учёных конкретной дисциплины, они могут помочь в поиске возможностей трудоустройства, выявлении потенциальных соавторов и подборе рецензентов для статей и заявок на гранты.

Эти данные также способствуют повышению узнаваемости учёных на ранних этапах карьеры или тех, кто менее заметен в сообществе. Их можно использовать для выявления новых областей исследований и трендов, указывающих на расцвет или спад научных направлений — что важно не только для самих учёных, но и для финансирующих организаций, наблюдательных комитетов и политиков.

Исследователи могут приблизительно представлять размер и состав своего сообщества по конференциям и статьям, но точные цифры и полная информация труднодоступны. Демографические опросы, проводимые профессиональными обществами или фондами, обычно неполны из-за неохватки всех учёных, ограничения одной страной и редкой периодичности.

Потребность в подобных данных была подчеркнута в недавнем декадном обзоре Национальных академий по солнечной и космической физике, который прямо рекомендовал (в пункте 4-1) государственным агентствам США финансировать сбор такой информации для анализа состояния профессии.

Недооценённый ресурс для этого сбора скрывается на виду: массив научных статей, создаваемый самим сообществом. Комбинируя метаданные этих статей с уникальными идентификаторами авторов (ORCID), можно извлечь точную и актуальную информацию об исследователях и их работе.

HelioIndex — новый автоматизированный онлайн-каталог, использующий этот подход, чтобы дать развивающийся снимок мирового сообщества в области физики Солнца и гелиосферы [Young, 2025]. Его методы универсальны и применимы везде, где в публикациях широко используются ORCID, что делает его моделью для создания подобных инструментов в других научных областях.

Кто, что, где и сколько: картина в цифрах

В области физики Солнца и гелиосферы (SHP) HelioIndex на данный момент идентифицировал более 2300 активных исследователей примерно из 60 стран, предоставляя информацию об их географическом распределении, институциональной принадлежности, областях экспертизы (выведенных из ключевых слов статей) и публикационной активности.

Данные позволяют отслеживать изменения. Например, с июля 2022 по июль 2025 года число исследователей SHP в Китае, Индии и США выросло на 42%, 39% и 33% соответственно, увеличив их долю в мировом сообществе. В то же время рост в нескольких европейских странах из первой десятки был меньше, что привело к общему снижению их доли.

Эти цифры показывают, что область SHP в целом растёт. Масштабы роста в разных странах могут помочь начинающим учёным определиться с местом развития карьеры, а национальным фондам — оценить конкурентоспособность своих стран и адекватность уровня финансирования.

С другой стороны, почти половина стран представлена в HelioIndex пятью или меньшим числом исследователей SHP. Важная функция каталога — повысить видимость этих учёных и их работы, особенно там, где мало возможностей для признания. Это может способствовать новым коллаборациям, развитию сообществ в их странах.

Понимание публикационной активности и карьерных траекторий

Данные публикаций и ORCID также позволяют анализировать тренды внутри сообщества. Например, можно рассчитать среднее ежегодное количество первых авторских рецензируемых статей на человека. Сейчас этот показатель составляет 0.68, то есть примерно две такие статьи каждые три года. Эта цифра ценна для управления ожиданиями в области: она может успокоить молодых исследователей, чувствующих давление необходимости часто публиковаться. Если же в заявке на грант утверждается о 10 статьях за 3 года, рецензент, вооружённый данными HelioIndex, вправе усомниться.

Для каждого автора также можно оценить «возраст карьеры», взяв за точку отсчёта дату публикации его первой первой авторской рецензируемой статьи. Текущий медианный возраст карьеры всех авторов в HelioIndex — 9.9 лет. Распределение смещено в сторону более молодых возрастов, что, вероятно, связано с поздним внедрением ORCID (с 2009 года). Однако длинный «хвост» распределения показывает, что многие опытные учёные вручную обновили свои записи ORCID.

Как работает HelioIndex: от статей к сообществу

HelioIndex отличается от таких ресурсов для профессиональных сетей, как ORCID, Scopus или LinkedIn, своей узкой направленностью на конкретное исследовательское сообщество.

Процедура заполнения каталога начинается с автоматических запросов к недавней научной литературе в библиографической базе данных NASA Astrophysics Data System (ADS) на предмет статей по SHP. Статьи отбираются, если, например, они ссылаются на ключевые обзорные работы, упоминают крупную обсерваторию или космический аппарат SHP или содержат определённые ключевые слова (например, «солнечная вспышка»).

Для каждой найденной статьи собираются имена и ORCID авторов, которые добавляются в общий список потенциальных участников HelioIndex. Поскольку у журналов нет стандартного формата указания аффилиаций, HelioIndex использует специальное ПО для извлечения названий учреждений и стран путём сопоставления строк.

Авторы включаются в каталог на основе критериев по ключевым словам и публикациям. Не менее 15% ключевых слов автора во всех его статьях должны содержать «solar», «Sun» или «interplanetary», что эффективно отличает учёных SHP от специалистов по физике звёзд или магнитосферной физике. Публикационные критерии включают наличие хотя бы одной рецензируемой статьи за последние 3 года, хотя бы одной первой авторской статьи в карьере, возраст карьеры не менее 2 лет и определённый «балл» от публикаций. Эти критерии призваны представить профессиональное сообщество исследователей SHP с учёной степенью.

Конечно, сложно гарантировать, что каталог включает всех. Некоторые начинающие исследователи могут быть невольно исключены из-за недостаточного числа публикаций. Однако эту проблему можно решить, так как создатель каталога (сам являющийся частью сообщества SHP) может оценивать его полноту, корректировать параметры запросов и реагировать на запросы о включении. Авторы также могут проверять свои данные, исправлять ошибки или просить не указывать их имя (хотя их географические и публикационные данные всё равно будут учтены в общей статистике для сохранения полноты картины).

От демографии к сотрудничеству: практическая польза

Помимо предоставления демографических данных, HelioIndex выполняет множество практических функций. Студенты и исследователи, изучающие карьерные возможности, могут быстро оценить географическую концентрацию учёных, использовать данные ключевых слов для поиска коллег со схожими интересами и просмотреть списки публикаций, чтобы определить активность и круг соавторов.

Каталог можно использовать для подбора потенциальных рецензентов для статьи путём сопоставления ключевых слов авторов с темами статьи. Это позволяет авторам (или редакторам журналов) предлагать рецензентов, о которых они иначе не подумали бы, способствуя разнообразию пула рецензентов и повышая узнаваемость коллег. Этой функцией также могут пользоваться менеджеры программ в фондах при формировании экспертных панелей.

За несколько месяцев с момента публичного анонса трафик на сайт был высоким, а отзывы пользователей — в основном положительными. Например, один учёный среднего звена отметил, что HelioIndex помогает «охватить глобальную картину сообщества солнечной физики и гелиофизики в мире». Эти ранние признаки говорят о том, что каталог предоставляет ценные услуги многим в этом сообществе и даже за его пределами.

Модель для других наук

Базовая механика и принципы HelioIndex могут быть легко применены для разработки аналогичных ресурсов в других научных областях, независимо от их размера и масштаба, хотя конкретные параметры запросов и критерии ключевых слов потребуют адаптации.

Например, для вулканологов ключевым словом для отбора могло бы быть «volcano», а добавление «Earth» помогло бы исключить исследователей марсианских или иных вулканов. Критерии публикаций также можно пересмотреть в соответствии с трендами в конкретной области. Поскольку база данных ADS не полна для наук о Земле и других областей вне астрофизики, может потребоваться альтернативный источник, такой как Web of Science или Scopus. Кроме того, подход с извлечением информации об аффилиациях, хорошо работающий для относительно небольшого сообщества SHP, может оказаться сложнее для крупных областей с огромным числом учреждений.

HelioIndex демонстрирует, что метаданные научных статей — это богатый ресурс, который можно эффективно использовать в дополнение к эпизодическим данным опросов. На основе последовательных и воспроизводимых демографических данных можно выявлять географические, временные и тематические тренды, предоставляя ценную информацию как о научных сообществах, так и для них. Такие инструменты, повышая прозрачность и связанность, способны не только отражать текущее состояние дисциплины, но и активно формировать её будущее, помогая талантам быть замеченными, а идеям — находить сторонников через границы стран и институтов. Следующим шагом может стать интеграция подобных систем с платформами открытой науки, что позволит создавать динамичные, живые карты мировой научной деятельности в реальном времени.

Добавить комментарий