Новости
Создана нейросеть, ускоряющая поиск близких по смыслу научных статей
Специалисты Московского государственного университета им. М. В. Ломоносова разработали мультиязычную нейросеть для научных электронных библиотек, которая позволяет быстрее находить близкие по смыслу публикации с результатами исследований. Об этом сообщила пресс-служба МГУ.
Нейросеть SciRus-tiny внедрена в научную электронную библиотеку elibrary.ru. Теперь похожие публикации в ней можно искать не только по ключевым словам, точность подбора которых влияет на количество и содержание документов, но и по текстам самих статей.
«Нейросетевой поиск позволяет задать в качестве условия запроса аннотацию, полный текст научной статьи или даже подборки статей по интересующей тематике. Система автоматически подберет документы, максимально близкие по своей тематической направленности», - уточнил руководитель междисциплинарной группы проекта, заведующий кафедрой физического факультета МГУ Алексей Хохлов, чьи слова приводятся в сообщении.
Кроме функции поиска с помощью нейросети, пользователи библиотеки могут искать публикации по таким параметрам, как совместное цитирование, просмотр публикаций пользователями, состав авторов, дата выпуска статьи и другим.
«Важной для нас особенностью данной модели является ее мультиязычность, поскольку научная электронная библиотека содержит документы на различных языках. Также тестирование подтвердило высокую эффективность модели, что расширяет круг задач и приложений, где она может быть использована. В стадии разработки - применение нейросети для идентификации авторов в публикациях, тематической классификации научных статей, а также в новом интерфейсе расширенного поиска на elibrary.ru», - прокомментировал генеральный директор библиотеки Геннадий Еременко, чьи слова приводит пресс-служба МГУ.
Нейросеть была создана сотрудниками Института ИИ МГУ при поддержке портала elibrary.ru. Авторы также опубликовали нейросеть в интернете, открыв доступ для всех пользователей.
О библиотеке
Библиотека elibrary.ru - крупнейшая в России база научных публикаций, интегрированная с Российским индексом научного цитирования. Платформа была создана в 1999 году по инициативе Российского фонда фундаментальных исследований (в 2022 году преобразован в Российский центр научной информации). Согласно данным на сайте проекта, сегодня пользователям портала доступны рефераты и полные тексты более 38 млн научных публикаций и патентов, в том числе электронные версии более 5,6 тыс. российских научно-технических журналов. Общее число зарегистрированных организаций - более 2 800, индивидуальных пользователей - 1,7 млн, представляющих 125 стран.
Фото: Михаил Почуев/ТАСС
Источник: nauka.tass.ru