Кодификация и учёт электронных изданий: быть ли в России ISTC?

18.04.2011

Практика, как известно, опережает теорию. В мире уже активно торгуют электронными книгами, а издатели, распространители и агрегаторы всё ещё горячо спорят о стандартизации их учёта. Положение дел осложняет ещё один вопрос, порожденный цифровой эпохой, – как идентифицировать отдельные текстовые элементы электронного произведения. В общем, хотя ситуация ещё и не сравнима с хаосом печатного книгоиздания в эпоху до-ISBN, повод задуматься уже есть. Новый вариант кодификация и учёта электронных изданий на конференции «Электронное книгоиздание и инновации в книжной отрасли» в рамках выставки «Книги России» обсуждали российские эксперты, находящиеся в авангарде технологической революции в отрасли.

Участники дискуссии:

Алексей Кузьмин, генеральный директор НП «Федерация интеллектуальных прав» (ФИПР)

Василий Терлецкий, генеральный директор компании «КОПИРУС».

Борис Есенькин, президент ТД «Библио-Глобус».

Олег Андрианов, начальник отдела АНО «Национальный библиотечный ресурс»

Павел Арефьев, руководитель отдела маркетинга и рекламы eLibrary.

Александр Альперович, генеральный директор издательства Clever Media group, зам. председателями правления ФИПР

С развитием Интернета и уходом части контента в сеть, авторы, правообладатели, ретейлеры и профессиональные союзы озаботились вопросом учёта и контроля разнообразной мультимедийной продукции: текста, иллюстраций, аудио и аудиовизуального материала. Примерно, в течение последний декады стали появляться международные организации, которые предложили рынку идентификаторы, включающие метаданные, специфичные для большинства типов медиа (такой код не создан пока для иллюстративного материала): ISAN – для аудиовизуального контента, ISWC – музыки, e-ISBN – электронных книг, DOI – любого цифрового контента в электронных сетях. В 2009 г. появился новый код ISTC, разработанный специально для идентификации текстового контента в любом медийном объекте, будь то фильм (сценарий) или песня (текст). Все эти коды входят в общую систему международных стандартов, которая предусматривает работу с большим массивом электронного контента, и призваны решать, как минимум четыре задачи:

· Отслеживать использование произведений;

· Помогать в борьбе с пиратством

· Содействовать соблюдению финансовых интересов правообладателей

· Способствовать систематизации и структуризации неописанного контента.

На сегодняшний день общеотраслевой договоренности по использованию идентификаторов цифрового контента не выработано ни у нас в стране, ни за рубежом. Международное агентство ISBN предлагает присваивать электронным книгам код e-ISBN, при этом кодируя текст ISTC. Ведутся многочисленные споры по необходимости присваивать отдельный ISBN каждой версии электронной книги. Одно отрадно, что опоздав почти на 30 лет с введением ISBN, мы находимся в той же стадии замешательства, что и остальной мир по вопросам учёта цифрового контента. Однако любая инициатива, как бы хороша она не была, будет работоспособна только при условии договоренности участников рынка.

ISTC

International Standard Text Code (ISTC) – международный стандартный текстовый код, созданный для идентификации текста на основании его уникального описания. В отличие от ISBN, который присваивается каждому формату продукта (бумажной, аудио и электронной книге), ISTC идентифицирует текстовую составляющую произведений, предназначенных для публикации. Регистрации ISTC подлежат также тексты с иллюстрациями, которые являются неотъемлемой частью произведения. Чисто графическим работам ISTC не присваивается. Система регистрации ISTC принимает метаданные каждого издания в формате ONIX, адаптированном для ISTC.

Агентство рекомендует регистрировать ISTC до публикации произведения, с тем, чтобы при его выходе в свет код продукта (ISBN) уже включал ISTC.

Включение номера ISTC в библиографическую запись, обеспечивает автоматическую агрегацию, сопоставление и фильтрацию данных в зависимости от содержания соответствующих публикаций. Это решает проблему выявления контента, когда он публикуется под разными названиями, или если одно и то же название присвоено различному контенту. ISTC также может использоваться для оптимизации маркетинговых усилий, в частности повторное размещение рецензии при переиздании произведения. Другое применение ISTC - выявление взаимосвязанных текстов: например, библиографических описаний различных переводов оригинала, если они включают ISTC оригинального издания, с которого выполнен перевод.

ISTC представляет собой 16-символьную строку, состоящую из десятичных цифр от 0 до 9, разделенных дефисом: первый элемент (3 цифры) – код регистрационного агентства; второй элемент (4 цифры) – год регистрации; третий элемент (8 цифр) – уникальный номер текста; четвертый элемент – проверочное число.

ISTC зарегистрирован в 2009 году Международным агентством ISTC. В России право присваивать коды ISTC получила компания «Копирус» в 2010 г.

Предоставим слово участникам дискуссии.

Алексей Кузьмин:

Интернет развивается стремительными темпами. Продавцы, агрегаторы электронного контента пытаются наладить его дистрибуцию, а потребители хотят получать контент своевременно и в нормальном качестве. Международное сообщество несколько лет разрабатывало систему стандартизации и каталогизации на основе системы ONIX. Первые две версии были созданы для книготорговой системы, третья – уже пригодна для решения вопроса авторских прав. Она поддерживает подключение большого блока полей, которые отвечают за авторские права, за форматы, способы передачи информации. Необходимо было расширить систему международных идентификаторов, в которой для книг существует код ISBN. Так появился код ISTC. В то время как ISBN – код собственно товара, например, книги, ISTC – код, который привязан к тексту.

Почему это было сделано? В отличие от ISBN, ISTC помогает идентифицировать любую часть книги, которая также является объектом авторского права, например каждый рассказ, входящий в литературный сборник. Сегодня любой, специально или ненамеренно, может выложить в сеть объект авторского права. В пиратстве, которое возникает стихийно и неконтролируемо, скрывается большая опасность для всех тех, кто сейчас занимается легальной торговлей книгами в Интернете. Если будет создан международный реестр авторских прав, любые поисковые системы смогут работать с ним и вычислять, какой объект является легальным, а какой пиратским.

Сейчас, пока большинство инциатив находится на стадии разработки или внедрения и не получило легального статуса, самое время инициировать пересмотр авторско-правового законодательства с учётом новых стандартов. В настоящее время законодательно закреплёно использование ONIX, который входит в СИБИД, туда же входит и ISBN. ISTC-код пока туда не входит, потому что это современная разработка 2009 года.

Для облегчения бремени, ложащегося на книготорговые структуры, и повышения прозрачности взаимоотношений между издателями и дистрибуцией, международное агентство ISBN и Совет по стандартизации EDItEUR планируют создать сайт, на котором партнёры по дистрибуции смогут запросить у издательства номера ISBN для конкретного формата электронной публикации.

Борис Есенькин:

Я хочу немного вернуться в историю, чтобы была понятна та последовательность, в которой идёт стандартизация. На определённом этапе без стандартизации книг, как без паспорта человеку, стало трудно дальше двигаться, поэтому был создан стандарт СИБИД для всех, кто выпускает книги, для библиотечного сообщества. 15 лет прошло с тех пор, как мы освоили ISBN. Сейчас он зафиксирован как Госстандарт. ISTC, также как и ISBN, позволяет фиксировать всё, что выпускается, но отражает уже реалии цифровой эпохи. Пора понять, что если мы не сумеем скоординировать наши действия, то окажемся за бортом информационной революции, которая уже свершилась. Объём незаконного скачивания в Интернете чудовищен. Только корпоративность, только совместное понимание происходящего и сегментация ответственности каждого могут помочь. Необходимо создавать единую информационную площадку, но никто, даже государство за нас это делать не будет. Поэтому «Библио-Глобус» и «Гильдия книжников» будут участвовать в этом большом и серьёзном проекте.

Олег Андрианов:

Задача, которую мы выполняем, – реализация государственной программы «Информационное общество 2011-2020», иными словами – создание Национального библиотечного ресурса как совокупности книг, оцифрованных и хранящихся в РГБ, РНБ, Президентской библиотеке. Вопрос индивидуализации книг, особенно тех, которые перешли в общественное достояние, стоит особенно остро. Часть архива – книги, выпущенные тогда, когда ещё не было никакой классификации. Нам их предстоит каталогизировать и придать этому процессу хоть какую-то упорядоченность. Мы надеемся, что та классификация, которая предлагается, будет работающим механизмом. Что касается контента, охраняемого авторским правом, – мы идём по единственно возможному пути, предписанному 4-й частью ГК РФ, т. е. заключаем лицензионные договоры с каждым автором и получаем его согласие на то, чтобы его книга была оцифрована, и у читателя в помещении библиотеки был к ней доступ. Причём не только в помещении РГБ, но и чтобы читатель, например, в Абакане, до которого книга тиражом в 7 тыс. вряд ли дойдёт, зайдя на сайт РГБ, мог ознакомиться с частью книги и принять решение, покупать её или читать в библиотеке. Вот это движение частей книг тоже требует идентификации. Мы надеемся, что в нашем деле эта кодификация поможет.

Василий Терлецкий:

В нашей стране действует международный книжный код ISBN. Без ISBN издать книгу можно, а пустить в коммерчекое распространение – нет. Эта ситуация сложилась путём многолетнего внедрения ISBN во все цепочки продажи книг.

Примерно такая же итоговая ситуация ждёт и любую другую международную классификацию, в частности, ISTC. У ISTC есть ряд принципиальный отличий от ISBN. Во-первых, в ISTC и в аналогичных полях системы стандарта ONIX есть поле правообладателя. В эксклюзивном лицензионном договоре международного ISTC –агентства с ФИПР есть специальный пункт, что ФИПР как российское лицензионное агентство должен обеспечить получение заявлений на присвоение кода ISTC от правообладателя. Мы имеем дело с большим количеством охраняемых авторским правом произведений, но одновременно имеем большое количество неохраняемых произведений, которые в основном сконцентрированы в библиотеках.

Поэтому библиотекам для внедрения ISTC кода предстоит большая работа со всеми, как охраняемыми, так и неохраняемыми текстами. И заявителем по регистрации кода ISTC для всего массива неохраняемых произведений, а в РГБ их более 30 млн, должны быть библиотеки.

ISTC – это своеобразный паспорт текста. В отличие от ISBN, в структуре ISTC заложено выстраивание цепочек. В идеале предполагается, что если автор создал текст и предполагает его коммерческое использование, он туже может получить ISTC. Дальше автор представляет этот текст издателю, часто происходит довольно серьёзное редактирование этого текста. Фактически часто появляется немного другой текст. Это ещё один текстовый код. Если происходит переработка этого текста, это третий текстовый код. И все эти модификации одного и того же текста должны быть выстроены в цепочку, которая через информационную систему должна быть видна, одновременно помогая читателям найти именно тот текст, который нужен. Работа с этими цепочками, их выстраивание – это задача непосредственно библиотеки.

Ещё один важный момент. Сейчас возрастают темпы продажи э-книг, текстов. ISBN и в России, и за рубежом стоит достаточно серьёзных денег – примерно 30 долларов. Для продажи э-книг сейчас используется ISBN. Но это неэффективно. Ведь э-книга может быть продана всего за 30 долларов в итоге за год, т. е. доход аннулирует прибыль. Поэтому нам одним из условий поставили дешевизну этого кода. По нашим предварительным расчётам, он будет стоить около 30 рублей.

Павел Арефьев:

В мире существует целых ряд кодов учёта электронного контента, например eISBN. Ещё один цифровой идентификатор объектов DOI был разработан 12 лет назад и с тех пор достаточно успешно развивается, издательства покупают эти коды, и практически все крупные издатели мира, которые выпускают много научной литературы, используют DOI. Этот механизм позволяет идентифицировать как статью, так и выпуск журнала, книгу, часть книги, например, главу. Это тоже стандарт ISO. Этот код используется во всём мире. Например, книге, выпущенной издательством «Шпрингер» в 2011 году, присваивается ISBN на печатную версию, а eISBN и DOI на электронную версию. Издательство «Эльзевир», выпускает книги только в электронном формате, без печатной версии. Книга имеет DOI и никаких больше идентификаторов. Причём этот код они присваивают на каждую главу. Этот тоже платный, как и ISBN, как и ISTC, код, стоит около 2 долларов. Возникает вопрос: что будут делать те, кто формирует мировой издательский рынок. Они что, будут покупать ещё и ISTC? Второй вопрос. Что будет делать российский учёный? Автор, создавая рукопись, может получить ISTC. Дальше он посылает в журнал свою электронную рукопись, он её рассматривает, рецензирует, запускает в издательский процесс, и тоже покупает ISTC. Не слишком ли много получается поборов?

Мне как участнику разработки российского индекса цитирования, очень важно, чтобы электронный текст, который попадает ко мне в базу, был однозначно идентифицирован. Сейчас, например, я получаю от западных партнёров материалы с индексом DOI. Все основные поисковики Интернета с этим кодом работают.

Александр Альперович:

Для издателей выгода использования данного кода заключается в том, что мы привязываемся не к бумажной версии того или иного издания, как к ней привязан код ISBN, и при этом понимая, что одна и та же книга, один и тот же текст каждый раз в новом оформлении получает новый ISBN, а привязываемся к тексту начинаем контролировать движение текста насквозь, от твёрдого носителя к электронной версии на любых носителях, будь то диск или цифровая версия, скачанная через Интернет. В любом случае, мы получаем инструмент, который позволяет отслеживать движение авторского текста. Это, на мой взгляд, подтолкнёт развитие коммерции внутри пространства электронных книг. Мы конкурируем не за способы передачи информации, а за время человека, чем он занимается – читает, смотрит телевизор или играет в компьютерные игры, или сидит в своём блоге. В данной ситуации наведение порядка и создание определённой прозрачной структуры торговли электронными текстами приведёт к увеличению легального контента в сети, что достаточно серьёзно может продвинуть эту структуру бизнеса.

****

Итак, пять спикеров и две позиции: Из воздержавшихся – Павел Арефьев давно и успешно работающий в eLibrary с кодом DOI, который сомневается в необходимости внедрения ISTC – дублирующего, по его мнению, идентификатора. Определенно «Да»: Борис Есенькин, который в очередной раз призвал к консолидации отрасли и с частности к поддержке внедрения нового идентификатора; представитель издательского сообщества Александр Альперович голосует за любую систему, которая обеспечит прозрачные отношения с торговлей; Олег Андрианов убежден, что использование кодов облегчит систематизацию библиотечного контента и, конечно, истиными евангелистами внедрения новой кодификации выстапают Алексей Кузьмин и Василий Терлецкий, предложение которых заключается в продвижении нового стандарта на законодательном уровне. А для борьбы с пиратством, В. Терлецкий предложил схему, отработанную в IT-индустрии: тесная работа с правоохранительными органами в сочетании с легким доступом к широкому предложению легального контента. Идея не нова, но в данном случае она подкрепляется инструментом: «Мы обязаны дать всему рынку открытый реестр объектов авторского права» – убежден он.

Forum with id 9 is not found.

Зарегистрируйтесь, чтобы оставить свой комментарий

<< Возврат к списку