Сегодня я хотел бы поговорить про юридические инструменты, которые активно практикуются по всему миру движениями за открытый доступ (open access), открытые образовательные ресурсы (open educational resources), открытые данные (open data).
Эти инструменты используются для защиты «свобод» информации, контента, данных, знаний. Свобода в кавычках – это уже ставшие классическими перечисления, которые в 80-х годах провозгласил основатель Фонда свободного программного обеспечения Ричард Cтолман: свободу использовать, изучать, копировать и распространять.
Понятия «данные», «база данных», «информация», «объект авторского права», «контент», активно используемые цифровой экономикой, получили свои легальные формулировки в законодательстве разных стран. Тем временем, сетевое сообщество для сохранения этики и «свобод» сети стало активнее формировать свои правила, определения, лицензии, чтобы законодательство лишь успевало фиксировать развитие практик обмена и совместного использования знаний.
Что такое база данных?
Для того, чтобы у читателей материала было общее представление о базе данных, необходимо дать определение. Первое определение будет сетевое, второе-юридическое.
Википедия определяет базу данных как «представленную в объективной форме совокупность самостоятельных материалов, систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины».
Согласно ст. 4. Закона «Об авторском праве и смежных правах» Республики Беларусь от 2011 года база данных - это совокупность данных или другой информации, выраженная в любой объективной форме, представляющая собой по подбору или расположению этих данных или другой информации результат творческого труда.
Как видим, юридическая формулировка ещё более широкая, что даёт нам возможность, например, определить результат поиска на сайте или ленту новостей как «базу данных».
Что такое открытые данные?
Определим, что же такое открытые данные. Итак, согласно Википедии, открытые данные - это концепция о том, что определённые данные должны быть свободны и доступны по желанию каждого для использования и публикации без ограничений копирайта (авторского права), патентов и других механизмов контроля (например, DRM – технический механизм ограничения использования контента). В открытых данных важно сохранить открытость, т.е. доступность использования, изучения, повторного использования, копирования, распространения.
В этой статье под контентом будет пониматься “что-либо выраженное в какой-либо форме: речью, письмом или любым существующим искусством”. Контент может распространятся через интернет, телевидение, книги журналы, прямой эфир.
Почему важно не путать информацию и базу данных?
Общепринятое определение данных даёт Википедия. Данные — это представление фактов и идей в формализованном виде, пригодном для передачи и обработки в некотором информационном процессе.
Легальное определение информации можно прочесть из закона «Об информации, информатизации и защите информации» Беларуси, согласно которому информация – это сведения о лицах, предметах, фактах, событиях, явлениях и процессах независимо от формы их представления. Сетевое определение информации близко: информация — это сведения (сообщения, данные), независимо от формы их представления (Википедия).
Исходя из данного определения, становится очевидной разница между информацией и базами данных. Во-первых, для базы данных важное свойство - это ярко выраженная систематизация. Во-вторых, это метаинформация, которая описывает структуру базы данных. В-третьих, данные хранятся и обрабатываются в вычислительной системе.
Информация получается из данных при их интерпретации. Согласно нашему законодательству, информацию можно разделить на общедоступную и информацию, распространение и (или) предоставление которой ограничено. К общедоступной информации нельзя ограничить доступ. К такой информации можно отнести, например, информацию о деятельности государственных органов, социальном и экономическом развитии страны, фондах открытых библиотек, архивов и т.д. (Подробнее смотрите Закон “Об информации...”)
Как мы видели из описания движения открытых данных, важно брать такие данные, которые после обработки и интерпретаций также останутся общедоступными.
Таким образом, во-первых, активисты движения открытых данных создают информацию (интерпретируют данные), к которой применяется отличный от баз данных правовой статус. Например, карта зашумленности. В начале, из открытых источников, например, статистики государства (гос. учреждения), берутся показатели шума на определённой территории. Эти показатели в сборе представляют информацию о шумовом загрязнении территории. Такая информация имеет открытый режим доступа, данные, которые её образуют свободны в использовании.
Во-вторых, в результате интерпретации и обработки данных журналистами, учёными возникают новые объекты – базы данных. На рассмотренном примере с картой зашумленности расположение объектов, цветовое обозначение зон загрязнения, индикаторы уровня загрязнения, расположенные на карте и выбираемые согласно разным запросам пользователя - это уже база данных. А базы данных попадают под действие копирайта. Другими словами, являются объектами авторского права и охраняются копирайтом. Как известно, эта охрана возникает автоматически – по факту создания объекта.
Интересно, что в ряде стран анголосаксонской правовой системы (например, США) некоторые виды баз данных не охраняются копирайтом, т.к. в них нет творческого начала (например, результаты поиска в поисковике). В Европейском Союзе с 1996 действует (sui generis) право на базы данных. В белорусском законе базы данных также защищены авторским правом, в том числе и результаты поиска, фильтрации и т.п.
Почему лицензируют базы данных?
Как мы узнали из текста выше, база данных - это объекты авторского права. Предоставление разрешения использовать такие объекты осуществляется с помощью лицензионных договоров. Поэтому многие ресурсы движения открытых данных так или иначе занимаются лицензированием. Для чего? Для того чтобы обеспечить юридическую поддержку открытым принципам распространения этих самых данных.
Кроме того, согласно юридическому определению, в базе данных могут содержаться и другие объекты авторского права, например, такой контент как: картинки, аудиовизуальные произведения, музыка, тексты статей и т.д. Другими словами, помимо лицензирования самой базы данных необходимо лицензировать и весь контент, содержащийся в ней. База данных и её контент - это разные объекты авторского права. Например, картинка из базы данных, и сама база данных. Поначалу такую разницу достаточно сложно воспринять. Кто писал свою базу данных, чётко видит, что для её создания необходимо, как минимум: выделить различные свойства классифицируемой области, спроектировать таблицы (сущности), задать связи между ними, запрограммировать логику работы с базой данных, обеспечить вывод данных в виде инфографики, таблиц, списков и т.д.
База данных и её контент - это разные объекты авторского права.
Известно, что копирайт имеет абсолютное свойство, которое возникает с момента создания самого объекта, поэтому активисты движения за открытые данные используют лицензирование для того, чтобы обеспечить открытый доступ к данным своих проектов, причем, используя копилефт подход. Это значит, что открытый доступ должен быть обеспечен ко всем производным работам данной открытой работы. В нашем случае – это база данных. Например, весь индекс поисковика - это исходная база данных, а вот результат поиска - это уже производная база данных. Или другой пример, набор открытых данных о движении городского транспорта Минска - это исходная база данных, а выборка раписания для конкретного троллейбуса - это производная база. Ещё пример производных баз: это инфографика и таблицы с выборкой, построенные на основе текущей базы данных всех наград на странице сайта о наградах nagrady.by.
Резюме
В первой части мы дали определение «данным», «информации», «контенту», «базе данных». Такой подход открывает возможность разделять базу данных, её содержимое, понимать отличие данных и информации, что можно включить в понятие “контент”. База данных относится к объектам авторского права и однозначно требует лицензии. А вот с содержимым история сложнее.
Если содержимым (контентом) базы данных являются объекты авторского права (музыка, литературные, научные тексты, картинки), то они требуют дополнительного лицензирования. Если же содержимым базы данных являются данные в чистом виде, то здесь ключевым становится правовой режим получаемой с этих данных информации. Все эти категории необходимы для понимания основ лицензирования в сети. В следующей части мы рассмотрим несколько лицензий, которые на сегодня наиболее подходят для лицензирования баз данных.
Продолжение следует…
Михаил Волчек
Материал публикуется под лицензией Creative Commons BY-SA 4.0 International
Горячие темы