Открой историю Большого

21.06.2017

Большой театр и ABBYY приглашают волонтеров открыть историю Большого и сделать ее доступной для широкой публики! Более четырех тысяч волонтеров из шестидесяти стран уже оцифровали уникальный архив Большого театра: обработаны сорок восемь тысяч афиш, сто двадцать тысяч программок и сто тысяч фотографий Большого театра. Стартует второй этап проекта: его задача – помочь извлечь и упорядочить данные из уже оцифрованной коллекции программ и афиш театра.

21 июня 2017 г. Большой театр и компания ABBYY (при участии КАМИС) объявляют о старте второго этапа уникального волонтерского проекта «Открой историю Большого» (openbolshoi.ru). Его участникам предстоит помочь в одной из самых ответственных частей проекта – извлечь и систематизировать данные из уже оцифрованной коллекции программ и афиш театра. Именно эта информация будет передана сотрудникам музея для научного анализа и последующей загрузки в создаваемую Большим театром электронную базу данных КАМИС.

Благодаря современным технологиям и при участии волонтеров эта задача может быть решена гораздо быстрее. В результате каждый сможет увидеть афиши и программы с именами знаменитых солистов, узнать какие оперы и балеты ставились на сцене театра чаще всего, что входило в его репертуар в конце XIX века, в годы Великой Отечественной войны и многое другое. В коллекции музея Большого театра – более сорока восьми тысяч афиш, ста двадцати тысяч программок и ста тысяч фотографий.

Сотрудники музея начали вручную вводить информацию из них в базу данных, но стало понятно, что эта работа может занять годы. При помощи технологий ABBYY и участии волонтеров она может быть сделана в более короткие сроки.

В октябре 2016 г. стартовал первый этап волонтерского проекта «Открой историю Большого». Сначала все документы были отсканированы и распознаны программой ABBYY FineReader. Более четырех тысяч участников из шестидесяти стран проверяли результаты распознавания, чтобы исключить ошибки, возможные при оцифровке. Проект объединил людей самых разных специальностей: программистов, ИТ-специалистов, учителей, фотографов, журналистов, руководителей компаний, историков, художников, артистов и многих других. Благодаря их помощи, оцифровать весь объем распознанных документов удалось в рекордно короткие сроки: всего за шесть месяцев.

В процессе работы волонтеры нашли немало интересных фактов из истории Большого театра, неизвестных широкой аудитории. Например, Екатерина II писала либретто комических опер со сказочными сюжетами, и в XIX веке эти представления давались в театре. Двадцатилетний Леонид Собинов пел на сцене Большого в составе хора студентов Московского университета в 1897 году, а в 1937 году одиннадцатилетняя Майя Плисецкая исполняла партию Кошечки в спектакле «Аистенок» Хореографического училища при Большом театре. Кроме того, участники волонтерского проекта узнали, что 4 декабря 1881 г. в Большом театре состоялся спектакль «Дама с камелиями», в котором блистала Сара Бернар со своей труппой.

Теперь стартует второй этап волонтерского проекта. Его задача – помочь извлечь и упорядочить данные из уже оцифрованной коллекции программ и афиш театра. На этом этапе задействован целый комплекс технологий ABBYY. Интеллектуальная технология понимания и анализа текстов на естественных языках ABBYY Compreno анализирует текст документов, распознанных и проверенных волонтерами на первом этапе. Какого бы формата они ни были, как бы ни располагалась важная информация в программах и афишах, ABBYY Compreno находит имена и понимает, какую роль играл каждый участник постановки: исполнитель, автор либретто, композитор и т.д. Затем технология извлекает ценную информацию в конкретные поля базы данных, по которым в дальнейшем можно будет быстро найти ее в электронном архиве. Полученные данные направляются волонтерам на проверку.

Решение для потокового ввода данных и документов ABBYY FlexiCapture представляет эту информацию в удобной для редактирования форме и позволяет быстро проверить результаты и внести дополнительные данные, просто выделяя текст мышкой прямо на изображении документа. Информация, верифицированная волонтерами через веб-интерфейс ABBYY FlexiCapture в несколько этапов, будет загружена в музейную базу данных КАМИС и с ней начнут работать сотрудники музея. Им предстоит серьезная научная работа: проанализировать полученные данные, сверить их с каталогами опер, балетов, постановок, спектаклей и персоналий – уточнить, дополнить и расширить их.

По мере работы все программки, афиши, фотографии и информация из справочников будут постепенно выкладываться на сайт Большого театра в раздел «Электронный архив» с удобной поисковой системой, разработанной компанией КАМИС, и станут доступны всем.

Волонтером может стать каждый. Для этого достаточно зарегистрироваться на сайте www.openbolshoi.ru и следовать инструкциям. За каждый проверенный пакет документов волонтерам начисляются баллы. Самые активные участники проекта получат билеты на спектакли Большого театра и другие призы.

«Начиная эту работу, мы и сами не могли предполагать, какой живой отклик этот кропотливый труд вызовет у наших друзей – у тех, кто любит Большой. Приятно констатировать, что мы идем, не отставая от графика, и уже приступаем ко второму этапу нашего проекта», – комментирует Владимир Урин, генеральный директор Большого театра. Следить за новостями проекта «Открой историю Большого» можно на официальных страницах в Facebook и «Вконтакте». Технологическим партнерам также выступает NetApp, предоставляющая на период проекта решение для хранения обрабатываемых данных.

Информационные партнеры проекта: агентство «Россия Сегодня», телеканал Россия 24, радио «Маяк».

О первом этапе проекта. Пресс-релиз

О компании ABBYY

Компания ABBYY – ведущий мировой разработчик решений в области интеллектуальной обработки информации и лингвистики. Более 40 миллионов пользователей и десятки тысяч организаций свыше чем в 200 странах мира используют решения ABBYY для автоматизации трудоемких задач, что позволяет экономить время, повышать эффективность бизнес-процессов и конкурентоспособность.

Стратегия ABBYY – разработка лидирующих технологий искусственного интеллекта для задач бизнеса. На базе технологий компании созданы решения, которые позволяют на качественно новом уровне распознавать тексты, работать с бумажными и PDF документами, вводить данные в информационные системы предприятий, анализировать информацию, осуществлять корпоративный семантический поиск, находить переводы незнакомых слов и фраз, оказывать услуги перевода и другое.

Технологии и решения ABBYY признаны во всем мире. Их лицензируют крупнейшие международные ИТ-компании, а также производители решений для распознавания текстов и потокового ввода данных: EPSON, Fujitsu, Samsung, Panasonic, Sharp, Acer, KnowledgeLake, Microsoft и другие.

Штаб-квартира группы ABBYY находится в Москве, головные офисы – в Северной Америке, Европе и Восточной Европе (Украина). Среди региональных офисов ABBYY: 3А (Азия, Африка, Южная Америка), Австралия, Великобритания, ОАЭ, Испания, Канада, Кипр, Россия, Тайвань, Франция, Япония. В группу компаний также входят высокотехнологичная лингвистическая компания ABBYY Language Solutions. В шестнадцати международных компаниях группы ABBYY работают свыше тысячи двухсот пятидесяти сотрудников.

Более подробная информация доступна на сайтах компании: www.ABBYY.ru и www.abbyy-ls.ru.

ABBYY, ABBYY FineReader, ABBYY Lingvo, ADRT, Compreno, FlexiCapture, Lingvo, FormReader, FineReader и DOCFLOW являются зарегистрированными товарными знаками либо товарными знаками ABBYY Software Ltd. Остальные упомянутые товарные знаки являются товарными знаками или зарегистрированными товарными знаками своих законных владельцев.