Искусственный интеллект компании ABBYY и волонтеры из 60 стран изучили историю Большого театра

Боль­шой те­атр и ком­па­ния AB­BYY оциф­ро­ва­ли 100 000 фо­то­гра­фий и 170 000 те­ат­раль­ных про­грамм и афиш. Ин­тел­лек­ту­аль­ные тех­но­ло­гии по­мог­ли из­влечь из них важ­ные дан­ные, а 7800 во­лон­те­ров со все­го мира вни­ма­тель­но про­ве­ри­ли и до­пол­ни­ли их. Ка­кие опе­ры и ба­ле­ты чаще все­го ста­ви­ли на сцене Боль­шо­го? Ка­ким го­дом да­ти­ру­ет­ся са­мая ста­рая оциф­ро­ван­ная афи­ша? И что чаще все­го за­бы­ва­ли в те­ат­ре на­ча­ла XX века? Рас­ска­зы­ва­ем об ито­гах че­ты­рех­лет­не­го ис­сле­до­ва­ния.




Про­ект под на­зва­ни­ем «От­крой ис­то­рию Боль­шо­го» на­чал­ся в 2016 году. Пред­ме­том ис­сле­до­ва­ния ста­ли до­ку­мен­ты му­зея Боль­шо­го те­ат­ра. Сна­ча­ла их от­ска­ни­ро­ва­ли, ис­поль­зуя про­фес­си­о­наль­ное обо­ру­до­ва­ние Fu­jitsu, а за­тем с по­мо­щью про­грам­мы AB­BYY FineReader рас­по­зна­ли тек­сты на них. Рас­по­знан­ные тек­сты про­ве­ри­ли во­лон­те­ры. В 2017–2018 го­дах ис­кус­ствен­ный ин­тел­лект AB­BYY из­влек из оциф­ро­ван­ных до­ку­мен­тов необ­хо­ди­мую ин­фор­ма­цию и со­здал на их ос­но­ве базу дан­ных, по­свя­щен­ную ис­то­рии Боль­шо­го те­ат­ра. Во­лон­те­ры сно­ва про­ве­ли про­вер­ку и до­пол­ни­ли ре­зуль­та­ты. Со­бран­ную ин­фор­ма­цию пе­ре­да­ли му­зею Боль­шо­го те­ат­ра для за­груз­ки на сайт элек­трон­но­го ар­хи­ва. В 2018–2019 го­дах во­лон­те­ры до­ба­ви­ли в базу дан­ных ру­ко­пис­ные тек­сты с обо­ро­тов фо­то­гра­фий. Поз­же эта ин­фор­ма­ция так­же по­явит­ся в элек­трон­ном ар­хи­ве.

Ра­бо­та про­дол­жа­ет­ся и сей­час. Со­труд­ни­кам му­зея Боль­шо­го те­ат­ра пред­сто­ит еще раз про­ана­ли­зи­ро­вать на­коп­лен­ную ин­фор­ма­цию, све­рить ее с ка­та­ло­га­ми по­ста­но­вок и пер­со­на­лий, а за­тем уточ­нить и до­пол­нить ее. Со­бран­ный мас­сив дан­ных бу­дет до­сту­пен на сай­те элек­трон­но­го ар­хи­ва му­зея. Сре­ди них: про­грам­мы, афи­ши, фо­то­гра­фии, эс­ки­зы де­ко­ра­ций и ко­стю­мов. Каж­дый смо­жет по­зна­ко­мить­ся с фак­ти­че­ской ин­фор­ма­ци­ей о про­хо­див­ших в Боль­шом те­ат­ре опе­рах и ба­ле­тах, а так­же о лю­дях, свя­зан­ных с ис­то­ри­ей те­ат­ра, — ар­ти­стах, ре­жис­се­рах, ком­по­зи­то­рах, ди­ри­же­рах, му­зы­кан­тах.

А пря­мо сей­час про­ект по­де­лил­ся неко­то­ры­ми лю­бо­пыт­ны­ми фак­та­ми из ис­сле­до­ва­ния. Все­го со­здан­ная база дан­ных со­дер­жит ин­фор­ма­цию о 75 ты­ся­чах пер­сон и 54 ты­ся­чах спек­так­лей. Со­бра­на ин­фор­ма­ция о 28 745 по­став­лен­ных в те­ат­ре опе­рах, 18 868 ба­ле­тах и 5 895 кон­цер­тах. На фо­то­гра­фи­ях со­хра­ни­лись 927 пред­став­ле­ний и 5 650 их участ­ни­ков. В топ-5 про­шед­ших на сцене Боль­шо­го опер во­шли «Ев­ге­ний Оне­гин» (его по­ста­ви­ли 1 907 раз), «Тра­виа­та» (1 487 раз), «Пи­ко­вая дама» (1 073 раза), «Ри­го­лет­то» (1 034 раза) и «Цар­ская неве­ста» (966 раз). Са­мый по­пу­ляр­ный ба­лет — «Ле­бе­ди­ное озе­ро» (1 691 по­ста­нов­ка). А са­мый рас­про­стра­нен­ный та­нец — ма­зур­ка. Ее стан­це­ва­ли 5 735 раз. Чаще все­го фо­то­гра­фи­ро­ва­ли Вла­ди­ми­ра Ва­си­лье­ва, Ра­и­су Струч­ко­ву и Майю Пли­сец­кую. Са­мая древ­няя афи­ша да­ти­ру­ет­ся 20 июня 1830 года. А сре­ди ве­щей, ко­то­рые по­се­ти­те­ли Боль­шо­го чаще все­го за­бы­ва­ли по­сле пред­став­ле­ний в кон­це XIX — на­ча­ле XX ве­ков, — муф­ты, ко­роб­ки с кон­фе­та­ми, порт­си­га­ры и пер­чат­ки.


Все са­мое ин­те­рес­ное в пре­де­лах ва­шей лен­ты — на стра­ни­це «Цеха» в Face­book и In­sta­gram