?

Log in

No account? Create an account

Previous Entry | Next Entry

Оригинал взят у klapauzius в история на коленке: от Теодомера до Шарлотты
А что, жж еще жив? Ну тогда вот.

Длинный пост (с картинками) про очередное домашнее исследование. На этот раз я взялся за любительскую историю.

Когда-то давно, читая лагерные воспоминания Евгении Гинзбург, я удивлялся столь тесному переплетению судеб различных личностей. Так, крутой маршрут свел ее с немецкой актрисой Каролой Неер, с женой Рыкова, с сестрой Камо, с женой Межлаука…

Миллионы разрозненных сведений о различных исторических событиях и персонах содержатся в разных хрониках, документах, мемуарах, и в общем и целом они нигде и никак не структурированы так, чтобы любой современный человек могбыстренько ими воспользоваться для своих насущных нужд.

Есть, конечно, специализированные картотеки, есть Википедия, но всё это сокращенное обобщение, грубо говоря, текст по основным топикам.

Представим, что кому-то хочется быстренько узнать список всех известных людей, которые были одновременно знакомы и с Пушкиным, и с Лермонтовым. Вот это уже проблема, это надо сводить пушкинистов и лермонтоведов, самому становиться специалистом, читать тонну труднодоступной литературы, просматривать картотеки, ну еще и не факт, что доберешься до всех нужных источников. При этом, хотя эти сведения, очевидно, существуют, они растворены в десятках текстах и не находятся по какому-нибудь простому запросу в гугле. Конечно, кто-то частично эту уже работу проделал http://goo.gl/CFXdvS, но ведь это единичный запрос из сотен подобных. Ну и хотелось бы иметь возможность сразу видеть источники этих сведений, быть уверенным в полноте и степени достоверности.

Или, допустим, цепь знакомств. Можно ли ее протянуть, скажем, от Сократа до того же Пушкина? По всей видимости, можно. Но чтобы ответить на этот вопрос, пришлось залезть в Википедию и часа три ее штудировать. Примерный вариант последовательности из 130 человек вышел таким:




Сократ → Платон → Аристотель → Александр Македонский → (Филипп III Арридей, Александр IV Македонский) → Кассандр → Антипатр I → (Деметрий I Полиоркет, Пирр) → Деметрий I Полиоркет → Стратоника Сирийская → Селевк I Никатор → Антиох I Сотер Антиох II Теос → Селевк II Каллиник → Антиох III Великий → Антиох IV Эпифан → (Антиох V Евпатор, Деметрий I Сотер) → Полибий → Птолемей V Эпифан → Птолемей VIII Эвергет → Птолемей X Александр I → Птолемей IX Сотер II → Птолемей XII Неос Дионис → Клеопа́тра VII Филопатор → Марк Антоний → Октавиан Август → Тиберий → Калигула → Клавдий → Нерон → Веспасиан → Домициан → Нерва → Траян → Адриан → Антонин Пий → Фаустина Младшая → Коммод → Септимий Север → Каракалла → Макрин → Диадумениан → Гелиогабал → Александр Север → Максимин I Фракиец → Гордиан II → Гордиан III → Филипп I Араб → Деций Траян → Гостилиан → Требониан Галл → (Марк Эмилий Эмилиан, Валериан I) → Галлиен → Аврелиан → (Ульпия Северина → Марк Клавдий Тацит → Марк Анний Флориан → Проб) → Марк Аврелий Кар → Диоклетиан → Галерий → Константин I Великий → Констанций II → Юлиан Отступник → Иовиан → Валентиниан I → Валент II → Феодосий I Великий → Амвросий Медиоланский → Аврелий Августин → Сикст III → Лев I (папа римский) → Гиларий (папа римский) → Симплиций (папа римский) → Феликс III (II) (папа римский) → Геласий I (папа римский) → Анастасий II (папа римский) → Симмах (папа римский) - Гормизд (папа римский) → Юстиниан I → Юстин II → Тиберий II → Маврикий (император) - Хосров II Парвиз → Кавад II → Ираклий I → Константин III Ираклий → Констант II → Константин IV → Юстиниан II → Филиппик → Иоанн VI (патриарх Константинопольский) → Григорий II → Лев III Исавр → Константин V → Лев IV Хазар → Ирина (византийская императрица) → Никифор I → Ставракий → Михаил I Рангаве → Лев V Армянин → Михаил II Травл → Феофил (византийский император) → Михаил III → Василий I Македонянин → Лев VI → Константин VII Багрянородный → Роман II (император Византии) → Анна Византийская → Владимир Святославич → Вышеслав Владимирович → Ярослав Владимирович Мудрый → Всеволод Ярославич → Владимир Всеволодович Мономах → Юрий Владимирович Долгорукий → Всеволод Юрьевич Большое Гнездо → Ярослав Всеволодович (князь владимирский) → Александр Ярославич Невский → Даниил Александрович → Иван I Данилович Калита → Иван II Иванович Красный → Дмитрий Иванович Донской → Василий I Дмитриевич → Василий II Тёмный → Иван III Васильевич → Василий III → Иван Грозный → Захарьин, Никита Романович → Филарет (патриарх Московский) → Михаил Фёдорович → Алексей Михайлович → Пётр I → Ганнибал, Абрам Петрович → Ганнибал, Осип Абрамович → (Пушкина, Надежда Осиповна) → Пушкин Александр Сергеевич.




Очевидно, впрочем, что это далеко не самая короткая и надежная, с точки зрения источников, цепочка. А как выявить самую короткую? Тут не обойтись без представления всех источников, событий и персон в виде заранее формализованных взаимосвязей и их последующей автоматизированной обработки. Но такого представления, увы, до сих пор нет.

В процессе построения связи между Сократом и Пушкиным я обнаружил, что у многих людей в Википедии прописано родство. В специальном вики-шаблоне описания персоны иногда указываются мать, отец, дети. Если члены семьи сами являются персонажами Вики, то это позволяет идти дальше и, страницу за страницей, вытаскивать цепочки родственных и брачных связей.

Ну что ж, хоть что-то, хоть как-то структурировано. Я скачал текст русской Википедии и обработал его. Оказалось, что у 30 тысяч персон (а это одна десятая всех людей, про которых есть вики-статья) те или иные члены семьи тоже попали в Википедию.

Насколько длинны эти цепочки родственных связей?

Подавляющее большинство связок тривиальны - это объединения двух-трех-четырех персон. Скажем, Александр Солженицын и его жена. Но есть, разумеется, и кластеры большого размера.

Наибольший интерес представляют длинные сети родственных взаимосвязей между историческими личностями. Оказалось, что на основе Рувики можно выделить 182 таких кластера с количеством членов от 10 человек.
Самый крупный и самый интересный из них - мегакластер на 12 тысяч человек - объединяет, преимущественно, членов монархических династий, их многочисленных потомков, а также семьи, с которыми они породнились.
В этот кластер, к примеру, входит и Карл Великий, и Рюрик, и Николай II, и Елизавета II, и даже Александр Сергеевич Пушкин.

Самый древний представитель этого кластера - Теодомер, вождь франков, он жил в 400-х годах нашей эры. Самой молодой представитель - внучка нынешней королевы Англии Елизаветы II Шарлотта, родившаяся менее года назад - в мае 2015. Она, кстати, является прямым потомком Теодомера. Между ними протянулась связь длинною в 73 поколения. Впрочем, это если идти по самой длинной цепочке прямых потомков. Можно найти между ними и более короткий путь, сократив число поколений и количество “пра” на два десятка.

К слову, Шарлотта Кембриджская является также прямым потомком Рюрика, Петра I и многих-многих других известных личностей.

Вот так выглядит схема, отображающая прямых предков Шарлотты: https://yadi.sk/i/1HgI-HKBmYrTM (более тысячи человек).

Этому мегакластеру исторически предшествует (однако, с точки зрения Вики, родственно с ним никак не связан) другой обширный кластер на 557 человек. Сюда входят, в частности, римские императоры и консулы. Этот кластер протянулся на 13 поколений. От Антигона I Одноглазого (300-е до н.э.) - полководца Александра Македонского - до Птолемея (царя Мавритании). Самой же близкой к нам по времени из этого кластера стала Домиция Лонгина, умершая в 120-х годах уже новой эры. Таким образом, два самых больших кластера отделяют друг от друга почти 300 лет.

Действительно ли на эти 300 лет прерывается родословная царствующих особ по всему фронту потомков? Существуют ли где-нибудь источники, которые позволят связать их? Может быть это просто Википедия еще не зафиксировала родственных связей между первым и вторым кластером, а какие-то историки хранят это тайное знание!

Третий по размеру кластер - это персонажи древнегреческой мифологии (216 мифических существ): родство, оказывается, бывает прописано и у сказочных персон.
Вот он, в сильно сокращенном виде (оставил лишь предков Одиссея). Здесь и далее имена персон приведены в виде названия соответствующих им вики-статей:



Раз уж зашла речь про мифологию, приведу и родственные связи между древнеегипетскими божествами, зафиксированные русской Википедией (12-й по размеру кластер - 44 божества):



Четвертый по размеру кластер - 111 человек - связывает грузинские княжеские рода. Пятый и седьмой кластеры - династии королевств и княжеств Уэльса (79 + 70 человек). Шестой - потомков Тимура, султанов и падишахов (74 человека). Восьмой кластер - это библейские персонажи (Иаков, Моисей и т. д.) - 65 человек.

Итак, видно, что когда информация о родственных связях перешла из простого текста в связную структуру, то стало возможным легко и быстро выяснять всякие интересные штуки. Например, находить кратчайшие родственные связи между персонами.




Для Петра I и Пушкина кратчайшая родственная связь выглядит так:
'Пётр I' -> 'Анна Петровна' (дочь) -> 'Пётр III' (сын) -> 'Павел I' (сын) -> 'Николай I' (сын) -> 'Михаил Николаевич' (сын) -> 'Михаил Михайлович' (сын) -> 'Меренберг, София Николаевна' (жена) -> 'Пушкина, Наталья Александровна' (мать) -> 'Пушкин, Александр Сергеевич' (отец)




Петр I был прапрапрадедом человека, который женился на внучке Пушкина.
Де Торби Анастасия Михайловна по отцу — правнучка императора Николая I, по матери — правнучка А. С. Пушкина.

А вот картинка, демонстрирующая кратчайшую родственную связь Ивана Грозного (1530-1584) и Елизаветы I (1533-1603), с которой он состоял в переписке.



Елизавета I и Иван Грозный являются прямыми потомками Маргариты Женевской и ее супруга Томаса I (графа Савойи), ну, если верить Википедии, конечно. Интересно, что, в отличие от Ивана Грозного, Елизавета I является потомком этой пары сразу по нескольким путям. Ну и, конечно, и Елизавета I, и Иван Грозный еще являются и потомками Ярослава Мудрого, но связь через Маргариту Женевскую намного короче.

Кстати, интересно, что несмотря на то, что последним из рода Рюриковичей среди российских правителей считается Василий IV Шуйский, прямые потомки Рюрика вернулись на российский престол и после его царства. Так прямым потомком Рюрика является Петр III, через своего отца - Карла Фридриха Гольштейн-Готторпского и, соответственно, ими являются и все последующие правители, вплоть до Николая II.

На выстроенной схеме родственных отношений стали мгновенно видны сотни ошибок и неточностей в заполнении Вики. Это и спутывание персон, которые в чем-то сходны по имени (например: указывается Пётр III вместо Пётр III (король Кипра)); это петли родственных связей, когда, к примеру, внук человека одновременно указан и его отцом, это и проставление родственных связей на основе бредовых источников (приходилось исправлять статьи, где ребенок рождался через десятилетия после смерти родителя, а иногда и до его рождения).


Так Ги II де Шатильон-Сен-Поль, согласно Рувики, являлся одновременно внуком и отцом Гоше III. (это далеко не единичный случай “петель”. Чаще всего они тянутся сразу через много поколений).


Очевидно, что можно легко выявлять персоны, для которых указано более двух родителей, или, например, однополых родителей. В целом же набор правил, которым должны удовлетворять родственные связи, довольно очевиден. И по каждому правилу легко можно найти примеры ошибочного заполнения Вики.
Есть также и неопределенности считывания текстовых данных. Например, вот так выглядит фрагмент генеалогического древа Калигулы (12-41гг н.э.):



Видно, что родители Калигулы были троюродными братом и сестрой. Но вот их общие прабабушка и прадедушка являются детьми сразу трех человек. Однако никакой ошибки тут нет: Луций Марций Филипп просто был приемным отцом Октавии Младшей и Октавиана Августа. К сожалению, автоматизированно выявлять такие случаи описания родственных связей довольно сложно, а иногда и попросту невозможно.

Намного эффективнее было бы изначально заносить родственные взаимосвязи не в простом текстовом виде, а при помощи специализированной надстройки, которая бы проверяла их корректность. Ну и позволяла бы, разумеется, в качестве бонуса строить любые фрагменты генеалогических деревьев, экспортировать их в открытые форматы.
На этом оставим генеалогию - она была лишь небольшим пояснением того, какие бонусы обычному человеку могло бы принести простое структурирование исторических материалов, вводимых на основе различных источников армией добровольцев.

Уверен, что тогда бы многие исторические находки были бы не уделом энциклопедистов, которым довелось прочитать некоторые редкие материалы и обнаружить в них противоречия (или дополнения), а происходили бы в результате автоматизированных формальных проверок.

Разумеется, родственные связи - это лишь жалкая часть того, что действительно стоило бы структурировать. Просто повезло, что в какой-то мере они расписаны уже сейчас.

Если бы существовал сервис, по типу Википедии, который позволял бы заносить различные варианты взаимосвязей между персонами, событиями, местами, на основе конкретных источников, то это позволило бы быстро определять историческую канву по любой стране, любому времени и любым персонам; определять, кто и на кого оказывал влияние. Можно было бы проверять различные версии событий, их последовательность; уточнять даты. Представить зафиксированные источниками сведения в виде наиболее непротиворечивой и взаимосвязанной структуры. Выявлять иерархии отношений, триггерные события и т. д. Ну и в дополнение оценивать качество источников по степени их согласованности и многое другое.

Ну раз сервиса не существует, то, наверное, пришла пора его создать :)

Comments

( 4 comments — Leave a comment )
bvg_bg
Jun. 14th, 2016 07:50 am (UTC)
Один мой знакомый для работы по политическому PR предложил такую структуру базы данных для накопления и анализа информации:
- Персоны
- Структуры
- Процессы
Интересно, что совсем другой человек управлял бизнесом немаленького холдинга с помощью данных структурированных абсолютно аналогично:
- Персоны
- Компании
- Проекты
Думаю, что при анализе власти (в определении Хазина-Щеглова) именно такая структура данных будет наиболее эффективной.

palaman
Jun. 14th, 2016 07:55 am (UTC)
Третий пункт - проекты/процессы - для меня не совсем понятен. Я мыслю персонами и структурами. Я упускаю что-то важное?
bvg_bg
Jun. 14th, 2016 08:04 am (UTC)
Власть проявляет себя через какие-то действия. Вот эти действия и можно формализовать как проекты/процессы. Кроме того, если мы будем учитывать связи людей только через структуры (включая семью и школу), мы всех связей не отловим. А главное, наверняка упустим суть и даже иерархию взаимоотношений.
(Я к сожалению не имел возможности прочитать книгу Щеглова и Хазина, но подозреваю, что они тоже не включили в предмет своего рассмотрения эту третью составляющую анализа)

Edited at 2016-06-14 08:07 am (UTC)
kodeam
Jun. 15th, 2016 08:28 am (UTC)

Вам бы не Википедию обрабатывать, а Родовод.

( 4 comments — Leave a comment )