Археологический источник и база данных. Выбор модели. (3050-1)

Посмотреть архив целиком

Археологический источник и база данных. Выбор модели.

Ю.А. Лихтер

По замечанию И.М. Гарсковой, историки, специалисты по письменным источникам, знакомство с компьютером начинают, как правило, с создания персональных архивов машиночитаемых данных[1]. Может быть, поэтому немалое внимание исследователи уделяют теоретическому осмыслению возникающих при этом проблем. Выделены основные типы источников - свободные и жестко структурированные (формулярные)[2] и основные типы подходов - методо-ориентированный и источнико- ориентированный[3]. Проанализирована совместимость источников различных типов со стандартными СУБД, создано специальное программное обеспечение - например, KLEIO и SOCRATES.

Несколько по-иному обстоит дело в археологии. В первую очередь в компьютер вводится полевая документация - отчеты и чертежи. Базы данных используются в качестве вспомогательного средства, преимущественно для ввода полевых описей. Практикуется также составление списков вещей, используемых при решении какой либо проблемы - так называемые проблемно-ориентированные базы. При этом специфика археологических источников не учитывается, виды СУБД подбираются случайно. Однако проектирование баз данных предполагает знание специфики материала и осознание поставленных задач[4].

Учитывая уже сделанное в исторической информатике для письменных источников, при работе с археологическими источниками, в первую очередь, необходимо ответить на следующие вопросы:

Что собой представляет археологический источник? Какова степень его структурированности? Какой тип СУБД предпочтительнее? Какой подход выбрать - источнико- или методо-ориентированный?

Начнем с определения объекта исследования и характера источника. Объектом исследования археологии являются древние вещественные источники[5]. Основными среди них являются культурный слой, сооружения, находки [6].

Также как и письменные источники, вещественные источники сами по себе не дают полной и адекватной картины прошлой действительности; они тоже отражают жизнь односторонне, избирательно, зачастую неупорядоченно; и они нуждаются в осмыслении... [7]. Однако возможности осмысления ограничиваются тем, что, как следует из самого названия, в источниках этого рода информация дана в вещественном виде. Чтобы можно было ею пользоваться, информацию необходимо преобразовать [8].

Первой формой преобразования является рисунок, который принято считать наиболее информативным [9]. Тем не менее, информация, содержащаяся в рисунке, всегда ограничена - можно показать форму и, иногда, конструкцию; такие важные параметры, как техника изготовления и химический состав материала отразить на них очень сложно. Оперирование рисунками удобно при подборе сходных вещей, но при этом нет возможности установить критерии сравнения, а следовательно нельзя перейти к их изучению. Информацию, содержащуюся в вещи, необходимо перевести из вещественной в словесную форму [10]. Единственной формой такого преобразования является словесное описание вещи. Правильно составленное описание дает исследователям возможность получать сведения о находках из описания, не обращаясь каждый раз к вещи [11]. В результате описания как бы создается новый источник, являющийся основой для решения конкретных научных задач.

Описание может быть образным и аналитическим. Задача образа - дать представление о предмете, в ходе аналитического описания осуществляется перевод в достаточно точно определенные логические понятия.

Чтобы получить представление о предмете, специалисту достаточно его обобщенного названия, например - "стеклянный кубок типа Ковальк", "фибула - тип 51 по Петерсену". Для пояснений используется рисунок.

Основой аналитического описания является набор признаков[12]. Наиболее широко распространен интуитивный (свободный) отбор, при котором фиксируются наиболее заметные признаки, причем в пределах одного списка в одних случаях фиксируется только форма, в других - цвет, материал, наличие или отсутствие декора. С помощью такого рода описаний довольно просто идентифицировать находки, но невозможно их сравнивать и изучать. По сути, это такой же не подвергаемый анализу образ вещи, как и рисунок. Такое описание имеет вид свободного текста.

В последние годы были сформулированы принципы описания по системе заранее заданных признаков [13]. Наличие заданного набора признаков сближает такие описания с формулярными письменными источниками. Хотелось бы отметить и некоторые различия. Как пишет М. Таллер, "...трудновато будет спросить кого-либо, родившегося в XVI веке о месте его рождения, если он не был жёстко обязан в свое время вписать эти сведения в соответствующем документе"[14]. При работе с вещами мы можем получить нужные нам сведения после проведения соответствующих анализов: морфологического, технологического, анализа состава, причем они не обязательно проводятся одновременно. Полученная при этом информация может быть легко поставлена на отведенное для нее место без нарушения общей структуры описания.

Следующим этапом работы с признаками является их оценка[15]. Здесь возможны следующие подходы: при одном вес признака оценивается по частоте встречаемости в конкретной выборке[16], при другом - математическому подсчету связей и корреляций признаков предшествует их анализ на содержательном и логическом уровне [17]. Логический анализ признаков позволяет не только выявить набор, но и выстроить иерархию в сответствии с глубиной описываемого каждым признаком понятия. При этом можно выбрать соответствующий уровень детализации.

Можно говорить, что в первом случае сложность объекта рассматривается как неорганизованная, а во втором - сложность имеет иерархически организованную структуру[18].

В исторической информатике используется две основных модели - источнико-ориентированная и методо- ориентированная.

Задача источнико-ориентированной модели - максимально бережное сохранение структуры и текста первичного источника[19]. Работа с источником разделяется - с одной стороны транскрипция источника, с другой - создание логической системы оценки данных. Именно такая модель реализована в СУБД KLEIO[20].

Методо-ориентированная модель предполагает использование строго и точно определенных содержательных категорий[21]. Это помогает более четко поставить исследовательскую задачу и сформулировать требования к данным[22].

Какой же из этих подходов предпочтительней при работе с вещественными источниками? "Буквальный" перевод в машиночитаемую форму, отделение "буквального" воспроизведения источника в памяти и логической системы интерпретации данных[23], для археологического источника неосуществимы - "перевод с языка вещей на словесный язык" это уже создание модели. В ходе перекодировки информации создается модель источника, зависящая от логической системы оценки данных, которая, в свою очередь, напрямую зависит от оценки материала и принятых автором теоретических установок. Иными словами, уже на этапе обработки исходного материала археолог имеет дело с моделью. При проектировании баз данных он, фактически, имеет дело с моделью модели. В результате в память машины вводится не источник, а его модель, которая зависит от взглядов исследователя и применяемых им методов. Вследствие этого для археолога, в отличие от "чистого" историка, работающего с письменными источниками, предпочтительнее ориентация на метод, а не на источник.

Таким образом, выбор между KLEIO и реляционными базами связан не с выбором подхода (источнико- или методо- ориентированного), а с методами работы с признаками. Вероятно, при ориентации на образ вещи тип СУБД безразличен. Столь же безразлично при этом, идет ли речь о полевой описи или проблемно-ориентированном списке вещей. При статистико-комбинаторном подходе более удобны KLEIO и другие иерархические СУБД. Они обеспечивают легкость и быстроту поиска различных признаков, подсчет частоты их встречаемости и корреляций.

Классифицирование признаков и разделение их по нескольким рубрикам (подсистемам) описания дает возможность раздробить информацию о вещи на несколько файлов, что позволяет исследователю при работе иметь в поле зрения именно те подсистемы, которые необходимы при решении поставленных задач. При такой организации материала удобнее реляционные СУБД. Существенным свойством реляционных СУБД является возможность корректировки структуры и при необходимости добавления данных.

В заключение коротко подведем итоги:

Вещественность источника предполагает уже на этапе первичной обработки создание его модели. Возможны как образная, так и аналитическая модели.

Аналитическая модель имеет вид списка признаков, что сближает ее с формулярными источниками. Для статистического выделения и оценки признаков более удобны иерархические базы, при логико-классификационном - реляционные.

При выборе модели БД сама специфика источника вынуждает применять подход, ориентированный на метод. Чтобы получить возможность изучать вещи, информацию нужно перекодировать дважды: перевести с языка вещей на естественный язык и с него на язык истории как науки [24]. Эта перекодировка зависит от теоретических и методических установок исследователя.

Список литературы

1.Гарскова И.М. Базы и банки данных в исторических исследованиях. М., 1994., с.55.

2.Там же, с.95.

3.Там же, с.89.; Таллер М., Что такое "источнико-ориентированная база данных"; что такое "историческая информатика"?//История и компьютер: новые технологии в исторических исследованиях и образовании. Под ред. Л.И.Бородкина и В.Левермана. Goettingen, 1993., с.5.






Чтобы не видеть здесь видео-рекламу достаточно стать зарегистрированным пользователем.
Чтобы не видеть никакую рекламу на сайте, нужно стать VIP-пользователем.
Это можно сделать совершенно бесплатно. Читайте подробности тут.