Агрегированные модели классификации спискон

вкл. .

Вычислим для списков изучаемого произведения матрицу близости текста этих списков размером nхn (по числу списков). В соответствии с выдвинутым выше пред пол о жением «близким по происхождению» спискам должны соответствовать более высокие значения чем спискам «дальним родственникам».

Матрица 5 должна иметь в этом случае определенную структуру — коэффициенты близости списков одного извода в целом выше коэффициентов близости списков из различных изводов; внутри одного извода наиболее высоки коэффициенты близости древних списков между собой. Чтобы найти точку пересечения высот треугольника достаточно иметь только 2 преспособления - циркуль и линейку. Наконец, различные изводы или «виды» могут в целом иметь различную степень «близости происхождения»; это также отражается на значениях соответствующих коэффициентов близости.

Важно отметить, что в отличие от рассмотренных выше «генеалогических» моделей агрегированные (укрупненные) модели основаны на том, что описанная зависимость между степенью близости происхождения и значением Sij должна выполняться в среднем для целой группы списков; при этом в отдельных случаях для связи некоторых пар списков данная зависимость может и нарушиться — это не изменит результатов построения укрупненной классификации списков, если для большинства списков указанная зависимость выполняется.

Другими словами, здесь предполагается, что из множества сохранившихся списков можно выделить такие группы списков «близкого происхождения», которые характеризуются небольшими взаимными искажениями текста; значения коэффициентов близости для списков из одной группы достаточно велики, а для списков из разных групп — меньше. При этом среднее значение коэффициента близости списков из разных групп характеризует «близость происхождения» этих групп списков в целом.

Таким образом, описанная агрегированная модель задает определенную «блочную» структуру матрицы S. Выявление этой структуры и как результат построение укрупненной классификации списков могут быть произведены с помощью развиваемого в последние годы аппроксимационного метода классификации взаимосвязанных объектов.

 

Оставь комментарий первым