«Расстояния» между списками

вкл. .

В другой модели аналогичного типа содержится более конкретное предположение о близости происхождения списков: чем меньше различий содержат тексты со стеммой, полученной с помощью метода «групп», видим, что основные различия в них связаны с наличием «пустых кружков», отражающих возможность существования потерянных списков. В основных чертах эти стеммы близки.

Отметим принципиальные отличия методов построения классификации списков, использующих матрицу близости текстов списков, от метода «групп». В отличие от указанных методов метод «групп» максимально использует информацию о разночтениях. Для того, чтобы не перемножая сказать сколько нулей будет в произведении нужно подсчитать число двоек и пятерок в нем. При этом логическая процедура построения генеалогического древа списков реализуется лишь при условии выполнения довольно жестких требований к характеру соотношений между разночтениями (т. е. при отсутствии «аномалий»).

Методы же, использующие матрицу близости списков, гарантированно приводят к построению классификации списков. Однако эти методы имеют тот же недостаток, что и метод корреляционных плеяд, который «очень прост и нагляден. Но так как в его процедурах учитываются только отдельные максимальные, а не средние связи между плеядами, то в приложениях этот метод дает удовлетворительные результаты лишь в самых простых ситуациях».

Это замечание относится к обоим указанным методам, использующим матрицу близости списков. Так, при применении алгоритма построения покрывающего дерева графа максимальной общей длины часто приходится выбирать одно максимальное число из нескольких очень близких по величине; при этом ничтожному превышению величины выбранного элемента над остальными «претендентами» приписывается решающее значение. В том случае, когда такое превышение носит случайный характер, алгоритм приводит к существенным искажениям в структуре связей списков на стемме.

Таким образом, построенные с помощью рассмотренных методов классификации списки, будучи весьма «детальными», являются в то же время недостаточно надежными. Путь к построению более надежных формальных классификаций списков лежит через использование новых методов, ориентированных на агрегированное, укрупненное представление информации о структуре взаимосвязей.

 

Оставь комментарий первым