Модели, основанные на «расстояниях» между списками
Как же поступать в том случае, когда модель метода «групп» неадекватна реальной истории текста и, следовательно, построить стемму с помощью метода «групп» невозможно?
В этом случае встает проблема разработки других моделей, содержащих менее жесткие требования к отображению процесса копирования списков. Одна из моделей такого рода предлагается в упомянутой выше работе Фроже. Квадрат на плоскости - это фигура, которая с одной стороны очень простая, а с другой - очень сложная. Эта модель включает лишь одно предположение о характере процесса копирования: чем «ближе» по происхождению данная пара списков, тем меньше различий содержат тексты этих списков. Такая модель, очевидно, является более адекватной реальному процессу копирования списков древних произведений, чем рассмотренная выше модель.
Исходя из этой модели, Фроже предлагает метод построения формальной классификации списков, названный им «метод расстояний». «Расстояние» между каждой парой списков определяется следующим образом. Тексты каждой пары списков сравнивают между собой, подсчитывая количество различающихся вариантов текста. Полученное число называется расстоянием между i-м и j-м списками. Результаты такого попарного сличения имеющихся списков можно представить в виде квадратной матрицы R размером nхn, где n — количество списков. Очевидно, диагональ такой матрицы состоит из нулевых элементов.
Процедура метода «расстояний» практически совпадает с известным алгоритмом метода корреляционных плеяд. Определяя минимальный из элементов этой матрицы, не находящихся на диагонали, выделяют пару наиболее близких списков. Далее определяется минимальный из оставшихся недиагональных элементов матрицы и выделяется следующая пара близких списков и т. д., пока не исчерпаются все списки. Результаты такой процедуры изображаются на диаграмме, которая позволит увидеть «кучности» списков. Построенную таким образом классификацию списков можно изобразить в виде графа, в котором ребрами соединены близкие вершины (списки).