RDT1C/DataProcessors/ирАнализДанных/Templates/ТипыАнализа/Ext/Template.xml
Администратор 821b179fdd .
2021-09-11 20:58:02 +03:00

302 lines
20 KiB
XML
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

<?xml version="1.0" encoding="UTF-8"?>
<document xmlns="http://v8.1c.ru/8.2/data/spreadsheet" xmlns:style="http://v8.1c.ru/8.1/data/ui/style" xmlns:v8="http://v8.1c.ru/8.1/data/core" xmlns:v8ui="http://v8.1c.ru/8.1/data/ui" xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<languageSettings>
<currentLanguage>ru</currentLanguage>
<defaultLanguage>ru</defaultLanguage>
<languageInfo>
<id>ru</id>
<code>Русский</code>
<description>Русский</description>
</languageInfo>
<languageInfo>
<id>en</id>
<code>Английский</code>
<description>Английский</description>
</languageInfo>
<languageInfo>
<id>uk</id>
<code>Украинский</code>
<description>Украинский</description>
</languageInfo>
</languageSettings>
<columns>
<size>2</size>
<columnsItem>
<index>0</index>
<column>
<formatIndex>1</formatIndex>
</column>
</columnsItem>
<columnsItem>
<index>1</index>
<column>
<formatIndex>2</formatIndex>
</column>
</columnsItem>
</columns>
<rowsItem>
<index>0</index>
<row>
<c>
<c>
<f>3</f>
<tl>
<v8:item>
<v8:lang>ru</v8:lang>
<v8:content>Имя</v8:content>
</v8:item>
</tl>
</c>
</c>
<c>
<c>
<f>4</f>
<tl>
<v8:item>
<v8:lang>ru</v8:lang>
<v8:content>Описание</v8:content>
</v8:item>
</tl>
</c>
</c>
</row>
</rowsItem>
<rowsItem>
<index>1</index>
<row>
<c>
<c>
<f>0</f>
<tl>
<v8:item>
<v8:lang>ru</v8:lang>
<v8:content>АнализДанныхДеревоРешений</v8:content>
</v8:item>
</tl>
</c>
</c>
<c>
<c>
<f>5</f>
<tl>
<v8:item>
<v8:lang>ru</v8:lang>
<v8:content>Строит иерархическую структуру классифицирующих правил, представленную в виде дерева.
Для построения дерева решений необходимо выбрать целевой атрибут, по которому будет строиться классификатор, и ряд входных атрибутов, которые будут использоваться для создания правил. Целевой атрибут может содержать, например, информацию о том, перешел ли клиент к другому поставщику услуг, удачна ли была сделка, качественно ли была выполнена работа и т. д. Входными атрибутами, например, могут выступать возраст сотрудника, стаж его работы, материальное состояние клиента, количество сотрудников в компании и т. п.
Результат работы анализа представляется в виде дерева, каждый узел которого содержит некоторое условие. Для принятия решения, к какому классу следует отнести некий новый объект, необходимо, отвечая на вопросы в узлах, пройти цепочку от корня до листа дерева, переходя к дочерним узлам в случае утвердительного ответа и к соседнему узлу в случае отрицательного. Набор параметров анализа позволяет регулировать точность полученного дерева.
Ошибки классификации показывают, в каких случаях полученные правила расходятся с «действительностью» (исходной выборкой данных). Упрощение дерева заключается в том, что по определенным правилам
(формулам, которые будут рассмотрены ниже) узлы дерева превращаются в листья (отсекается «лишнее» ветвление).</v8:content>
</v8:item>
</tl>
</c>
</c>
</row>
</rowsItem>
<rowsItem>
<index>2</index>
<row>
<c>
<c>
<f>0</f>
<tl>
<v8:item>
<v8:lang>ru</v8:lang>
<v8:content>АнализДанныхКластеризация</v8:content>
</v8:item>
</tl>
</c>
</c>
<c>
<c>
<f>5</f>
<tl>
<v8:item>
<v8:lang>ru</v8:lang>
<v8:content>Разделяет исходный набор исследуемых объектов на группы объектов таким образом, чтобы каждый объект был более схож с объектами из своей группы, чем с объектами других групп. Анализируя в дальнейшем полученные группы, называемые кластерами, можно определить, чем характеризуется та или иная группа, принять решение о методах работы с объектами различных групп. Например, при помощи кластерного анализа можно разделить клиентов, с которыми работает компания, на группы, для того, чтобы применять различные стратегии при работе с ними.
При помощи параметров кластерного анализа пользователь может настроить алгоритм, по которому будет производиться разбиение, а также может динамически изменять состав характеристик, учитываемых при анализе, настраивать для них весовые коэффициенты.
Результатами анализа с помощью кластеризации являются:
 центры кластеров, представляющие собой совокупность усредненных значений входных колонок в каждом кластере;
 таблица межкластерных расстояний (между центрами кластеров), определяющих степень различия между ними;
 значения прогнозных колонок для каждого кластера;
 рейтинг факторов и дерево условий, определивших распределение объектов на кластеры.
Результат кластеризации может быть выведен в дендрограмму специальный вид диаграммы, предназначенный для графического отображения результатов кластерного анализа.</v8:content>
</v8:item>
</tl>
</c>
</c>
</row>
</rowsItem>
<rowsItem>
<index>3</index>
<row>
<c>
<c>
<f>0</f>
<tl>
<v8:item>
<v8:lang>ru</v8:lang>
<v8:content>АнализДанныхОбщаяСтатистика</v8:content>
</v8:item>
</tl>
</c>
</c>
<c>
<c>
<f>5</f>
<tl>
<v8:item>
<v8:lang>ru</v8:lang>
<v8:content>Механизм для сбора общей информации о данных, находящихся в полученном источнике данных. Этот тип анализа предназначен для предварительного исследования анализируемой информации. При выводе отчета в табличный документ заполняются круговые диаграммы для отображения состава полей. Для колонок разных видов предусмотрено получение различной информации.
Дискретные данные:
 Количество значений. Количество значений, встреченных в колонке
источника данных (Null значением не считается);
 Количество уникальных значений;
 Мода. Значение, которое в источнике данных встречается наиболее часто. Если данных несколько значений, встречаемых с одинаковой частотой, в качестве моды берется первое найденное;
 Частота. Количество значений в выборку данных;
 Относительная частота. Определяется как отношение количества вхождения значения к общему количеству значений;
 Накопленная частота. Считается как сумма частоты значения и сумма
частот предыдущих значений выборки данных;
 Накопленная относительная частота. Считается как сумма накопленной частоты значения и сумма относительных частот предыдущих значений;
Непрерывные данные:
 Количество значений;
 Минимум значений;
 Максимум значения;
 Среднее;
 Размах. Разность между максимальным и минимальным значениями;
 Стандартное отклонение (среднеквадратичное отклонение);
 Медиана. Значение, лежащие в середине выборки.
Если анализируется одновременно несколько полей различных видов, их анализ проводится вне зависимости друг от друга.</v8:content>
</v8:item>
</tl>
</c>
</c>
</row>
</rowsItem>
<rowsItem>
<index>4</index>
<row>
<c>
<c>
<f>0</f>
<tl>
<v8:item>
<v8:lang>ru</v8:lang>
<v8:content>АнализДанныхПоискАссоциаций</v8:content>
</v8:item>
</tl>
</c>
</c>
<c>
<c>
<f>5</f>
<tl>
<v8:item>
<v8:lang>ru</v8:lang>
<v8:content>Ищет часто встречаемых вместе групп объектов или значений характеристик, а также производит поиск правил ассоциаций. Поиск ассоциаций может использоваться, например, для определения часто приобретаемых вместе товаров или услуг.
Этот тип анализа может работать с иерархическими данными, что позволяет, например, находить правила не только для конкретных товаров, но и для их групп. Важной особенностью этого типа анализа является возможность работать как с объектным источником данных, в котором каждая колонка содержит некоторую характеристику объекта, так и с событийным источником, где характеристики объекта располагаются в одной колонке.
С точки зрения данного типа анализа колонки источника можно разделить на:
 Неиспользуемая. Игнорируются анализом;
 Объект. Данные из этой колонки используются как объекты (или события) проводимого анализа. Исходя из значения данной колонки значения другой колонки (Элемент) относятся к одной ассоциируемой группе;
 Элемент. Данные из этой колонки используются для получения устойчивых значений, построения ассоциативных правил.
Параметры анализа:
 МинимальныйПроцентСлучаев. Определяется минимальный процент случаев, в которых должна встречаться комбинация элементов. Группы, у которых данное значение меньше указанного, не попадает в результат анализа;
 МинимальнаяДостоверность. Показывает минимальное значение процента случаев, когда правило соблюдаются;
 МинимальнаяЗначимость. Группы, у которых данное значение меньше указанного, не попадают в результат анализа;
 ТипОтсеченияПравил. Один из вариантов системного перечисления ТипОтсеченияПравилАссоциации:Избыточные (отсекать избыточные правила), Покрытые (отсекать правила, покрытые другими правилами).
В результате выполнения анализа:
 информация о данных (количество объектов, количество элементов, среднее количество элементов в объекте, количество найденных правил ассоциаций);
 найденные группы элементов. Указывается состав группы, количество случаев, процент случаев в которых эта группа встречается;
 найденные ассоциативные правила. Указывается исходный состав элементов, следствие (состав элементов), процент случаев, достоверность, значимость правила. </v8:content>
</v8:item>
</tl>
</c>
</c>
</row>
</rowsItem>
<rowsItem>
<index>5</index>
<row>
<c>
<c>
<f>0</f>
<tl>
<v8:item>
<v8:lang>ru</v8:lang>
<v8:content>АнализДанныхПоискПоследовательностей</v8:content>
</v8:item>
</tl>
</c>
</c>
<c>
<c>
<f>5</f>
<tl>
<v8:item>
<v8:lang>ru</v8:lang>
<v8:content>Выявляет в источнике данных последовательные цепочки событий. Например, это может быть цепочка товаров или услуг, которые часто последовательно приобретают клиенты. Этот тип анализа позволяет искать по иерархии, что дает возможность отслеживать не только последовательности конкретных событий, но и последовательности родительских групп. Он может использоваться тогда, когда одним из важных анализируемых показателей является последовательность товаров, которые закупаются друг за другом в течение какого либо определенного промежутка времени.
С точки зрения данного типа анализа колонки источника представлены следующим образом:
 Неиспользуемая;
 Последовательность. Данные из этой колонки используется для анализа как объект события последовательности. По значению данной колонки анализа и ассоциирует данные с одной цепочкой событий;
 Элемент;
 Время. Именно по данной колонке определяется время наступления события. Наличие данной колонки обязательно при проведении данного типа анализа;
Кроме настройки типов колонок, на результат проводимого анализа влияют следующие параметры анализа:
 МинимальныйПроцентСлучаев.;
 МинимальныйИнтервал. Признак установки минимального интервала последовательности (должна быть установлена единица измерения интервала, кратность);
 МаксимальныйИнтервал. Признак установки максимального интервала последовательности (должна быть установлена единица измерения интервала, кратность);
 ИнтервалЭквивалентностиВремени. Признак установки интервала эквивалентности времени (должна быть установлена единица интервала эквивалентности времени, ее кратность);
 МинимальнаяДлина;
 ПоискПоИерархии. Признак осуществления поиска по иерархии (распространяется на колонки с типом Элемент)
Основным результатом анализа являются найденные шаблоны последовательностей. Этот шаблон содержит следующую информацию:
 состав шаблона последовательности;
 количество случаев, в котором наблюдалась данная последовательность;
 максимальные интервалы между событиями (в случае, если событий 2, то интервал один);
 минимальные интервалы между событиями (в случае, если событий 2, то интервал один);
 процент случаев, когда данная последовательность выполнилась;
 средние интервалы между событиями (в случае, если событий 2, то интервал один). </v8:content>
</v8:item>
</tl>
</c>
</c>
</row>
</rowsItem>
<templateMode>true</templateMode>
<defaultFormatIndex>6</defaultFormatIndex>
<height>6</height>
<vgRows>6</vgRows>
<font faceName="Arial" height="8" bold="true" italic="false" underline="false" strikeout="false" kind="Absolute"/>
<format>
<width>265</width>
</format>
<format>
<width>1329</width>
<textPlacement>Wrap</textPlacement>
</format>
<format>
<font>0</font>
</format>
<format>
<font>0</font>
<textPlacement>Wrap</textPlacement>
</format>
<format>
<textPlacement>Wrap</textPlacement>
</format>
<format>
<width>72</width>
</format>
</document>