Воспользуемся иллюстрацией упрощенного феноменологического описания взаимосвязи таких понятий, как классифицируемое множество объектов, процедура классифицирования и классификатор.
Связи между наблюдаемым и информационным объектом, а также между классификатором и основанием классификации обеспечиваются бизнес процессами моделирования, описание которых здесь опустим.
Одна из практических проблем в использовании классификаторов, например классификатора "Цвет", может быть связана со следующим обстоятельством. Можно разработать (“f ’(x)”) прекрасную систему классификаторов, удовлетворяющие всем требованиям физической теории, но все будет напрасно, если субъектом процедуры классифицирования (“f(x)”) окажется дальтоник.
Суть замечания о процедуре классифицирования (“f(x)”) подчеркивает необходимость серьезного отношения к обсуждаемой теме. Без классификаторов не обходится ни одна ERP и/или ECM система, которые предназначены для использования менеджерами и экономистами. Один из способов решения этой задачи состоит в применении вычислимых классификаторов там, где это возможно.
Функции
Простейшим примером вычислимого классификатора является тот случай, если удается найти и использовать функциональное отображение характеристик объекта в список значений классификатора. Вид функции – это не обязательно регулярное математическое выражение, а это может быть, например, таблица диапазонов значений характеристик объекта. Важно, чтобы функция классифицирования обеспечивала выполнение семантических требований к классификатору - уникальность, полнота, непрерывность и непротиворечивость.
Примеры случаев возможного применения вычислимых классификаторов с использованием функционального отображения характеристик объекта:
· x – частота телевизионного сигнала, n – номер канала
· x – напряжение электрического тока, n – категория кабеля
· x – месяц, n – время года.
Перевод аналогового результата измерения в цифровое значение, функция округления аргумента до ближайшего целого.
Диаграммы состояний
Определение процедуры классифицирования посредством диаграммы состояния, как и в предыдущих случаях, может привести в итоге к вычислимому классификатору. Рассмотрим пример диаграммы состояний контролируемого вопроса при исполнении поручения.
Этой диаграмме состояний соответствует следующий классификатор:
Одно из главных отличий описанного примера от функционального представления процедуры классифицирования объектов состоит в возможной неоднозначности результата. В соответствии с диаграммой состояний для контролируемого поручения существуют различные варианты исхода. Строго говоря, в математике - это не функция.
Data Mining
Задачи построения процедур классификации (“f ’(x)”) относятся к разделу технологий Data Mining в индустрии IT.
BI - Business Intelligence. Программные средства, функционирующие в рамках предприятия, обеспечивающие функции доступа и анализа информации, принятие управленческих решений. DSS - Decision Support System синоним BI.
Data Warehouse - Средства построения хранилищ данных.
OLAP – On Line Analytical Processing. Системы оперативной аналитической обработки.
EIS - Enterprise Information Systems. Информационно-аналитические системы.
Data Mining - технологии интеллектуального анализа данных. В основе технологий лежит концепция patterns, шаблонов представляющих собой закономерности.
Нет единого мнения относительно того, какие задачи относятся к Data Mining. Также считается, что задача классификации является наиболее простой и одновременно наиболее часто решаемой задачей Data Mining. Однако такие выводы выходят за рамки обсуждаемого вопроса.
Классифицирование это всегда проблема выбора. Вопрос выбора относится к теории принятия решений или к Data Mining. Неправильный выбор, выбор недостаточно квалифицированного персонала в корпоративных информационных системах - это создает дополнительные проблемы в разработке систем.
ОтветитьУдалить