Классификация и кодирование Классификация и ее виды. Системы кодирования информации

1.СИСТЕМА КЛАССИФИКАЦИИ

Общие сведения

Важным понятием при работе с информацией является классификация объектов.

Классификация - cистема распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком

Под объектом понимается любой предмет, процесс, явление материального или нематериального свойства. Система классификации позволяет сгруппировать объекты и выделить определенные классы, которые будут характеризоваться рядом общих свойств. Классификация объектов - то процедура группировки на качественном уровне, направленная на выделение однородных свойств. Применительно к информации как к объекту классификации выделенные классы называют информационными объектами.

Пример 2.6. Всю информацию об университете можно классифицировать по многочисленным информационным объектам, которые будут характеризоваться общими свойствами:

    информация о студентах - в виде информационного объекта ""Студент"";
    информация о преподавателях - в виде информационного объекта "Преподаватель";
    информация о факультетах - в виде информационного объекта "Факультет" и т. п.

Свойства информационного объекта определяются информационными параметрами, называемыми реквизитами. Реквизиты представляются либо числовыми данными, например вес, стоимость, год, либо признаками, например цвет, марка машины, фамилия.

Реквизит - логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления и т. п.

Пример 2.7. Информация о каждом студенте в отделе кадров университета систематизирована и представлена посредством одинаковых реквизитов:

    фамилия, имя, отчество;
    год рождения;
    место рождения;
    адрес проживания;
    факультет, где проходит обучение студент, и т. д.

Все перечисленные реквизиты характеризуют свойства информационного объекта "Студент".

Кроме выявления общих свойств информационного объекта классификация нужна для разработки правил (алгоритмов) и процедур обработки информации , представленной совокупностью реквизитов.

Пример 2.8.

Алгоритм обработки информационных объектов библиотечного фонда позволяет получить информацию о всех книгах по определенной тематике, об авторах, абонентах и т. д.

Алгоритм обработки информационных объектов фирмы позволяет получить информацию об объемах продаж, о прибыли, заказчиках, видах производимой продукции и т. д.

Алгоритмы обработки в том и другом случае преследуют разные цели, обрабатывают разную информацию, реализуются разными способами.

При любой классификации желательно, чтобы соблюдались следующие требования:

    полнота охвата объектов рассматриваемой области;
    однозначность реквизитов;
    возможность включения новых объектов.

В любой стране разработаны и применяются государственные, отраслевые, региональные классификаторы. Например, классифицированы: отрасли промышленности, оборудование, профессии, единицы измерения , статьи затрат и т. д.

Классификатор - систематизированный свод наименований и кодов классификационных группировок.

При классификации широко используются понятияклассификационный признак и значение классификационного признака, которые позволяют установить сходство или различие объектов. Возможен подход к классификации с объединением этих двух понятий в одно, названное как признак классификации. Признак классификации имеет также синоним основание деления.

Пример 2.9. В качестве признака классификации выбирается возраст, который состоит из трех значений: до 20 лет, от 20 до 30 лет, свыше 30 лет.

Можно в качестве признаков классификации использовать: возраст до 20 лет, возраст от 20 до 30 лет, возраст свыше 30 лет,

1021 - мужчины возраста от 20 до 30 лет, являющиеся студентами радиотехнического факультета .

Регистрационное кодирование

Регистрационное кодирование используется для однозначной идентификации объектов и не требует предварительной классификации объектов. Различают порядковую и серийно-порядковую систему.

Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда. Этот порядок может быть случайным или определяться после предварительного упорядочения объектов, например по алфавиту. Этот метод применяется в том случае, когда количество объектов невелико, например кодирование названий факультетов университета, кодирование студентов в учебной группе.

Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии производится порядковая нумерация объектов. Каждая серия также будет иметь порядковую нумерацию. По своей сути серийно-порядковая система является смешанной: классифицирующей и идентифицирующей. Применяется тогда, когда количество групп невелико.

Пример 2.17. Все студенты одного факультета разбиваются на учебные группы (в данной терминологии - серии), для которых используется порядковая нумерация. Внутри каждой группы производится упорядочение фамилий студентов по алфавиту и каждому студенту присваивается номер.

3.КЛАССИФИКАЦИЯ ИНФОРМАЦИИ ПО РАЗНЫМ ПРИЗНАКАМ

Любая классификация всегда относительна. Один и тот же объект может быть классифицирован по разным признакам или критериям. Часто встречаются ситуации, когда в зависимости от условий внешней среды объект может быть отнесен к разным классификационным группировкам. Эти рассуждения особенно актуальны при классификации видов информации без учета ее предметной ориентации, так как она часто может быть использована в разных условиях, разными потребителями, для разных целей.

На рис. 2.8 приведена одна из схем классификации циркулирующей в организации (фирме) информации. В основу классификации положено пять наиболее общих признаков: место возникновения, стадия обработки, способ отображения, стабильность, функция управления.

DIV_ADBLOCK188">

Внутренняя информация возникает внутри объекта, внешняя информация - за пределами объекта.

Пример 2.18. Содержание указа правительства об изменении уровня взимаемых налогов для фирмы является, с одной стороны, внешней информацией, с другой стороны - входной. Сведения фирмы в налоговую инспекцию о размере отчислений в госбюджет являются, с одной стороны, выходной информацией, с другой стороны - внешней по отношению к налоговой инспекции.

Стадия обработки. По стадии обработки информация может быть первичной, вторичной, промежуточной, результатной.

Первичная информация - это информация, которая возникает непосредственно в процессе деятельности объекта и регистрируется на начальной стадии.

Вторичная информация - это информация, которая получается в результате обработки первичной информации и может быть промежуточной и результатной.

Промежуточная информация используется в качестве исходных данных для последующих расчетов.

Результатная информация получается в процессе обработки первичной и промежуточной информации и используется для выработки управленческих решений.

Пример 2.19. В художественном цехе, где производится роспись чашек, в конце каждой смены регистрируется общее количество произведенной продукции и количество расписанных чашек каждым работником. Это первичная информация. В конце каждого месяца мастер подводит итоги первичной информации. Это будет, с одной стороны вторичная промежуточная информация, а с другой стороны - результатная. Итоговые данные поступают в бухгалтерию , где производится расчет заработной платы каждого работника в зависимости от его выработки. Полученные расчетные данные - результатная информация.

Способ отображения. По способу отображения информация подразделяется на текстовую и графическую.

Текстовая информация - это совокупность алфавитных, цифровых и специальных символов, с помощью которых представляется информация на физическом носителе (бумага, изображение на экране дисплея).

Графическая информация - это различного рода графики, диаграммы, схемы, рисунки и т. д.

Стабильность. По стабильности информация может быть переменной (текущей) и постоянной (условно-постоянной).

Переменная информация отражает фактические количественные и качественные характеристики производственно-хозяйственной деятельности фирмы. Она может меняться для каждого случая как по назначению, так и по количеству. Например, количество произведенной продукции за смену, еженедельные затраты на доставку сырья, количество исправных станков и т. п.

Постоянная (условно-постоянная) информация - это неизменная и многократно используемая в течение длительного периода времени информация. Постоянная информация может быть справочной, нормативной, плановой:

постоянная справочная информация включает описание постоянных свойств объекта в виде устойчивых длительное время признаков. Например, табельный номер служащего, профессия работника, номер цеха и т. п.;

постоянная нормативная информация содержит местные, отраслевые и общегосударственные нормативы. Например, размер налога на прибыль , стандарт на качество продуктов определенного вида, размер минимальной оплаты труда, тарифная сетка оплаты государственным служащим;

постоянная плановая информация содержит многократно используемые в фирме плановые показатели. Например, план выпуска телевизоров, план подготовки специалистов определенной квалификации.

Функция управления. По функциям управления обычно классифицируют экономическую информацию. При этом выделяют следующие группы: плановую, нормативно-справочную, учетную и оперативную (текущую).

Плановая информация - информация о параметрах объекта управления на будущий период. На эту информацию идет ориентация всей деятельности фирмы.

Пример 2.20. Плановой информацией фирмы могут быть такие показатели, как план выпуска продукции, планируемая прибыль от реализации, ожидаемый спрос на продукцию и т. д.

Нормативно-справочная информация содержит различные нормативные и справочные данные. Ее обновление происходит достаточно редко.

Пример 2.21. Нормативно-справочной информацией на предприятии являются:

время, предназначенное для изготовления типовой детали (нормы трудоемкости);

среднедневная оплата рабочего по разряду;

оклад служащего;

адрес поставщика или покупателя и т. д.

Учетная информация - это информация, которая характеризует деятельность фирмы за определенный прошлый период времени. На основании этой информации могут быть проведены следующие действия: скорректирована плановая информация, сделан анализ хозяйственной деятельности фирмы, приняты решения по более эффективному управлению работами и пр. На практике в качестве учетной информации может выступать информация бухгалтерского учета , статистическая информация и информация оперативного учета .

Пример 2.22. Учетной информацией являются: количество проданной продукции за определенный период времени; среднесуточная загрузка или простой станков и т. п.

Оперативная (текущая) информация - это информация, используемая в оперативном управлении и характеризующая производственные процессы в текущий (данный) период времени. К оперативной информации предъявляются серьезные требования по скорости поступления и обработки, а также по степени ее достоверности. От того, насколько быстро и качественно проводится ее обработка, во многом зависит успех фирмы на рынке.

Пример 2.23. Оперативной информацией являются:

количество изготовленных деталей за час, смену, день;

количество проданной продукции задень или определенный час;

объем сырья от поставщика на начало рабочего дня и т. д.

17. Система кодирования информации, классификация методов

Система кодирования применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.

Система кодирования - совокупность правил кодового обозначения объектов.

Код строится на базе алфавита, состоящего из букв, цифр и других символов. Код характеризуется: длиной - числом позиций в коде; структурой - порядком расположения в коде символов, используемых для обозначения классификационного признака.

При кодировании могут ставится разные цели и соответственно применяться разные методы. Наиболее распространенные цели кодирования - это экономность, т.е. уменьшение избыточности сообщения; повышение скорости передачи или обработки; надежность, т.е. защита от случайных искажений; сохранность, т.е. защита от случайного доступа к информации; удобство физической реализации (например, двоичное кодирование информации в ЭВМ); удобство восприятия.

Процедура присвоения объекту кодового обозначения называется кодированием.

Можно выделить две группы методов, используемых в системе кодирования, которые образуют: классификационную систему кодирования, ориентированную на проведение предварительной классификации объектов либо на основе иерархической системы, либо на основе фасетной системы; регистрационную систему кодирования, не требующую предварительной классификации объектов.

Классификационное кодирование применяется после проведения классификации объектов. Различают последовательное и параллельное кодирование.

Последовательное кодирование используется для иерархической классификационной структуры. Суть метода заключается в следующем: сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня, затем код группировки 3-го уровня и т.д. В результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфике выделенной группы на каждом уровне иерархической структуры. Последовательная система кодирования обладает теми же достоинствами и недостатками, что и иерархическая система классификации.

Параллельное кодирование используется для фасетной системы классификации. Суть метода заключается в следующем: все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода. Параллельная система кодирования обладает теми же достоинствами и недостатками, что и фасетная система классификации.

Регистрационное кодирование используется для однозначной идентификации объектов и не требует предварительной классификации объектов. Различают порядковую и серийно-порядковую систему.

Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда. Этот порядок может быть случайным или определяться после предварительного упорядочения объектов, например по алфавиту. Этот метод применяется в том случае, когда количество объектов невелико, например кодирование названий факультетов университета, кодирование студентов в учебной группе.

Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии производится порядковая нумерация объектов. Каждая серия также будет иметь порядковую нумерацию. По своей сути серийно-порядковая система является смешанной: классифицирующей и идентифицирующей. Применяется тогда, когда количество групп невелико.

Классификация информации по разным признакам

Любая классификация всегда относительна. Один и тот же объект может быть классифицирован по разным признакам или критериям. Часто встречаются ситуации, когда в зависимости от условий внешней среды объект может быть отнесен к разным классификационным группировкам. Эти рассуждения особенно актуальны при классификации видов информации без учета ее предметной ориентации, так как она часто может быть использована в разных условиях, разными потребителями, для разных целей.

В основу классификации информации, циркулирующей в организации (фирме), может быть положено пять наиболее общих признаков: место возникновения, стадия обработки, способ отображения, стабильность, функция управления.

Место возникновения. По этому признаку информацию можно разделить на входную выходную, внутреннюю, внешнюю.

Входная информация - это информация, поступающая в фирму или ее подразделения.

Выходная информация - это информация, поступающая из фирмы в другую фирму, организацию (подразделение).

Одна и та же информация может являться входной для одной фирмы, а для другой, ее вырабатывающей, выходной. По отношению к объекту управления (фирма или ее подразделение: цех, отдел, лаборатория) информация может быть определена как внутренняя, так и внешняя.

Внутренняя информация возникает внутри объекта, внешняя информация - за пределами объекта.

Стадия обработки. По стадии обработки информация может быть первичной, вторичной, промежуточной, результатной.

Первичная информация - это информация, которая возникает непосредственно в процессе деятельности объекта и регистрируется на начальной стадии.

Вторичная информация - это информация, которая получается в результате обработки первичной информации и может быть промежуточной и результатной.

Промежуточная информация используется в качестве исходных данных для последующих расчетов.

Результатная информация получается в процессе обработки первичной и промежуточной информации и используется для выработки управленческих решений.

Способ отображения. По способу отображения информация подразделяется на текстовую и графическую.

Текстовая информация - это совокупность алфавитных, цифровых и специальных символов, с помощью которых представляется информация на физическом носителе (бумага, изображение на экране дисплея).

Графическая информация - это различного рода графики, диаграммы, схемы, рисунки и т.д.

Стабильность. По стабильности информация может быть переменной (текущей) и постоянной (условно-постоянной).

Переменная информация отражает фактические количественные и качественные характеристики производственно-хозяйственной деятельности фирмы. Она может меняться для каждого случая как по назначению, так и по количеству. Например, количество произведенной продукции за смену, еженедельные затраты на доставку сырья, количество исправных станков и т.п.

Постоянная (условно-постоянная) информация - это неизменная и многократно используемая в течение длительного периода времени информация. Постоянная информация может быть справочной, нормативной, плановой: постоянная справочная информация включает описание постоянных свойств объекта в виде устойчивых длительное время признаков; постоянная нормативная информация содержит местные, отраслевые и общегосударственные нормативы; постоянная плановая информация содержит многократно используемые в фирме плановые показатели.

Функция управления. По функциям управления обычно классифицируют экономическую информацию. При этом выделяют следующие группы: плановую, нормативно-справочную, учетную и оперативную (текущую).

Плановая информация - информация о параметрах объекта управления на будущий период. На эту информацию идет ориентация всей деятельности фирмы.

Нормативно-справочная информация содержит различные нормативные и справочные данные. Ее обновление происходит достаточно редко.

Учетная информация - это информация, которая характеризует деятельность фирмы за определенный прошлый период времени. На основании этой информации могут быть проведены следующие действия: скорректирована плановая информация, сделан анализ хозяйственной деятельности фирмы, приняты решения по более эффективному управлению работами и пр. На практике в качестве учетной информации может выступать информация бухгалтерского учета, статистическая информация и информация оперативного учета.

Оперативная (текущая) информация - это информация, используемая в оперативном управлении и характеризующая производственные процессы в текущий (данный) период времени. К оперативной информации предъявляются серьезные требования по скорости поступления и обработки, а также по степени ее достоверности. От того, насколько быстро и качественно проводится ее обработка, во многом зависит успех фирмы на рынке.





Мотивы указываются респондентами достаточно часто (более 60% респондентов указывают этот мотив). Ряд мотивов упоминается в анкетах не очень часто (от 20% до 45%). Есть мотивы, которыми при выборе дополнительного образования в области информатики школьники руководствуются редко (до 10%). В соответствии с этим условно все мотивы были разделены на три группы. Неожиданным для нас явился тот факт, что...

Педагогическая или научно-техническая проблема, являющаяся новым научным вкладом в теорию определенной области знаний (педагогику, технику и другие). 4. ПРАКТИЧЕСКИЕ РЕКОМЕНДАЦИИ ДЛЯ ВЫПОЛНЕНИЯ ВЫПУСКНОЙ КВАЛИФИКАЦИОННОЙ РАБОТЫ БАКАЛАВРА ФИЗИКО-МАТЕМАТИЧЕСКОГО ОБРАЗОВАНИЯ ПРОФИЛЬ ИНФОРМАТИКА 4.1. Положение о выпускной квалификационной работе бакалавра физико-математического образования: ...

Нейрокибернетика и гомеостатика теснейшим образом связаны с развитием искусственного интеллекта. И конечно, работы в этой области немыслимы без развития систем программирования (рис. 1). Рис. 1 - Структура информатики Основная цель работ в области искусственного интеллекта - стремление проникнуть в тайны творческой деятельности людей, их способности к овладению знаниями, навыками и...

Обучения информатике. Опыт таких разработок уже имеется как в нашей стране, так и за рубежом, описаны их положительные и отрицательные стороны. 1.3 Отечественный и зарубежный опыт непрерывного обучения информатике с 1 по 11 класс средней общеобразовательной школы Возраст, с которого дети начинают изучать информатику, неуклонно снижается. Об этом свидетельствует, как зарубежный, так и...

Для полной формализации экономической информации недо­статочно простой классификации, поэтому проводят следующую процедуру – кодирование. Кодирование это процесс присвое­ния условных обозначений объектам и классификационным группам по соответствующей системе кодирования. Система кодирования это совокупность правил обозначения объектов и группировок с использованием кодов. Код – это условное обозна­чение объектов или группировок в виде знака или группы знаков в соответствии с принятой системой. Код базируется на определен­ном алфавите (некоторое множество знаков). Число знаков этого множества называется основанием кода. Различают следующие типы алфавитов: цифровой, буквенный и смешанный .

Код характеризуется следующими параметрами:

· длиной (L );

· основанием кодирования (А );

· структурой кода, под которой понимают распределение зна­ков по признакам и объектам классификации;

· степенью информативности (I ) , рассчитываемой как частное от деления общего количества признаков (R ) на длину кода (L ):

I = R/L;

· коэффициентом избыточности (К изб ), который определяется как отношение максимального количества объектов (Q max ) к фактическому количеству объектов (Q факт ):

Все системы кодирования можно сгруппировать в два под­множества (рис. 2.13): регистрационные и классификационные системы кодирования.

Особенностью регистрационных систем кодирования являет­ся их независимость от применяемых систем классификации. Ре­гистрационные коды используются для идентификации объектов и передачи информации об объектах на расстояние, поэтому они должны удовлетворять следующим требованиям: минимальности длины кода, однозначности соответствия наименования объек­та и его кода в течение длительного периода времени и защищен­ности кода от помех и ошибок.

Регистрационные коды состоят из двух частей: информаци­онной и контрольной, предназначенной для защиты передавае­мой информации от ошибок. Контрольная часть может рассчи­тываться по различным алгоритмам, в частности, наиболее упот­ребляемыми являются следующие формулы их расчета:

;

где – модуль (простое число, делящееся на единицу и на само себя); информационные разряды, i – номер разряда; – вес информационного разряда.

К регистрационным системам относятся порядковая и серий­ная системы кодирования.

Порядковая система это наиболее простая по своему пост­роению система кодирования, суть использования которой зак­лючается в последовательном присвоении каждому объекту кодируемого множества Мо номера его порядка, т.е. в присвоении цифр натурального ряда в порядке расположения объектов. Этот порядок может быть случайным или определяться после предва­рительной группировки объектов, например, по алфавиту. Как правило, порядковую систему применяют для кодирова­ния малозначных, устоявшихся и простых множеств объектов, не требующих предварительной классификации.

Серийная (серийно-порядковая) система кодирования отлича­ется от порядковой тем, что номенклатура кодируемых объектов (М ) предварительно должна быть разбита на группировки по од­ному признаку, и каждой группировке должна быть отведена се­рия кодовых обозначений, в пределах которой каждому элемен­ту присваивается свой код по порядку.


Серия обозначений для каждой группировки определяется таким образом, чтобы после присваивания кодов элементам этой группы в ней оставались бы еще свободные номера на случай появления новых объектов.

Классификационные коды используют для отражения классифи­кационных взаимосвязей объектов и группировок и применяются в основном для сложной логической обработки экономической информации на ЭВМ Отсюда вытекают требования: однозначно­сти отображения классификационных взаимосвязей объектов и их группировок и обеспечения максимальной простоты программи­рования. Группу классификационных систем кодирования можно разделить на две подгруппы в зависимости от того, какую систему классификации используют для упорядочения объектов.

Последовательные системы кодирования характеризуются тем, что они базируются на предварительной классификации по иерархической системе классификации, в результате использова­ния которой коды нижестоящих группировок образуются путем добавления кодов к кодам вышестоящих группировок.

Параллельные системы кодирования характеризуются тем, что они строятся на основе использования фасетной системы класси­фикации и коды группировок по фасетам формируются незави­симо друг от друга.

Последовательные и параллельные системы кодирования строятся на базе разрядной или комбинированной системы ко­дирования.

Разрядная система применяется для кодирования объектов, определяемых несколькими соподчиненными признаками, ис­пользуемыми для решения экономических задач. Кодируемые объекты систематизируются по классификационным признакам на каждой ступени классификации, каждому признаку отводится определенное число разрядов, в пределах которых кодирование группировок начинается с единицы. При разрядной системе ко­дирования используется так называемое «зависимое» кодирова­ние. Это значит, что классификационные группировки по млад­шим признакам кодируются в зависимости от кода группировки, образованной по старшему признаку. Запас свободных позиций определяется структурой кода.

Код объекта, построенный по этой системе, состоит из такого числа позиций (или числа групп разрядов), сколько было учтено признаков для объектов, поэтому разрядная система кодирования называется иногда позиционной системой . Конкретное значение признака, характеризующего объект, определяется позицией и зна­чением определенного числа в структуре кода. Длина кода зави­сит от числа ступеней классификации, от числа классификацион­ных группировок на каждой ступени и от основания кодирования.

Комбинированная система кодирования, обладая всеми пре­имуществами разрядного кода, применяется для кодирования больших номенклатур (перечней) объектов, которые характери­зуются многими соподчиненными или независимыми признака­ми. Эта система базируется на сочетании принципов построения таких систем кодирования, как разрядная, серийная, порядковая и кода повторения.

Код повторения (мнемокод) это буквенные или буквенно-цифровые коды, которые характеризуются тем, что в структуру кода переносят часть символьных обозначений объектов с целью повышения мнемоничности кода или для сокращения его длины.

Выбор конкретной системы кодирования зависит от объема кодируемой номенклатуры, ее стабильности, от задач, стоящих перед системой, и от показателей эффективности обработки ин­формации при использовании какой-либо системы.

· 1.4. Система кодирования

Система кодирования – это совокупность правил кодового обозначения объектов.

Применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.

Код – это условное обозначение объекта или явления в виде знака или системы знаков, построенная по определенным правилам. (второй раз дается определение, см. выше)

Код строится на базе алфавита, состоящего из букв, цифр и других символов.

Код характеризуется:

Длиной – число позиций в коде;

Структурой – порядок расположения в коде символов, используемых для обозначения классификационного признака.

Процедура присвоения объекту кодового обозначения называется кодированием.

Основные причины кодирования экономической информации:

1.Обеспечение однозначной идентификации объекта.

2.Сокращение объемов работ при решении задач.

Основные требования к кодам:

Min значности и простота построения;

Наличие резерва;

Коды должны разрабатываться на длительный период времени;

Коды каждой отдельной номенклатуры должны иметь одинаковую значность;

Коды должны по возможности дублировать уже сложившиеся обозначения;

Коды должны учитывать специфику программных и технических средств;

Коды должны помехозащищены.

В системе кодирования используются 2 группы методов :

В классификационной системе кодирования необходима предварительная классификация объектов на основе иерархической или фасетной системы;

- регистрационная система кодирования предварительной классификации объектов не требует.

Система кодирования

Классификационная Регистрационная

Последовательная Параллельная 1.Порядковая Серийно-порядковая

(для иерархической (для фасетной 2.Серийная

классификации) классификации) 3.Десятичная

4.Шахматная (матричная)

5.Повторения

Последовательное кодирование : сначала записывается код старшей группировки 1-го уровня, затем 2-го, 3-го и т.д.

Пример . 1310 – студенты коммерческого факультета свыше 30 лет, мужчины; 2221 – студенты факультета информационных систем, от 20 до 30 лет, женщины, имеющие детей.

Параллельное кодирование используется для фасетной системы классификации. Все фасеты кодируются независимо друг от друга; для значения каждого фасета выделяется определенное количество разрядов кода.

Пример . 1 разряд – пол, 2-й – наличие детей у женщин, 3 - возраст, 4 – факультет. 2135 – женщины свыше 30 лет, имеющие детей, студенты математического факультета; 1021 – 1021 – мужчины возраста 20-30 лет, студенты радиотехнического факультета.

Регистрационное кодирование

Наименование

материалов

Порядковая

система кодирования

Серийная

система кодирования

Десятичная

система кодирования

I.Черные металлы

1.Чугун

2.Сталь

3.Прокат

1-15

3 (4-15 резерв)

103 (104-199 резерв)

II.Цветные металлы

1.Аллюминий

2.Медь

3.Серебро

4.Свинец

16-24

19 (20-24 резерв)

24 (25-29 резерв)

1.Порядковая система кодирования предполагает кодирование позиций числами натурального ряда в порядке возрастания без пропусков.

Достоинства : малозначность и простота построения.

Недостатки :

Невозможность расширения позиции номенклатуры без нарушения принятой системы классификации;

Трудности при подведении итогов, приходится запоминать с какого номера начинается и каким заканчивается каждая группа позиций;

При кодировании не учитывается количество признаков.

2.Серийная система является продолжением порядковой системы. На каждую группу позиций номенклатуры, объединенную одним общим признаком, выделяется серия порядковых номеров с учетом резерва. Размер серии произвольный.

Достоинства : наличие резерва, простота построения.

Недостатки : не всегда можно правильно определить размер серии, трудности при расшифровке, т.к. приходится запоминать с какого номера начинается и каким заканчивается каждая серия.

3.Десятичная система – наиболее широко применяется в практике обработки информации. Здесь для каждого кодируемого признака выделяется один или несколько десятичных разрядов.

Структура кода: Х Х Х


группа порядок

материала следования

Достоинства : возможность кодирования многопризначных номенклатур; автоматическое формирование резервов; простота расшифровки.

Недостатки : не всегда обоснованные резервы; многозначность кода.

4.Шахматная (матричная) система . Она не является самостоятельной системой, а представляет форму изображения серийного или десятичного кода для двупризначных номенклатур.

Вид вклада

Вид операции

До востребования

Срочный

Накопительный

1.Приход

2.Расход

3.Зачисление

4.Списание

11-20

21-30

31-40

41-50

Структура кода: Х Х

операции вклада

5.Система повторения (коды повторения). Эта система предполагает использование уже сложившихся цифровых обозначений: номера месяцев, разряды работ и рабочих, номера счетов в бухгалтерском учете и др.

Для полной формализации информации недостаточно простой классификации, поэтому проводят следующую процедуру - кодирование. Кодирование - это процесс присвоения условных обозначений объектам и классификационным группам по соответствующей системе кодирования. Кодирование реализует перевод информации, выраженной одной системой знаков, в другую систему, то есть перевод записи на естественном языке в запись с помощью кодов. Система кодирования - это совокупность правил обозначения объектов и группировок с использованием кодов. Код - это условное обозначение объектов или группировок в виде знака или группы знаков в соответствии с принятой системой. Код базируется на определенном алфавите (некоторое множество знаков). Число знаков этого множества называется основанием кода. Различают следующие типы алфавитов: цифровой, буквенный и смешанный.

Код характеризуется следующими параметрами:

основанием кодирования;

структурой кода, под которой понимают распределение знаков по признакам и объектам классификации;

степенью информативности, рассчитываемой как частное от деления общего количества признаков на длину кода;

коэффициентом избыточности, который определяется как отношение максимального количества объектов к фактическому количеству объектов.

К методам кодирования предъявляются определенные требования:

код должен осуществлять идентификацию объекта в пределах заданного множества объектов классификации;

желательно предусматривать использование в качестве алфавита кода десятичных цифр и букв;

необходимо обеспечивать по возможности минимальную длину кода и достаточный резерв незанятых позиций для кодирования новых объектов без нарушения структуры классификатора.

Методы кодирования могут носить самостоятельный характер – регистрационные методы кодирования, или быть основанными на предварительной классификации объектов – классификационные методы кодирования.

^ Регистрационные методы кодирования бывают двух видов: порядковый и серийно-порядковый. В первом случае кодами служат числа натурального ряда. Каждый из объектов классифицируемого множества кодируется путем присвоения ему текущего порядкового номера. Данный метод кодирования обеспечивает довольно большую долговечность классификатора при незначительной избыточности кода. Этот метод обладает наибольшей простотой, использует наиболее короткие коды и лучше обеспечивает однозначность каждого объекта классификации. Кроме того, он обеспечивает наиболее простое присвоение кодов новым объектам, появляющимся в процессе ведения классификатора. Существенным недостатком порядкового метода кодирования является отсутствие в коде какой-либо конкретной информации о свойствах объекта, а также сложность машинной обработки информации при получении итогов по группе объектов классификации с одинаковыми признаками.

В серийно-порядковом методе кодирования кодами служат числа натурального ряда с закреплением отдельных серий этих чисел (интервалов натурального ряда) за объектами классификации с одинаковыми признаками. В каждой серии, кроме кодов имеющихся объектов классификации, предусматривается определенное количество кодов для резерва.

^ Классификационные коды используют для отражения классификационных взаимосвязей объектов и группировок и применяются в основном для сложной логической обработки экономической информации. Группу классификационных систем кодирования можно разделить на две подгруппы в зависимости от того, какую систему классификации используют для упорядочения объектов: системы последовательного кодирования и параллельного кодирования.

^ Последовательные системы кодирования характеризуются тем, что они базируются на предварительной классификации по иерархической системе. Код объекта классификации образуется с использованием кодов последовательно расположенных подчиненных группировок, полученных при иерархическом методе кодирования. В этом случае код нижестоящей группировки образуется путем добавления соответствующего количества разрядов к коду вышестоящей группировки.

^ Параллельные системы кодирования характеризуются тем, что они строятся на основе использования фасетной системы классификации и коды группировок по фасетам формируются независимо друг от друга.

В параллельной системе кодирования возможны два варианта записи кодов объекта:


  1. Каждый фасет и признак внутри фасета имеют свои коды, которые включаются в состав кода объекта. Такой способ записи удобно применять тогда, когда объекты характеризуются неодинаковым набором признаков. При формировании кода какого-либо объекта берутся только необходимые признаки.

  2. Для определения групп объектов выделяется фиксированный набор признаков и устанавливается стабильный порядок их следования, то есть устанавливается фасетная формула. В этом случае не надо каждый раз указывать, значение какого из признаков приведено в определенных разрядах кода объекта.

Параллельный метод кодирования имеет ряд преимуществ. К достоинствам рассматриваемого метода следует отнести гибкость структуры кода, обусловленную независимостью признаков, из кодов которых строится код объекта классификации. Метод позволяет использовать при решении конкретных технико-экономических и социальных задач коды только тех признаков объектов, которые необходимы, что дает возможность работать в каждом отдельном случае с кодами небольшой длины. При этом методе кодирования можно осуществлять группировку объектов по любому сочетанию признаков. Параллельный метод кодирования хорошо приспособлен для машинной обработки информации. По конкретной кодовой комбинации легко узнать, набором каких характеристик обладает рассматриваемый объект. При этом из небольшого числа признаков можно образовать большое число кодовых комбинаций. Набор признаков при необходимости может легко пополняться присоединением кода нового признака. Это свойство параллельного метода кодирования особенно важно при решении технико-экономических задач, состав которых часто меняется.

Наиболее сложными вопросами, которые приходится решать при разработке классификатора, являются выбор методов классификации и кодирования и выбор системы признаков классификации. Основой классификатора должны быть наиболее существенные признаки классификации, соответствующие характеру решаемых с помощью классификатора задач. При этом данные признаки могут быть или соподчиненными, или несоподчиненными. При соподчиненных признаках классификации и стабильном комплексе задач, для решения которых предназначен классификатор, целесообразно использовать иерархический метод классификации, который представляет собой последовательное разделение множества объектов на подчиненные классификационные группировки. При несоподчиненных признаках классификации и при большой динамичности решаемых задач целесообразно использовать фасетный метод классификации.

Важным вопросом является также правильный выбор последовательности использования признаков классификации по ступеням классификации при иерархическом методе классификации. Критерием при этом является статистика запросов к классификатору. В соответствии с этим критерием на верхних ступенях классификации в классификаторе должны использоваться признаки, к которым будут наиболее частые запросы. По этой же причине на верхних ступенях классификации выбирают наименьшее основание кода.



Есть вопросы?

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: