Информационное обеспечение ис. Информационное обеспечение управления

1.1 ПОНЯТИЕ И СОДЕРЖАНИЕ ИО

ИНФОРМАЦ ОБЕСПЕЧ - сов процессов сбора, обработки, хранения, анализа и выдачи инф для обеспеч управленческой деят и ТП. ИНФ – изменение объема и структуры знания в н предметной обл воспринимающей системой независимо от формы и способа представления знания. ИНФ РЕСУРСЫ – документы и их массивы в инф сист (библиотеках, архивах, фондах, банках данных). ИНФ СИСТ – орг сов прогр-технич и др вспомогат средств ТП и функц-опр групп работников, обеспеч сбор, представление и накопление инфх ресурсов в опр предметной обл, поиск и выдачу сведений для удовл инф потребностей устан контингента пользователей - абонентов сист. ДАННЫЕ - инф, отраж опр сост н предметной обл в конк форме и сод лишь наиб сущ с тз целей и задач сбора и обраб инф элем отражаемого объекта действительности. ДОКУМЕНТ – инф сообщ на ест языке, зафиксированное ручным или печатным способом на бланке устан формы, им юр силу. Процесс документирования превращает инф в инф ресурсы.

1.2 ТЕХНОЛОГИЧЕСКОЕ И ОРГАНИЗАЦИОННО-ШТАТНОЕ ВОПЛОЩЕНИЕ ИО

1.3 СТРУКТУРА ИО

СБОР ИНФ - спец обр орг процесс получ и отбора инф, относ к предметной обл инф сист. ОЦЕНКА ОТНОСИМОСТИ инф к предметной обл инф сист м осущ автоматически, либо с уч аналитиков. ПРЕДВАР ОБРАБОТКА инф опр формой представления вх данных и м вкл кл-цию сведений по опр разделам предметной обл с целью накопления материалов опр характера. СТРУКТУРИЗАЦИЯ инф - процесс преобразования документированной инф в семантику АИС. ПОДДЕРЖАНИЕ ЦЕЛОСТНОСТИ И СОХРАННОСТИ инф вкл пересмотр, отсеивание и ревизию данных, поддержание их актуальности. Данные задачи реш категорией работников – админами инф систем .

1.4 СТРУКТУРА И КЛАССИФИКАЦИЯ ИНФОРМАЦИОННЫХ СИСТЕМ


1) Без правильно орг, оперативно и эфф действующей орг-технологич подсист невозможна эфф орг и функц всей ИС. 2) Подсистема предст и обраб инф сост ядро ИС и явл отражением представления разработчиками и абонентами системы предметной обл, сведения о кот должна отраж ИС. Она явл наиб сложн компонентом при разраб ИС. 3) Подсист выдачи инф опр пользователей и абонентов сист и реализ целевой аспект назнач и выполнения задач ИС.

БД – сов данных, орг по опр правилам, предусматр общ принципы описания, хранения и манипулирования данными независимо от прикладных прог. СУБД – комплекс прогр средств, реализ создание БД, их поддержание в актуальном сост, обеспеч пользователей возможн получать из БД необход инф. БАНК ДАННЫХ (БнД) – сов конкр БД, СУБД, прикладных компонентов АИС (набор вх и вых форм, типовых запросов для реш инф-технологич задач в конкр предметной обл), а также комплекса технич средств, на кот они реализованы.

ФАКТОГРАФИЧЕСКИЕ ИС - накапл и хранят данные в виде множества экземпляров структ элементов, кот отраж сведения по какому-л событию, отделенному от всех прочих сведений. ДОКУМЕНТАЛЬНЫЕ ИС - единичным элементом инф явл документ, расчлененный на более мелкие элементы, а инф при вводе структурируется в огранич виде. ГЕОИНФРМАЦИОННЫЕ ИС - данные орг в виде отд инф объектов с опр набором реквизитов, привяз к общ эл топографической основе.

1.5 СИСТЕМА ПРЕДСТАВЛЕНИЯ И ОБРАБОТКИ ДАННЫХ ФАКТОГРАФИЧЕСКИХ АИС

I УРОВЕНЬ опр-ся лок представлениями пользователей ИС о предметной обл и о своих инф потребностях. На основе их анализа опр инф-логичсхема предметной обл. II - схема БД, назыв логич структурой данных, предст описание средствами конкр СУБД инфологич схемы предметной обл. Сов средств и способов реализ схемы БД конкр СУБД сост модель орг данных . III – самый «низкий» уровень предст инф, выраж вн схемой БД, опр структуру орг и хранения инф массива.

2.1 ФУНКЦИИ, КЛ-ИЯ И СТРУКТУРА СУБД

СУБД – прикладное ПО, предназнач для реш конкр задач. Особенность СУБД – вып сист функций, т е расширение возможности файловых систем СПО.


ТРАНЗАКЦИЯ - послед сов операций, им отд смысловое знач по отнош к текущему сост БД. ЖУРНАЛИЗАЦИЯ средство обеспеч сохранности данных при разл сбоях и разруш данных. СУБД ОБЩ НАЗНАЧ не ориент на какую-л конкр предметную обл или пользователя, а явл универс, реализ избыточное множество операций над данными, им средства настройки на конкр предм обл, усл эксплуатац и требования к пользователю. СПЕЦ СУБД созд, если СУБД общ назнач не удовл по каким-л параметрам. Необход параметры спец СУБД достиг: 1) за счет знания особенностей конкр предм обл. 2) путем сокращ функц полноты сист.


ЯДРО СУБД - процессор описания, реализ модель данных, средствами кот проектировщик строит логич структуру БД, соотв ИМ предм обл и обеспеч поддержание вн схемы БД. ИНТЕРФЕЙС ВВОДА реализ вх инф язык БД, обеспеч абонентам-поставщикам инф средства опис и ввода данных в инф сист. ИНТЕРФЕЙС ЗАПРСОВ совместно с процессором запросов обеспеч концептуальную модель ИС в части станд типовых запросов, отраж потребности абонентов-потребителей инф. ИНТЕРФЕЙС ВЫДАЧИ получ от процессора запросов результаты исполнения запросов и переводит их в форму, удобную для восприятия и выдачи инф абоненту-пользователю. ГЕНЕРАТОР ОТЧЕТОВ исп для создания «отчетов».

2.2 МОДЕЛИ ОРГАНИЗАЦИИ ДАННЫХ

МОДЕЛЬ ДАННЫХ - математ средство абстракции, позвол отделить факты от их интерпретации и обеспеч развитие возможности представления соотношения данных.


Иерархическая модель данных

В ИМД объекты сущностей и отношения предм обл предст-ся набором данных, кот им строго древовидную структуру. ДОСТОИНСТВА : позвол опис структуру как на логич, так и на физич уровнях. НЕДОСТАТКИ : 1) Жесткая фиксация связей между элементами данных; 2) Быстрота доступа достиг за счет потери инф гибкости. В ИМД устан строгий порядок обхода дерева (сверху - вниз, слева – направо) и след операции над данными : а) найти указанное дерево; б) перейти от одного дерева к др; в) перейти от одной записи к др; г) перейти от одной записи к др в порядке обхода иерархии; д) удалить текущую запись. В ограничениях целостности ИМД осн внимание удел целостности ссылок между предками и потомками с уч осн правила: никакой потомок не м сущь без родителей.

П. информационное обеспечение экономических информационных систем учебно – методическое пособие

МИНИСТЕРСТВО ВЫСШЕГО И СРЕДНЕГО СПЕЦИАЛЬНОГО

ОБРАЗОВАНИЯ РЕСПУБЛИКИ УЗБЕКИСТАН

ТАШКЕНТСКИЙ ГОСУДАРСТВЕННЫЙ ЭКОНОМИЧЕСКИЙ

УНИВЕРСИТЕТ

Факультет « Информационные технологии

и менеджмент»

Мусалиев А.А., Бегалов Б.А., Жиемуратов Т.П.

ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ ЭКОНОМИЧЕСКИХ ИНФОРМАЦИОННЫХ СИСТЕМ

УЧЕБНО – МЕТОДИЧЕСКОЕ ПОСОБИЕ

Под редакцией академика С.С.ГУЛЯМОВА

ТАШКЕНТ – 200 7


Введение……………………………………………………………………..

3

1. Информация и информационные ресурсы……………………………..

3

2. Состав, требования и аспекты описания информационного обеспечения………………………………………………………………….

3. Структура и основные элементы информационного обеспечения…..

9

4. Особенности и свойства экономической информации………………...

13

5. Классификация экономической информации…………………………..

15

6. Классификация постоянной информации……………………………...

19

7. Составные единицы экономической информации……………………..

20

8. Система экономических показателей…………………………………...

24

9. Операции обработки экономической информации…………………….

25

10. Технологии баз данных…………………………………………………

28

11. Организационно – методологический подход к разработке информационного обеспечения экономических информационных систем……

Литература…………………………………………………………………..

35

Введение

Информационное обеспечение (ИО)- важнейший элемент экономических информационных систем и предназначено для отражения информации, характеризующей состояние управляемого объекта и являющееся основой для принятия управленческих решений. Любая информационная система не может работать без информации о состоянии управляемого объекта и внешней среды, без передачи информации о принятых управленческих решений. Перед информационным обеспечением стоит задача качественного обслуживания информацией пользователей системы, обеспечение эффективного функционирования потоков информации в процессе реализации функций управления, взаимодействия с внешними системами.

Информационное обеспечение (information support) осуществляет формирование по соответствующим правилам совокупности сведений, процедур накопления, хранения информации, а также ее использование при решении конкретных задач системы и представляет собой совокупность средств и методов организации данных в ИС.

1. Информация и информационные ресурсы

Понятие информации и информационных ресурсов. Понятия и нформация является фундаментальным научным понятиям, требующими точных формулировок и пояснений.

Термин информация происходит от латинского informatio, что означает разъяснение, осведомление, изложение. С позиции материалистической философии информация есть отражение реального мира с помощью сведений (сообщений). Сообщение - это форма представления информации в виде речи, текста, изображения, цифровых данных, графиков таблиц и т.п. В широком смысле информация - это общенаучное понятие, включающее в себя обмен сведениями между людьми, обмен сигналами между живой и неживой природой, людьми и устройствами.

Распространенным является взгляд на информацию как на ресурс, аналогичный материальным, трудовым и денежным ресурсам. Эта точка зрения отражается в следующем определении. Информация - новые сведения, позволяющие улучшить процессы, связанные с преобразованием вещества, энергии и самой информации.

Информационная система - организационно упорядоченная совокупность информационных ресурсов, информационных технологий и средств связи, позволяющая осуществлять сбор, хранение, поиск, обработку и пользование информацией.

Информационные ресурсы можно определить как весь имеющийся объем информации в информационной системе. Для страны - это будет информационные ресурсы страны, для организации - информационные ресурсы организации. Иначе говоря - это весь объем знаний, отчужденных от их создателя, зафиксированный на материальных носителях и предназначенный для общественного использования.

Информационные ресурсы - информация, банк данных, база данных в электронной форме в составе информационной системы.

Информационные ресурсы при их разумной организации и использовании выступают как эквивалент трудовых, материальных и энергетических ресурсов. К тому же информация - это единственный вид ресурса, который содействует наиболее рациональному и эффективному использованию и сбережению всех остальных ресурсов.

Информация, информационные ресурсы существовали всегда, но эти ресурсы из-за своей специфичности не рассматривались как экономическая категория, хотя информация всегда использовалось людьми для управления. Когда в результате развития общества, усложнения технологии и т.п., объем информации становился настолько большим, что его нельзя было переработать для управления, человечество всегда находило какое-либо решение. Появление иерархий управления, возникновение товарно-денежных отношений, создание вычислительных машин с этой точки зрения позволило преодолеть эти трудности в переработке огромных объемов информации для управления.

Одной из важнейших разновидностей информации является информация экономическая. Ее отличительная черта - связь с процессами управления коллективами людей организацией. Экономическая информация сопровождает процессы производства, распределения, обмена и потребления материальных благ и услуг

Информация, как разновидность ресурса . Информация обладает всеми признаками товара: наличием у нее потребительской стоимости (полезности, ценности) и стоимости (т.е. некоторых затрат общественного труда.

У информационных и вещественных объектов как товаров, есть и общие и различающие их свойства.

Эти объекты роднит с обычными изделиями и материальными ресурсами следующее: На них имеется потребительский спрос; они являются объектами собственности, т.е. ими можно владеть, пользоваться и распоряжаться; они имеют конкретных разработчиков (поставщиков); они имеют стоимость и соответственно цену; они могут поставляться на различных условиях.

Однако у информационных ресурсов и технологии имеется ряд принципиальных отличий, к числу которых относится:


  • - бесконечная тиражируемость, означающая их сохранение при неограниченном числе продаж;

  • практическая неуничтожаемость;

  • необходимость (за исключением общесистемных пакетов) индивидуальной адаптации к условиям конкретных пользователей;

  • обязательность авторского сопровождения поставляемых объектов;

  • возможность наложения различных ограничений не только по использованию, но и вторичному тиражированию;

  • сложность идентификации соблюдения авторских прав или прав поставщика;

  • множественность дублирующих объектов. В отличие от изделий, различные образцы которых могут выполнять сходные функции, информация может по-разному отражать одну и ту же реальность. Например, на торги могут быть предложены несколько вариантов итоговой информацию о размерах открытого месторождения в какой-нибудь продукции;

  • полезность косвенной информации; Так, например, информация о том, что есть такая информация, стоит довольно дорого;

  • обесцениваемость в результате пробного использования. Действительно, ознакомившись с данными и убедившись в некондиционности некоторых из них, правомерно отложить предложение о покупке. Однако заставить себя забыть или не использовать достоверные сведения из числа предложенных практически невозможно;

  • непредсказуемость котировки. Если изделия могут котироваться с некоторой ограничением динамикой (мгновенное исчезновение или возникновение спроса практически невероятно), то информация (но не технология) может мгновенно упасть в цене до нулевого уровня;

  • возможна взаимная антогоничность, а не просто конкурентность. Предложение на рынке одной информации может сделать на рынке неактуальной другую;

  • неопределенность некоторых или всех потребительских свойств;

  • предельно легкая транспортируемость и возможность избежать транспортных (в данном случае коммуникационных) повреждений;

  • физическая неснашиваемость, означающая наличие только морального старения или потери актуальности в фиксированный или неопределенный момент времени;

  • мгновенность передачи потребителю сведений и возможность получить подтверждение также в исчезающий малый период времени;

  • не всегда четкий период поставки не автоматически тиражируемой технологии;

  • постоянная готовность к поставке;

  • низкая идентифицируемость поставщика информационных данных и технологии, а также источников сведений и использование компонент технологий;

  • возможность сохранения конфиденциальности в отношении, как продавца, так и покупателя данных и технологии, а также самого факта продажи или не продажи.
Степень удовлетворенности пользователей оценивается по следующим взаимосвязанным критериям:

  • качеству, т.е. по уровню удовлетворения информационных потребностей, определяемой ценностью (полезностью) информации;

  • выгодам, т.е. по повышению экономической эффективности в целом;

  • затратам, т.е. стоимостью информации, определяемая объемом информации.
Качество (полезность) информации. К качественным свойствам (полезности) информации относится: полнота, доступность восприятия, актуальность, своевременность, точность и т.д.

1. Полнота . Полнота информации выражается в точном определении количественных и качественном параметров тех или иных сторон деятельности объекта и выработке адекватных или решений.

Неполнота информации может привести к ошибкам в принятии решений.

2. Достоверность допускает определенный уровень искажений как поступившей, так и результатной информации, при котором сохраняется эффективность принимаемых решений.

3. Доступность восприятия информации определяется скоростью восприятия данных в единицу времени. Поэтому данные представляются преимущественно в табличной форме, которая раскрывает не только смысл содержащейся информации, но и легко воспринимается.

4. Актуальность данных характеризует пригодность для реализации конкретной функции в определенный момент времени. Поэтому актуальность, своевременность и оперативность довольно близкие качественные свойства информации.

5. Своевременность означает поступление информации в удобное или назначенное время. Нарушение этого требования может обесценить информацию.

6. Точность означает ее правильность, степень ее детализации. Точность информации обеспечивает ее однозначное восприятие всеми потребителями.

7. Оперативность отражает старение информации с течением времени и потери актуальности.

Несвоевременное поступление информации вызывает запаздывание в принятии решении, вследствие чего принимаемое решение не отвечает изменившейся обстановке. Чем оперативное информация, тем больше ее ценность. С течением времени информация стареет и ее ценность уменьшается.

Ценность информации быстро возрастает по мере увеличения степени точности или когда различие между сообщаемыми и фактическими результатами уменьшается. Более полная и достоверная информация обеспечивает правильное решение. Наиболее желаемая точность это та, когда ценность информации превышает расходы на ее получение.

Важное преимущество информационных систем состоит в том, что с ее использованием уменьшается время обработки. Существует понятие о минимальной, средней и максимальной давности информации. Минимальная давность равна половине отчетного периода плюс задержка в обработке; средняя - половина интервала между периодом обработки плюс задержка в обработке; максимальная - одному интервалу плюс половина отчетного периода.

Ценность информации уменьшается по мере увеличения задержки, с увеличением задержки информация может оказаться устаревшей и непригодной для принятия решений.

Информационную систему, немедленно реагирующую на любое отклонение, можно считать системой, действующей в реальном масштабе времени. Предполагается, что такая система получает, обрабатывает и передает данные с такой небольшой задержкой, что можно принять нужные меры немедленно.

По мере старения информации ее ценность для выработки решения падает до уровня, который достигается при информации меньшего объема. При получении дополнительной информации повышается роль принимаемых решений.

При уменьшении задержки в обработке информации, во-первых, решения могут приниматься раньше, во-вторых, ее содержание улучшится.

Для того, чтобы информация была полезной, она должна быть связана с решаемой в каждый момент времени проблемой; наличие только относящейся к делу информации позволяет пользователю принимать своевременные и более содержательные решения, так как он не тратит времени на поиск нужных ему факторов среди многих других. Если имеющееся информация не связана с вырабатываемым решением, то она не имеет ценности. Знание (или незнание) пользователем какой-либо части информации и действия, которые оказывается следствием этого, также являются важным фактором ценности информации.

2. Состав, требования и аспекты описания информационного

обеспечения

Состав информационного обеспечения. Информационное обеспечение АЭИС включает:


  • состав информации, т. е. перечень информационных единиц (сообщений), необходимых для решения комплексов задач в функциональных подсистемах ИС;

  • характеристики движения информации, т. е. количественные оценки объема и интенсивности информационных потоков, маршруты документов, схем документооборота, вероятностно – временные характеристики преобразования сообщений;

  • структуру информации и закономерности ее преобразования, т. е. правила построения сообщений в цепочки «вход – система – выход»;

  • характеристики качества преобразования информации, т. е. количественные оценки полезности, достоверности и своевременности информации;

  • способы преобразования информации, включая ее съем, доставку, распределение и обеспечение информацией комплексов задач и отдельных задач функциональных подсистем ИС.
Требования к информационному обеспечению. Информационное обеспечение ИС должно отвечать следующим требованиям 15,16,17,18.:

  • способствовать реализации интегрированной обработки информации и принятию управленческих решений на основе экономико-математических методов и моделей, программ их машинной реализации в различных режимах;

  • представлять полную, своевременную и достоверную информацию для принятия решений с минимумом затрат на ее получение, накопление, поиск, обработку и передачу;

  • способствовать осуществлению диалога пользователя с ЭВМ, предусматривая для этого все необходимые средства и методы эффективного взаимодействия человека и ЭВМ;

  • осуществлять накопление и хранение информации путем создания автоматизированного банка данных;

  • обеспечить условия реализации функций управления за счет рационального использования всего информационного ресурса системы.

  • полнота отображения состояния управляемой системы и достоверности информации, как необходимой для решения задач, так и выдаваемой по запросам пользователей;

  • высокая эффективность методов и средств сбора, хранения, накопления, обновления, поиска и выдачи данных;

  • одноразовая регистрация и одноразовый ввод информации, и ее многократное и многоцелевое использование;

  • простота и удобство доступа к данным информационной базы;

  • ввод и накопление в информационной базе данных с минимума дублирования;

  • организация эффективной системы документооборота;

  • развитие информационного обеспечения путем наращивания данных и организации новых связей и проектирование более совершенных методов и способов обработки информации;

  • регламентация доступа к данным с различным уровнем доступа, а также времени хранения документированной информации.
Аспекты описания информационного обеспечения. В целом ИО ИС может быть охарактеризовано в функциональном, структурном, трансформационном и методическом аспектах.

Функциональный аспект описания ИО отражает его роль в решении различных задач ИС. Выделяют следующие функции ИО: слежения, памяти, обработки и распределение информации.

Функция слежения обеспечивает подготовку, передачу и прием информации для управления объектом. Причем, слежение может быть постоянным, периодическим, оперативным, запаздывающим и прогнозирующим.

Функция памяти связанно, прежде всего, с хранением информации в ИС и предполагает отбор, сортировку, размещение, обновление, поиск и выдачу информацию.

В функцию обработки информации входит логическое и арифметическое преобразование информации.

В функцию распределения информации входит избирательность доставки информации в системе по уровням иерархии управления, пользователям.

Структурный аспект описания ИО предполагает исследование формы и структуры хранения и преобразования информации в ИС и включает классификацию информации, систему показателей, информационный язык, документацию, структуру информационных массивов (файлов), язык общения с информационной системой.

Трансформационный аспект описания ИО рассматривает преобразование языка экономического управления по уровням управления и этапам движения информации от входа к выходу системы.

Методический аспект описания ИО. В его основе при создании АЭИС лежит осуществление следующих принципов:


  • методологического единства ИО, т. е. разработка ИО различных функциональных подсистем на основе единых методов;

  • информационной совместимости ИО, т. е. создание единой системы форм документов, классификаторов и кодов для всей системы;

  • типизация блоков ИО, т. е. построение аналогичных в функциональном и содержательном отношений частей ИО по единым типовым правилам на одном языке;

  • унификация обмена информацией, т. е. сокращение форм документов;

  • интеграция обработки информации, т. е. однократности ввода информации в систему при многократном ее использовании.

3. Структура и основные элементы информационного обеспечения

Структура информационного обеспечения. В теории автоматизированной обработки информации, ИО принято делить на: системы показателей данной предметной области (например, показатели бухгалтерского учета, финансово – кредитной деятельности и т. д.); системы классификации и кодирования; документацию; потоки информации-варианты организации документооборота; различные информационные массивы (файлы), хранящихся в машине и на машинных носителях и имеющих различную степень организации.

Ввиду сложности системы ИО, выделяются такие составляющие ее части, как внешнее (внемашинное) и внутреннее (внутримашинное) ИО.

Внешнее (внемашинное) информационное обеспечение представляет собой часть информационного обеспечения, включающая совокупность информационных сообщений, сигналов, документов, используемых при функционировании информационной системы в форме воспринимаемых человеком без применения средств информационных технологий.

В состав внешнего информационного обеспечения входит: система классификации и кодирования информации, система нормативно – справочной информации, документация (входная и выходная), а также система организации, ведения и хранения документации и внесения в нее изменений.

Системы классификации и кодирования информации (объектов, элементов данных) являются средствами формализованного описания данных, при этом осуществляется однозначная замена смыслового содержания компактным кодом. В первую очередь это относится к наименованиям технико-экономических показателей, документов, операции, продукции, предприятий и т. д.

Нормативно – справочная информация относится к условно – постоянной информации, характеризующих заданное состояние управляемых параметров производства к определенному моменту времени. К ней относятся плановые задания, производственные графики, нормативы трудоемкости изделий, а также нормы и нормативы и т. д.

Оперативная (входная) документация , отражая переменную (текущую) информацию характеризует состояние управляемых параметров производства в заданный момент времени (объем выпуска за текущий период, приход и расход материалов и т. д.), а также за некоторый период времени.

Входная информация представляет собой совокупность исходных данных, необходимых для решения задач. Вводимые в систему и хранимые в ней данные представляют отдельные значения параметров объектов, процессов или явлений в виде слов, буквенных обозначений, числовых величин, таблиц, графиков или в иной форме.

Источниками входных данных могут служить устные сообщения, рукописные материалы, документы и носители информации в форме пригодной для непосредственного ввода в ЭВМ. Исходные данные получают в обычных, для неавтоматизированной системы документах, написанных от руки, отпечатанных типографическим способом или на машинке с последующим переносом их на машинные носители информации и т. д.

Выходная информация, являясь результатом обработки входной информации (оперативной и нормативно – справочной) по определенному алгоритму предназначена для принятия решений по управлению производством.

К выходной информации относится информация, получаемая в результате решения задачи системы и предназначенная для непосредственного использования пользователем. Обычно выходная информация представляется в виде машинных документов. Документы делятся на группы по функциональному назначению с учетом целей, для которых они предназначены, частоты выхода документов и целесообразности их получения пользователями и т. д.

Группировка и расположение информации в документе определяется алгоритмом использовании этой информации.

Результатом решения задачи также является промежуточная информация, используемая при решении других задач.

Внутреннее (внутримашинное) информационное обеспечение , являясь частью информационного обеспечения, представляет собой совокупность используемых в информационной системе данных на машинных носителях, включающие входные, промежуточные и выходные массивы, образующих информационную базу, а также систему программ организации, ведения и доступа к данным. Внутреннее информационное обеспечение включает все массивы (файлы), необходимые для решения задач и обработки данных, а также программные средства записи, обновления массивов и поиска в них данных. В состав информационной базы входят:


  • нормативные и справочные данные, составляющие информационный базис системы;

  • текущие сведения, поступающие извне системы и требующие ответной реакции системы или влияющие на алгоритм выработки решений;

  • накапливаемые архивные и учетные данные, необходимые для управления экономической системой.
Таким образом, информационное обеспечение ИС представляет собой совокупность данных, языковых средств описания данных, способов организации, хранения, накопления и доступа к информационным массивам, обеспечивающей выдачу всей информации, необходимой в процессе решения функциональных задач ИС и справочной информации пользователям системы.

Контролируют входные данные и ведение информационной базы - программные средства. Под ведением информационной базы (массивов информации) понимают обеспечение хранения, накопление данных, своевременного исключения устаревших данных, внесения и контроля изменений.

Основные элементы информационного обеспечения также состоит из элементов внешнего и внутреннего информационного обеспечения.

Основными элементами внешнего

поток информации - группа сообщений в процессе ее движения в пространстве и времени в одном направлении, при условии, что у этих сообщений имеется источник и получатель;

реквизит – элементарное сообщение, дальнейшее расчленение которой невозможно без уничтожения семантического смысла сообщения; реквизиты подразделяются на признаки и основания;

реквизит-признак – часть сообщения, которая функционально предназначена для качественной характеристики описываемого объекта; признак позволяет проводить идентификацию объекта в определенном множестве сообщений;

реквизит-основание – часть сообщения, которая функционально предназначена для количественной характеристики описываемого объекта; физически основание- это числовая величина, получаемая в результате наблюдения, измерения или вычисления;

показатель- часть сообщения, которая описывает качественную и количественную сторону объекта, обладает информативностью и поэтому способна образовать документ. Показатель компонуется из реквизитов- признаков и реквизитов-оснований и состоит из одного признака – основания и одного или нескольких реквизитов- признаков, характеризующих основание и связанных с ними логическими отношениями. При обработке над реквизитами основаниями осуществляются арифметические операции, над реквизитами признаками – логические (сортировка, поиск, выборка и т. д.).

номенклатура - информационная совокупность, включающая все значения однотипных показателей;

документ - средство закрепления различными способами на специальном материале информацию о фактах, событиях, явлениях, объективной действительности и мыслительной деятельности человека;

кодирование – отображение дискретных сообщений в виде определенных сочетаний символов;

код – конкретное условное обозначение каждого наименования в данной номенклатуре;

документооборот - движение документов с момента их возникновения или получения до завершения исполнения или отправки;

система документации - совокупность документов создаваемых в процессе выполнения одной из функций управления.

Основными элементами внутреннего информационного обеспечения являются:

файл - это некоторое множество записей однородной структуры, предназначенные для решения задач;

запись – это набор полей определенного формата, объединенных по общему ключевому полю. Элементы записи обозначаются идентификаторами.

Носители информации. Функционирование экономических объектов отображаются системой экономических показателей, характеризующих все аспекты деятельности производства. Для их фиксации используются носители информации.

Носитель информации - это различные материалы, обладающие физическими свойствами (бумага, магнитные диски, оптические диски и др.), которые применяются для сохранения информации, т. е. любое материальное средство, на которое записывается (регистрируется) и с которого считывается информация.

Назначением носителей информации являются:


  • запись первичных данных;

  • подготовка исходных данных к обработке;

  • непосредственный ввод в компьютер подготовленных данных;

  • организация внешней памяти компьютера; фиксация результатов обработки данных.
Носители данных характеризуются своими габаритами и емкостью при установленных размерах.

Лекция 4

Информационное обеспечение информационных систем

Понятие информационного обеспечения и его структура.

Внемашинное информационное обеспечение.

Внутримашинное информационное обеспечение.

Понятие информационного обеспечения и его структура

Понятие «Информационное обеспечение» появилось в 1970-х гг. в связи с внедрением ЭВМ в практику обработки экономических задач и с созданием автоматизированных систем управления (АСУ). Была разработана структура ИО, предполагающая его деление на внемашинное (система показателей, классификаторы и коды, доку­ментация, потоки информации) и внутримашинное (информацион­ные массивы (файлы) в памяти ЭВМ и на машинных носителях).

Информационное обеспечение (ИО) является важным компо­нентом автоматизированных информационных систем и напрямую связано с организационной структурой объекта и функциональными подсистемами ИС.

Информационное обеспечение предназначено для отражения информации, характеризующей состояние управляемого объекта; служит основой для принятия управленческих решений.

Выделяют несколько подходов к структуризации экономической информации, один из которых - логический - позволяет устано­вить структурные элементы в зависимости от функционального на­значения информации и ее особенностей.



Рассмотрим функциональное назначение и роль различных структурных элементов в автоматизированной обработке.

Информационной единицей низшего уровня являются реквизиты , из которых формируются более сложные структуры информации. Реквизиты отражают отдельные свойства объекта, включают в себя сочетание цифр или букв, имеющих смысловое со­держание и не поддающееся дальнейшему делению. Буквенная ин­формация может быть представлена в виде кодовых обозначений (например, код подразделения). При машинной обработке синонимами понятия «реквизит» являются «поле», «элемент», «атрибут», реквизиты не однозначны по своему содержанию и подразделяются на реквизиты-признаки и реквизиты-основания . Реквизиты-признаки характеризуют качественную сторону объекта, а реквизи­ты-основания - количественную. Например, в качестве реквизита-признака выступает наименование подразделения и его код, а рекви­зиты-основания - количество работающих. Каждый документ вклю­чает любое число реквизитов-признаков и реквизитов-оснований.

Показатель - логическое высказывание, содержащее качественную и количественную характеристики отображаемого явления.

Показатель является минимальной по составу информационной совокупностью для образования самостоятельного документа. В документах, как правило, содержится большое количество показателей. Даже в одной строке можно выделить несколько различных по структуре показателей. При организации базы данных показатели как еди­ницы информации формируют ее содержание. Каждый показатель имеет множество значений и рассчитывается по своему алгоритму. Система показателей определяет содержание управленческих документов и массивов. Например, система экономических по­казателей, представленная в балансе предприятия, в наряде на сдельную оплату труда и пр.

Система показателей устанавливается также в зависимости от уровня управления: корпорация, концерн, фирма, предприятие, ор­ганизация, подразделение.

Совокупность показателей, содержащихся в документе, образует ин­формационное сообщение .

Группа однородных документов, объединен­ных по определенному признаку (например, отчетному периоду), со­ставляет информационный массив (файл) . Файл является основной структурной единицей при автоматизированной обработке. Запись информации в память ПК осуществляется по файлам, где выделяют файлы постоянной и переменной информации. Массивы по различ­ным признакам могут объединяться в потоки, используемые при ре­шении различных комплексов задач управления. Отношение инфор­мации к той или иной функции управления дает основание выделить сложную структуру информации как информационную подсистему . Ин­формационная система охватывает всю информацию экономического объекта и является структурной единицей высшего уровня.

Таким образом, информационное обеспечение включает совокупность единой системы показателей, потоков информации - вариантов организа­ции документооборота; систем классификации и кодирования эко­номической информации, унифицированную систему документации и различные информационные массивы (файлы), хранящиеся в ма­шине и на машинных носителях и имеющие различную степень ор­ганизации.

Лекция 2

Информация и информационное обеспечение

Информация и информационные процессы

Информация – сведения об объектах и явлениях окружающего мира, которые повышают у ее потребителя уровень знаний о них.

Данные не тождественны информации, так как они могут рассматриваться как сведения, которые по каким-то причинам не используются. Если данные используются для уменьшения степени неопределенности об объекте, то они становятся информацией. Поэтому можно сказать, что информацией являются используемые данные. Данные регистрируют объективно существующие сигналы. Информация субъективна, т.к. субъективны методы ее получения из данных (все зависит от степени осведомленности и осмысления получателя). Таким образом, сведения, которые воспринимаются потребителем как новые и полезные, являются для него информацией.

Информация всегда имеет конечного потребителя. Этим потребителем может быть человек, подразделение компании, модуль корпоративной ИС или другая ИС. Процесс передачи информации (или данных) в форме сообщения от источника к потребителю посредством какой-нибудь среды («канала связи») называется информационным обменом .

Эффективность использования информации, показатели ее качества обусловлены характеристиками (свойствами) информации :

- адекватность – степень соответствия и. отражаемым свойствам объекта;

- достоверность – точность отражения реально существующего объекта;

- полнота – достаточность и. для понимания ситуации и принятия решения;

- доступность – степень восприятия и.;

- актуальность – степень сохранения ценности и.;

- своевременность поступления и.;

- точность ;

- устойчивость – способность и. реагировать на изменение исходных данных без нарушения необходимой точности;

- достоверность – отображение параметра с необходимой точностью. Измеряется доверительной вероятностью необходимой точности, т.е. вероятностью того, что отображаемое значение параметра отличается от его истинного значения в пределах необходимой точности.

Индустриальное общество рассматривает информацию как ресурс, аналогично материальным, природным, энергетическим, трудовым и финансовым ресурсам. Поэтому информация как ресурс характеризуетсястоимостью, потребительской стоимостью и ценой .

Информационные ресурсы (ИР) – это формы представления данных и знаний: отдельные документы и массивы документов в информационных системах (библиотеках, архивах, фондах, депозитариях, музейных хранилищах, банках данных и др.). В современном информационном обществе ИР – это знания, подготовленные для социального использования и зафиксированные на машинных носителях.

По масштабу формирования и использования различают мировые, национальные, региональные и локальные ИР.

Если ИР доступны для автоматизированного информационного обмена, то они называются активными ИР .

Понятие и структура информационного обеспечения ИС

Для повышения эффективности сбора и обработки данных всю используемую в ИС информацию структурируют (объединяют в единую информационную структуру), создавая на основе БД информационное обеспечение . Информационное обеспечение (ИО) является важнейшим элементом ИС и отражает информацию о состоянии экономического объекта.

Функции (назначение) ИО:

Организация хранения и поиска данных, предоставление пользователям оперативной и достоверной информации;

Создание условий работы автоматизированным ИТ;

Согласование задач функциональных подсистем на основе однозначного формализованного описания их входов и выходов на уровне показателей и документов.

Различают внемашинное ИО и внутримашинное ИО.

Внемашинное ИО включает:

Систему классификации и кодирования;

Систему документирования;

Систему документооборота (схемы информационных потоков).

Внутримашинное ИО – это весь информационный фонд ИС, т.е. совокупность всех данных, записанных на машинных носителях и сгруппированных по определенным признакам (организованных специальным образом).

Основные требования к ИО (ИО должна обеспечивать):

Организацию АРМ и активное участие пользователя в вычислительном процессе;

Децентрализованную организацию данных (предполагает разбиение БД на несколько физически распределенных БД, создание распределенной БД организации);

Распределенную обработку данных (предполагает распределение функциональной ИТ между несколькими участниками, т.е. обработку задания несколькими процессами в различных узлах сети);

Безбумажную технологию (автоматическое формирование первичных документов на ПК) и электронный документооборот;

Сетевую интегрированную обработку экономических задач;

Информационно-справочное обслуживание пользователей;

Использование электронной почты, выход в Интернет.

Под структурой ИО понимается состав элементов информации и взаимосвязь между ними (рис.1).

Основные структурные элементы информации : реквизиты , экономические показатели, экономические документы (в том числе электронные документы ), информационные массивы , потоки .

Рис. 1. Структура экономической информации

Структура ИО включает:

1. Систему показателей предметной области.

Реквизиты и показатели являются информационными единицами низшего уровня. Они служат основой для составления документов и хранения в памяти машины, поэтому система показателей является основой ИО.

Реквизит (атрибут) - самая простая элементарная единица экономической информации; отображает отдельное свойство объекта или процесса реального мира; состоит из знаков - цифр и букв; характеризуется именем, типом и значением.Реквизиты делятся на реквизиты-признаки и реквизиты-основания.

Реквизиты-признаки отражают качественные свойства объекта, процесса или явления; подлежат логической обработке, т.е. служат для поиска, сортировки, группировки, выборки и т.д. составных единиц.

Реквизиты-основания отражают количественную сторону объекта (количество материала, сумма, величина объема, длины и т.д.). Выражаются в цифровой форме, поэтому над ними выполняются логические и арифметические операции.

Реквизиты можно расчленить на более мелкие составляющие - символы и биты, но при этом теряется смысловое содержание реквизитов.

Отдельно взятый реквизит не может полностью характеризовать процесс или объект, поэтому он входит с другими реквизитами в состав экономических показателей.

Сочетание реквизита-основания и группы взаимосвязанных с ним и между собой по смыслу реквизитов-признаков образует показатель – составную единицу экономической информации. Показатель - это логическое высказывание, которое содержит качественную и количественную характеристики объекта. Каждый показатель имеет множество значений и рассчитывается по своему алгоритму. В приведенном примере на рисунке отражено два показателя (две строки).

Показатель можно определить как качественную переменную величину, которой соответствует множество возможных количественных значений, а также алгоритмы их вычисления по различным исходным данным. Это определение показателя используется в практике учета, статистики, планирования и т.п.

Показатель можно определить как высказывание, содержащее единственную количественную характеристику (значение) какого-либо свойства объекта и определенный набор качественных признаков, необходимых для его однозначной идентификации. Эта трактовка показателя принята в теории и практике автоматизированной обработки данных.

В состав наименования показателя входят термины, обозначающие измеряемый объект, т.е. что происходит с объектом (определяются наличие, мощность, выпуск, затраты, себестоимость, потери, прибыль и т.п.), и формальная характеристика, т.е. как он считается (сумма, объем, прирост, процент, разность, средняя и т.п.).

Показатели образуют более сложные составные структурные единицы информации: документы, массивы, информационные потоки, информационную базу.

2. Совокупность взаимосвязанных по смыслу реквизитов и показателей представляет собой информационное сообщение об объекте – документ . Документ (инф. сообщение) является составной единицей информации и характеризует объект, процесс, явление.

Каждый документ (сообщение) имеет определенную форму, т.е. является основной и наиболее удобной формой представления информации с точки зрения управления, так как обладает наглядностью представления информации и содержит атрибуты, придающие ему юридический статус.

3. Информация в документах может представляться в виде информационных массивов (файлов на машинных носителях). Информационный массив (файл) - основная структурная единица хранения информации. Формируется в памяти ПК объединением по определенному признаку однородных документов (одной формы и одного названия).

Часть файлов может использоваться для обработки только одной задачи (в этом случае массив называется укрупненным ), другая часть файлов - для нескольких задач.

Массивы могут объединяться в более крупные структурные единицы – информационные потоки и в самую крупную единицу – информационную базу.

4.Информационный поток – совокупность различных инф. массивов. Используется для обработки какого-либо комплекса экономических задач, т.е. относится к какому-то конкретному участку деятельности объекта.

Для реализации инф. потока используются технологии организации электронного документооборота.

5. Инф. подсистема – это организованная совокупность инф. потоков в какой-либо функциональной подсистеме. Например, автоматизация задач в функц. подсистеме «Бухгалтерский учет» позволяет выделить в ИС предприятия инф. подсистему «Бухгалтерский учет». В ИС банка выделяют подсистему «Операционный день банка».

6. Совокупность всех инф. подсистем объекта составляет структурную единицу информации высшего уровня - информационную базу (систему) , реализующую различные функции управления. Информационная база– это вся совокупность информационных потоков и подсистем реального экономического объекта.

Соответствующие структурные единицы информации выделяются в зависимости от особенностей машинного носителя и способов фиксации на нем данных.


Похожая информация.


Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

1. Документы внемашинной сферы ИО

Общая характеристика документов. Все документы характеризуются наименованием, отражающим содержание документа, и формой, определяющей структуру документа. Рассмотрим характеристику технико-экономических документов.

По характеру возникновения документы делятся на первичные, содержащие исходные данные, и производные, содержащие результаты обработки информации других документов. По роли в общей технологии обработки данных документы разделяются на:

Документы, используемые для первоначальной загрузки внутримашинной ИБ (нормативно-справочная и условно-постоянная информация);

Документы для ввода оперативной информации;

Извещения об изменении, периодически поступающие для корректировки ранее введенной информации и поддержания внутримашинной ИБ в актуальном состоянии;

Запросные документы, содержащие условия поиска данных, и документы, инициирующие выполнение задач.

Форма документов. Документы имеют постоянную часть, которая определяется формой (макетом, шаблоном). Форма документа отображает структуру информации, содержащейся в документе, и определяет состав, название и размещение реквизитов, входящих в документ. Для выявления структуры информации важны две части - заголовочная (шапка) и содержательная. Выделяют еще оформляющую часть документа (подпись и т.п.).

В шапке находятся код формы, название (вид) документа, дата заполнения, общие данные для всего документа.

Технико-экономическая информация чаще всего имеет дискретный характер, то есть может быть структурирована и представлена как совокупность структурных единиц информации:

Реквизит - составная единица информации (логически взаимосвязанная совокупность реквизитов) - документ.

Среди реквизитов различают реквизиты-признаки, содержащие качественные характеристики объекта, позволяющие выделить объект из множества различных объектов, и реквизиты-основания, содержащие количественную характеристику определяющие его состояние.

Семантический анализ реквизитов позволяет выявить функциональную зависимость реквизитов и выполнить на этой основе структурирование информации, которое дает возможность построить информационно-логическую модель предметной области и осуществить проектирование структуры базы данных.

Для наиболее распространенных видов документов могут использоваться унифицированные формы, включенные в унифицированные системы документации (УСД). Многие УСД используются для задач общегосударственных систем обработки и сопрягаются с единой системой классификации и кодирования (ЕСКК) технико-экономической информации.

Системы документации включают стандартные и технические условия, проектно-конструкторскую и технологическую, плановую, бухгалтерскую, финансовую, отчетно-статистическую документацию и др.

На промышленных предприятиях документация регламентируется по фазам управления: единая система конструкторской документации (ЕСКД) и единая система технологической документации (ЕСТД), система плановой документации и др.

Каждая система документации содержит перечень разрешенных для использования форм документов - формуляр-образец, на основе которого определяются формы документов, разрабатываются нормативные и методические материалы.

2. Информационные системы поддержки приятия решений

В любой информационной системе (ИС) в той или иной степени присутствуют Подсистемы (системы) Поддержки Принятия Решений (СППР, DSS (Decision Support System)).

СППР можно, в зависимости от данных, c которыми они работают, разделить на оперативные, предназначенные для немедленного реагирования на текущую ситуацию, и стратегические - основанные на анализе большого количества информации из разных источников с привлечением сведений, содержащихся в системах, аккумулирующих опыт решения проблем.

СППР первого типа получили название Информационных Систем Руководства (Executive Information Systems, ИСР). По сути, они представляют собой конечные наборы отчетов, построенные на основании данных из транзакционной информационной системы предприятия или OLTP-системы (On-line transaction processing), в идеале адекватно отражающей в режиме реального времени все аспекты производственного цикла предприятия. Для ИСР характерны следующие основные черты:

· отчеты, как правило, базируются на стандартных для организации запросах; число последних относительно невелико;

· ИСР представляет отчеты в максимально удобном виде, включающем, наряду с таблицами, деловую графику, мультимедийные возможности и т. п.;

· как правило, ИСР ориентированы на конкретный вертикальный рынок, например финансы, маркетинг, управление ресурсами.

СППР второго типа или предполагают достаточно глубокую проработку данных, специально преобразованных так, чтобы их было удобно использовать в ходе процесса принятия решений. СППР этого уровня может включать следующие компоненты:

1. информационное хранилище данных (Data Warehouse)

2. подсистему извлечения, преобразования и загрузки (импорта) данных (ETL - Extracting Transformating and Loading)

3. подсистемы анализа (OLAP и Data Mining).

Сравнительный анализ OLTP и систем анализа

Характеристика

Требования OLTP

Требования систем анализа

Степень детализации хранимых данных

Детализированные данные, затрагиваются отдельные записи

Детализированные и обобщенные данные, выполняются запросы над большим количеством данных с применением группировок и агрегирования

Качество данных

Допускаются «грязные» данные из-за ошибок ввода

Не допускаются ошибки в данных

Формат хранения данных

Разный формат данных в зависимости от приложений

Единый согласованный формат хранения данных

Избыточность данных

Максимальная нормализация

Допускается денормализация

Время обработки обращений к данным

Режим реального времени

Допускается отклик через несколько минут

Характер запросов к данным

Регламентированные запросы

Запросы к данным могут быть произвольными и заранее не оформлены

Управление данными

Возможность добавления, удаления, изменения данных

Возможность добавления, данных

Информация, на основе которой принимается решение, должна быть достоверной, полной, непротиворечивой и адекватной. В СППР второго типа традиционная технология подготовки интегрированной информации на основе запросов и отчетов стала неэффективной из-за резкого увеличения количества и разнообразия исходных данных.

Решение - концепция Хранилища Данных (Data Warehouse, ХД), которое выполняет функции предварительной подготовки и хранения данных для СППР на основе информации из системы управления предприятием (OLTP - системы), а также информации из сторонних источников, которые в достаточном количестве стали доступны на рынке информации.

Все данные в ХД делятся на три основные категории:

1. детальные данные

2. агрегированные данные

3. метаданные

Под аббревиатурой ETL -- extraction, transformation, loading, то есть извлечение, преобразование и загрузка, скрываются три основных процесса, используемые при переносе данных из одного приложения или системы в другие (плакат)

Использование собранных данных решается подсистемами анализа. Эти подсистемы могут основываться на следующих технологиях:

Регламентированные запросы (развиты еще до появления концепции БД);

Оперативный анализ данных;

Интеллектуальный анализ данных

ОLAP (Online Analytical Processing) - оперативная аналитическая обработка данных. Основная цель ОLAP - систем - поддержка произвольных (не регламентированных!) запросов пользователей аналитиков.

12 определяющих принципов OLAP сформулировал в 1993 г. Е. Ф. Кодд - "изобретатель" реляционных БД. Позже его определение было переработано в так называемый тест FASMI, требующий, чтобы OLAP-приложение предоставляло возможности быстрого анализа разделяемой многомерной информации.

Fast (Быстрый) - анализ должен производиться одинаково быстро по всем аспектам информации. Приемлемое время отклика - 5 с или менее.

Analysis (Анализ) - должна быть возможность осуществлять основные типы числового и статистического анализа, предопределенного разработчиком приложения или произвольно определяемого пользователем.

Of Shared (Разделяемой) - множество пользователей должно иметь доступ к данным, при этом необходимо контролировать доступ к конфиденциальной информации.

Multidimensional (Многомерной) - это основная, наиболее существенная характеристика OLAP.

Information (Информации) - приложение должно иметь возможность обращаться к любой нужной информации, независимо от ее объема и места хранения.

Data Mining- «добыча» данных. Это метод обнаружения в «сырых» данных ранее неизвестных, нетривиальных, практически полезных и доступных для интерпретации знаний, необходимых для принятия решений.

DM обеспечивает решение всего пяти задач -- классификация, кластеризация, регрессия, ассоциация, последовательность:

Классификация -- установление функциональной зависимости между входными и дискретными выходными переменными. При помощи классификации решается задача отнесение объектов (наблюдений, событий) к одному из заранее известных классов.

Регрессия- установление функциональной зависимости между входными и непрерывными выходными переменными. Прогнозирование чаще всего сводится к решению задачи регрессии.

Кластеризация -- это группировка объектов (наблюдений, событий) на основе данных (свойств), описывающих сущность объектов. Объекты внутри кластера должны быть «похожими» друг на друга и отличаться от объектов, вошедших в другие кластеры. Чем больше похожи объекты внутри кластера и чем больше отличий между кластерами, тем точнее кластеризация.

Ассоциация -- выявление зависимостей между связанными событиями, указывающих, что из события X следует событие Y. Такие правила называются ассоциативными. Впервые эта задача была предложена для нахождения типичных шаблонов покупок, совершаемых в супермаркетах, поэтому иногда ее еще называют анализом потребительской корзины (market basket analysis).

Последовательные шаблоны -- установление закономерностей между связанными во времени событиями. Например, после события X через определенное время произойдет событие Y.

Иногда специально выделяют задачу анализа отклонений -- выявление наиболее нехарактерных шаблонов.

Классификация используется в случае, если заранее известны классы отнесения объектов. Например, отнесение нового товара к той или иной товарной группе, отнесение клиента к какой-либо категории. При кредитовании это может быть, например, отнесение клиента по каким-то признакам к одной из групп риска.

Регрессия чаще всего используется при прогнозировании объемов продаж, в этом случае зависимой величиной являются объемы продаж, а факторами, влияющими на эту величину, могут быть предыдущие объемы продаж, изменение курса валют, активность конкурентов и т.д. или, например, при диагностике оборудования, когда оценивается зависимость надежности от различных внешних факторов, показателей датчиков, износа оборудования.

Кластеризация может использоваться для сегментирования и построения профилей клиентов (покупателей). При достаточно большом количестве клиентов становится трудно подходить к каждому индивидуально. Поэтому клиентов удобно объединить в группы - сегменты со сходными признаками. Выделять сегменты клиентов можно по нескольким группам признаков. Это могут быть сегменты по сфере деятельности, по географическому расположению. После сегментации можно узнать, какие именно сегменты являются наиболее активными, какие приносят наибольшую прибыль, выделить характерные для них признаки. Эффективность работы с клиентами повышается за счет учета их персональных или групповых предпочтений.

Ассоциации помогают выявлять совместно приобретаемые товары. Это может быть полезно для более удобного размещения товара на прилавках, стимулирования продаж. Тогда человек, купивший пачку спагетти, не забудет купить к ним бутылочку соуса.

Последовательные шаблоны могут быть использованы, например, при планировании продаж или предоставлении услуг. Например, если человек приобрел фотопленку, то через неделю он отдаст ее на проявку и закажет печать фотографий.

Для анализа отклонений необходимо сначала построить шаблон типичного поведения изучаемого объекта. Например, поведение человека при использовании кредитных карт. Тогда будет известно, что клиент (покупатель) использует карту регулярно два раза в месяц и приобретает товар в пределах определенной суммы. Отклонением будет, например, не запланированное приобретение товара по данной карте на большую сумму. Это может говорить об ее использовании другим лицом, то есть о факте мошенничества.

К базовым методам Data Mining, позволяющим решать перечисленные задачи относят:

Автокорреляцию;

Линейную регрессию;

Логистическую регрессию;

Нейронные сети;

Прогнозирование;

Деревья решений;

Ассоциативные правила;

Пользовательские модели;

Карты Кохонена;

3. Модели управления передачей, обработкой и хранением данных в информационных системах

Как правило, компьютеры и программы, входящие в состав информационной системы, не являются равноправными. Некоторые из них владеют ресурсами (файловая система, процессор, принтер, база данных и т.д.), другие имеют возможность обращаться к этим ресурсам. Компьютер (или программу), управляющий ресурсом, называют сервером этого ресурса (файл-сервер, сервер базы данных, вычислительный сервер...). Клиент и сервер какого-либо ресурса могут находиться, как в рамках одной вычислительной системы, так и на различных компьютерах, связанных сетью.

Основной принцип технологии "клиент-сервер" заключается в разделении функций приложения на три группы:

Ввод и отображение данных (взаимодействие с пользователем);

Прикладные функции, характерные для данной предметной области;

Функции управления ресурсами (файловой системой, базой данных и т.д.)

Поэтому, в любом приложении выделяются следующие компоненты:

Компонент представления данных

Прикладной компонент

Компонент управления ресурсом

Связь между компонентами осуществляется по определенным правилам, которые называют "протокол взаимодействия".

Компанией Gartner Group, специализирующейся в области исследования информационных технологий, предложена следующая классификация двухзвенных моделей взаимодействия клиент-сервер (двухзвенными эти модели называются потому, что три компонента приложения различным образом распределяются между двумя узлами):

Исторически первой появилась модель распределенного представления данных, которая реализовывалась на универсальной ЭВМ с подключенными к ней неинтеллектуальными терминалами. Управление данными и взаимодействие с пользователем при этом объединялись в одной программе, на терминал передавалась только "картинка", сформированная на центральном компьютере.

Затем, с появлением персональных компьютеров (ПК) и локальных сетей, были реализованы модели доступа к удаленной базе данных. Некоторое время базовой для сетей ПК была архитектура файлового сервера. При этом один из компьютеров является файловым сервером, на клиентах выполняются приложения, в которых совмещены компонент представления и прикладной компонент (СУБД и прикладная программа). Протокол обмена при этом представляет набор низкоуровненых вызовов операций файловой системы. Такая архитектура, реализуемая, как правило, с помощью персональных СУБД, имеет очевидные недостатки - высокий сетевой трафик и отсутствие унифицированного доступа к ресурсам.

С появлением первых специализированных серверов баз данных появилась возможность другой реализации модели доступа к удаленной базе данных. В этом случае ядро СУБД функционирует на сервере, протокол обмена обеспечивается с помощью языка SQL. Такой подход по сравнению с файловым сервером ведет к уменьшению загрузки сети и унификации интерфейса "клиент-сервер". Однако, сетевой трафик остается достаточно высоким, кроме того, по прежнему невозможно удовлетворительное администрирование приложений, поскольку в одной программе совмещаются различные функции.

Позже была разработана концепция активного сервера, который использовал механизм хранимых процедур. Это позволило часть прикладного компонента перенести на сервер (модель распределенного приложения). Процедуры хранятся в словаре базы данных, разделяются между несколькими клиентами и выполняются на том же компьютере, что и SQL-сервер. Преимущества такого подхода: возможно централизованное администрирование прикладных функций, значительно снижается сетевой трафик (т.к. передаются не SQL-запросы, а вызовы хранимых процедур). Недостаток - ограниченность средств разработки хранимых процедур по сравнению с языками общего назначения (C и Pascal).

На практике сейчас обычно используются смешанный подход:

Простейшие прикладные функции выполняются хранимыми процедурами на сервере

Более сложные реализуются на клиенте непосредственно в прикладной программе

На сегодня при создании ИС популярна концепция "тонкого клиента", функцией которого остается только отображение данных (модель удаленного представления данных). Данная концепция базируется на разработке компании MS Active Server Pages (ASP), основной целью которой является создание встроенных в Web-страницы серверных сценариев. Использование данной технологии позволяет использовать в стандартном тексте HTML-страниц фрагменты кода, которые будут выполняться непосредственно на Web-сервере. При этом пользователю будет представляться сформированная на основании приведенных действий ASP Web-страница.

В последнее время также наблюдается тенденция ко все большему использованию модели распределенного приложения. Характерной чертой таких приложений является логическое разделение приложения на две и более частей, каждая из которых может выполняться на отдельном компьютере. Выделенные части приложения взаимодействуют друг с другом, обмениваясь сообщениями в заранее согласованном формате. В этом случае двухзвенная архитектура клиент-сервер становится трехзвенной, а к некоторых случаях, она может включать и больше звеньев.

4. Основные понятия реляционной модели данных

информационный реляционный документ

Основу модели составляет набор взаимосвязанных таблиц, в которых хранятся данные.

Схема базы данных - набор заголовков таблиц, взаимосвязанных друг с другом

Заголовок отношения - заголовок таблицы - названия полей (столбцов) таблицы

Тело отношения - тело таблицы - совокупность значений для всех объектов реального мира, которая представлена в виде записей таблицы (строк таблицы)

Схема отношения - строка заголовков столбцов

Кортеж отношения - строка таблицы, однозначное представление объекта реального мира

Домен - множество допустимых значений атрибута

Степень отношения - количество столбцов отношения

Мощность отношения количество строк (КОРТЕЖЕЙ)

Целостность данных - это механизм поддержания соответствия базы данных предметной области. В реляционной модели данных определены два базовых требования обеспечения целостности:

ь целостность сущностей - каждый кортеж любого отношения должен отличатся от любого другого кортежа этого отношения (т.е. любое отношение должно обладать первичным ключом). Очевидно, что если данное требование не соблюдается (т.е. кортежи в рамках одного отношения не уникальны), то в базе данных может хранится противоречивая информация об одном и том же объекте. Поддержание целостности сущностей обеспечивается средствами системы управления базой данных (СУБД). Это осуществляется с помощью двух ограничений:

1. при добавлении записей в таблицу проверяется уникальность их первичных ключей;

2. не позволяется изменение значений атрибутов, входящих в первичный ключ.

ь целостность ссылок (ссылочная целостность).

Наряду с первичными ключами отношения имеют внешние ключи. Если отношение С связывает отношения А и В, то оно должно включать внешние ключи, соответствующие первичным ключам отношений А и В.

Условие ссылочной целостности ставит следующие проблемы проектирования БД:

ь возможно или невозможно появление во внешних ключах неопределенных значений (NULL-значения - значения атрибута для отсутствующей информации);

ь что произойдет при попытке удаления кортежей из отношения, на который ссылается внешний ключ. При этом существуют следующие возможности:

1. операция каскадируется - то есть удаление кортежей в отношении приводит к удалению соответствующих кортежей в связанном отношении;

2. операция ограничивается - то есть удаляются лишь те кортежи, для которых связанной информации в другом отношении нет. Если такая информация имеется, то удаление осуществлять нельзя.

ь что произойдет при попытке обновления первичного ключа отношения, на которое ссылается некоторый внешний ключ. При этом существуют следующие возможности:

1. операция каскадируется - то есть при обновлении первичного ключа происходит обновление внешнего ключа в связанном отношении;

2. операция ограничивается - то есть обновляются лишь те первичные ключи, для которых связанной информации в другом отношении нет. Если таковая информация имеется, то обновление сделать нельзя.

Нормализация - процесс проверки и реорганизации сущностей и атрибутов с целью удовлетворения требований к реляционной модели данных. Нормализация позволяет быть уверенным, что каждый атрибут определен для своей сущности, значительно сократить объем памяти для хранения информации и устранить аномалии в организации хранения данных. В результате проведения нормализации должна быть создана структура данных, при которой информация о каждом факте хранится только в одном месте. Процесс нормализации сводится к последовательному приведению структуры данных к нормальным формам - формализованным требованиям к организации данных. Известны шесть нормальных форм:

ь первая нормальная форма (1NF);

ь вторая нормальная форма (2NF);

ь третья нормальная форма (3NF);

ь нормальная форма Бойса - Кодда (усиленная 3NF);

ь четвертая нормальная форма (4NF);

ь пятая нормальная форма (5NF).

На практике обычно ограничиваются приведением данных к третьей нормальной форме. Нормальные формы основаны на понятии функциональной зависимости (в дальнейшем «зависимость»).

Функциональная зависимость - Атрибут В сущности Е функционально зависит от атрибута А сущности Е, если в любой момент времени каждому значению В соответствует ровно одно значение А. т. е. А однозначно определяет В.

Полная функциональная зависимость - Атрибут В сущности Е полностью функционально зависит от ряда атрибутов А сущности Е, если В функционально зависит от А и не зависит ни от какого подряда А.

Первая нормальная форма (1NF). Сущность находится в первой нормальной форме тогда и только тогда, когда все атрибуты содержат атомарные значения. Среди атрибутов не должно встречаться повторяющихся групп, т. е. несколько значений для каждого экземпляра.

Для приведения сущности к первой нормальной форме следует:

ь разделить сложные атрибуты на атомарные,

ь создать новую сущность,

ь перенести в нее все «повторяющиеся» атрибуты,

ь выбрать возможный ключ для новой сущности (или создать новый ключ);

ь установить связь от прежней сущности к новой, Первичный ключ прежней сущности станет внешним ключом для новой сущности.

Вторая нормальная форма (2NF). Сущность находится во второй нормальной форме, если она находится в первой нормальной форме, и каждый неключевой атрибут полностью зависит от первичного ключа (не должно быть зависимости от части ключа). Вторая нормальная форма имеет смысл только для сущностей, имеющих сложный первичный ключ.

Для приведения сущности ко второй нормальной форме следует:

ь выделить атрибуты, которые зависят только от части первичного ключа, создать новую сущность;

ь поместить атрибуты, зависящие от части ключа, в их собственную (новую) сущность;

ь установить связь от прежней сущности к новой.

Третья нормальная форма (3NF). Сущность находится в третьей нормальной форме, если она находится во второй нормальной форме и никакой неключевой атрибут не зависит от другого неключевого атрибута (не должно быть взаимозависимости между неключевыми атрибутами).

Для приведения сущности к третьей нормальной форме следует:

ь создать новую сущность и перенести в нее атрибуты с одной и той же зависимостью от неключевого атрибута;

ь использовать атрибут(ы), определяющий эту зависимость, в качестве первичного ключа новой сущности;

ь установить связь от новой сущности к старой.

5. Понятие и составляющие информационного обеспечения систем управления. Базы данных и знаний. Понятие и функции системы управления базами данных

Информационное обеспечение - это совокупность методов и средств по размещению и организации информации, включающих в себя системы: классификации и кодирования; унифицированные системы документации, рационализации документооборота и форм документов; методов создания внутримашинной информационной базы ИС.

Таким образом, сферы информационного обеспечения:

1. Внемашинная сфера (внемашинная информационная база и средства организации и ведения внемашинной информационной базы)

2. Внутримашинная сфера (внутримашинная информационная база и средства организации и ведения внутримашинной информационной базы)

Внемашинная информационная база служит источником формирования внутримашинной информационной базы. Наиболее важными вопросами подготовки внемашинного информационного обеспечения предметной области являются:

ь определение состава документов, содержащих необходимую информацию для решения задач пользователя;

ь определение форм документов и структуры информации (выявление структурных единиц информации и их взаимосвязей);

ь классификация и кодирование информации, обрабатываемой в задачах пользователя;

ь разработка инструктивных и методических материалов по ведению документов информации для обработки.

К средствам организации и ведения внемашинной информационной базы относятся:

1. Системы классификации и кодирования информации

2. Унифицированные системы документов

3. Инструктивные и методические материалы по ведению документов

К внутримашинной информационной базе относятся:

ь базы данных;

ь базы знаний;

ь отдельные невзаимозависимые массивы входных, выходных и промежуточных данных, хранимых на машинном носителе.

К средствам организации и ведения внутримашинной информационной базы относятся:

ь программные средства организации и ведения внутримашинной информационной базы (системы, основанные на концепциях база данных и баз знаний, программные средства ввода и контроля данных, сервисные средства копирования и архивирования, прикладные программы пользователя и т.п.);

ь технологические инструкции по ведению информационной базы на машинных носителях.

База данных - организованная совокупность данных, состоящая из связанных между собой данных об объектах некоторой предметной области, их свойствах и характеристиках.

База знаний - организованная совокупность знаний, относящихся к какой-нибудь предметной области, представленная определенной структурой.

Данные - информация фактического характера, описывающая объекты, процессы и явления предметной области, а также их свойства.

Знания описывают не только отдельные факты, но и взаимосвязи между ними. В компьютере знания должны быть представлены определенными структурами данных, соответствующими среде разработки интеллектуальной информационной системе. По своей природе знания делятся на декларативные и процедурные. Декларативные знания представляют собой описания фактов и явлений, фиксируют наличие или отсутствие таких фактов, также включают описания основных связей и закономерностей, в которые эти факты и явления входят. Процедурные знания - это описания действий, которые возможны при манипулировании фактами и явлениями для достижения намеченных целей.

Система управления базами данных (СУБД) - программное средство, предназначенное для организации и ведения логически взаимосвязанных данных на внешнем носителе, а также обеспечивающее доступ к данным.

Интеллектуальная информационная система основана на концепции использования баз знаний для генерации алгоритмов решения прикладных задач различных классов в зависимости от конкретных информационных потребностей пользователей.

К функциям СУБД относят следующие (к лекции по СУБД):

ь управление данными непосредственно в БД - функция, обеспечивающая хранение данных, непосредственно входящих в БД и служебной информации, обеспечивающей работу СУБД;

ь управление данными в памяти компьютера - функция, связанная в первую очередь с тем, что СУБД работают с БД большого размера. В целях ускорения работы СУБД используется буферизация данных в оперативной памяти компьютера. При этом пользователь получает только необходимую для его конкретной задачи часть БД, а при необходимости получает новую «порцию» данных;

управление транзакциями - функция СУБД, которая производит ряд операций над БД, как единым целым. Транзакция - это последовательность операций над БД, рассматриваемых СУБД как единое целое. Транзакция переводит БД из одного целостного состояния в другое.

ь управление изменениями в БД и протоколирование - функция, связанная с надежностью хранения данных, то есть возможностью СУБД восстанавливать состояние БД в аварийных ситуациях, например, при случайном выключении питания или сбое носителя информации. Для восстановления БД нужно располагать дополнительной информацией, по которой осуществляется восстановление. С этой целью ведется протокол изменений БД, в которой перед манипуляциями с данными делается соответствующая запись. Для восстановления БД после сбоя СУБД используется протокол и архивная копия БД - полная копия БД к моменту начала заполнения протокола.

ь поддержка языков БД - для работы с БД используется специальные языки, в целом называемые языками баз данных. В СУБД обычно поддерживается единый язык, содержащий все необходимые средства - от создания БД до обеспечения пользовательского интерфейса при работе с данными. Наиболее распространенным в настоящее время языком СУБД является язык SQL (Structured Query Language).

6. Понятие и составляющие информационной системы (ИС). Модели жизненного цикла ИС. Классы задач, решаемые ИС

Информационная система (в контексте управления) представляет собой коммуникационную систему по сбору, передаче, переработке информации для реализации функции управления

Информационная система (ИС), как правило, включает следующие компоненты:

1. функциональные компоненты;

2. компоненты системы обработки данных и знаний;

3. организационные компоненты.

Под функциональными компонентами понимается система функций управления - полный набор взаимосвязанных во времени и пространстве работ по управлению, необходимых для достижения целей управления.

Системы обработки данных и знаний предназначены для информационного обслуживания системы управления. Компонентами этой системы являются: информационное обеспечение, программное обеспечение, техническое обеспечение, правовое обеспечение, лингвистическое обеспечение.

Выделение организационной компоненты обусловлено особой значимостью человеческого фактора. Под организационными компонентами ИС понимается совокупность методов и средств, позволяющих усовершенствовать организационную структуру системы управления и управленческие функции.

Жизненный цикл ИС определяется как период времени, который начинается с момента принятия решения о необходимости создания ИС и заканчивается в момент ее изъятия из эксплуатации.

Под моделью ЖЦ понимается структура, определяющая последовательность выполнения и взаимосвязи процессов, действий и задач, выполняемых на протяжении ЖЦ. Модель ЖЦ зависит от специфики ИС и специфики условий, в которых последняя создается и функционирует.

К настоящему времени наибольшее распространение получили следующие основные модели ЖЦ: задачная модель, каскадная модель, спиральная модель.

При разработке системы "снизу-вверх" от отдельных задач ко всей системе (задачная модель) единый поход к разработке неизбежно теряется, возникают проблемы при информационной стыковке отдельных компонентов. Как правило, по мере увеличения количества задач трудности нарастают, приходится постоянно изменять уже существующие программы и структуры данных. Скорость развития системы замедляется, что тормозит и развитие самой организации. Однако в отдельных случаях такая технология может оказаться целесообразной:

Крайняя срочность (надо чтобы хоть как-то задачи решались; потом придется все сделать заново);

Эксперимент и адаптация заказчика (не ясны алгоритмы, решения нащупываются методом проб и ошибок).

Общий вывод: достаточно большую эффективную ИС таким способом создать невозможно.

Рассмотрим каскадную и спиральную модели:

Принято выделять следующие этапы ЖЦ ИС: анализ, проектирование, реализация, внедрение, сопровождение.

7. Каскадная модель ЖЦ Спиральная модель ЖЦ

Положительные стороны применения каскадного подхода заключаются в следующем:

ь на каждом этапе формируется законченный набор проектной документации, отвечающий критериям полноты и согласованности;

ь выполняемые в логичной последовательности этапы работ позволяют планировать сроки завершения всех работ и соответствующие затраты.

Однако, в процессе использования каскадного подхода обнаруживается ряд его недостатков, вызванных прежде всего тем, что реальный процесс создания ИС никогда полностью не укладывается в такую жесткую схему. В процессе создания системы постоянно возникает потребность в возврате к предыдущим этапам и уточнении или пересмотре ранее принятых решений. Для преодоления перечисленных проблем была предложена спиральная модель жизненного цикла, делающая упор на начальные этапы ЖЦ ИС: анализ и проектирование.

На этих этапах реализуемость технических решений проверяется путем создания прототипов. Каждый виток спирали соответствует созданию фрагмента или версии системы, на нем уточняются цели и характеристики проекта, определяется его качество, и планируются работы следующего витка спирали. Таким образом, углубляются и последовательно конкретизируются детали проекта, и в результате выбирается обоснованный вариант, который доводится до реализации.

Первым видом прототипов является модель системы в графическом виде (например, DFD-модели), доступном для понимания пользователями.

Вторым видом прототипов являются макеты экранных форм, позволяющие согласовать поля базы данных и функции конкретных пользователей.

Третьим видом прототипов являются работающие экранные формы, т.е. уже частично запрограммированные. Это позволяет опробовать программу в действии. Как правило, это вызывает новый поток замечаний и предложений.

В соответствии с этапами ЖЦ ИС можно выделить несколько категорий специалистов, обеспечивающих этот ЖЦ: системные аналитики, программисты, пользователи-специалисты в конкретной предметной области.

Задачи, решаемые ИС, можно свести к ряду типовых:

1. Управление - перевод и поддержание системы в требуемом состоянии;

2. Прогноз - определение будущего процесса по его прошлому и настоящему;

3. Оптимизация - нахождение решений, которые минимизируют или максимизируют определенный критерий качества при заданных ограничениях;

4. Классификация образов - определение принадлежности объектов к одному или нескольким предварительно определенным классам;

5. Кластеризация - разделение объектов на заранее не определенные классы по каким-либо признакам;

6. Аппроксимация функций - оценка неизвестной зависимости по экспериментальным данным.

Обработку данных реляционной модели можно реализовать методами реляционной алгебры.

Реляционная алгебра, определена Коддом и содержит 8 операций, разделенных на две группы:

1. Теоретико - множественные операции - объединение, пересечение, вычитание и декартово произведение.

2. Специальные реляционные операции - выборка, проекция, соединение, деление

Теоретико-множественные операции

Реляционный оператор представляет собой функцию с отношениями в качестве аргументов и возвращающую отношение в качестве результата.

R=f(R1, R2….. Rn)

В качестве аргументов в реляционные операторы могут быть проставлены другие реляционные операторы, подходящие по типу.

R=f(f1(R11, R21….. Rn1), f2(R21, R22….. R2n)….)

В силу этого реляционная алгебра является замкнутой.

Отношения называются совместимыми по типу, если они имеют идентичные заголовки, а именно:

1. отношения имеют одно и тоже множество имен атрибутов, т.е. для любого атрибута в одном отношении найдется атрибут с таким же наименованием в другом отношении.

2. атрибуты с одинаковыми именами определены на одних и тех же доменах.

Некоторые отношения не являются совместимыми по типу, но становятся таковыми после переименования атрибутов.

Оператор переименования R rename A1,A2,… as new A1, new A2…,

Например:

R rename student as starosta

Объединение

Объединением двух совместимых по типу отношений называется отношение с тем же заголовком, что и у R1 и R2, и телом, включающим все кортежи операндов, за исключением повторяющихся.

Синтаксис R1 union R2

Объединение

Операторы не передают результату никаких данных о потенциальных ключах.

Пересечение

Пересечением двух совместимых по типу отношений R1 и R2 называется отношение с тем же заголовком, что и у отношений R1 и R2, и телом, состоящим из кортежей, принадлежащих одновременно обоим отношениям R1 и R2.

Синтаксис

Вычитание

Вычитанием двух совместимых по типу отношений R1 и R2, называется отношение с тем же заголовком, что и у отношений R1 и R2, и телом, состоящим из кортежей, принадлежащих отношению R1 и не принадлежащих R2.

Синтаксис R1 minus R2

Декартово произведение

Декартовым произведением двух отношений R1(R11, R12, R13…) и R2(R21,R22,R23,…) называется отношение, заголовок которого является сцеплением заголовком отношений R1 и R2:

(R11, R12, R13… R21,R22,R23,…), а тело состоит из кортежей, являющихся сцеплением кортежей отношений R1 и R2

(r11, r12, r13… r21, r22, r23….), таких что (r11, r12, r13…) принадлежит R1, а (r21, r22, r23….) принадлежит R2/

Синтаксис R1 times R2

Мощность произведения равна произведению мощностей. Если атрибуты R1 и R2 имеют атрибуты с одинаковыми наименованиями, то перед выполнением операции декартового произведения такие атрибуты необходимо переименовать. Совместимость по типу не требуется.

Специальные реляционные операторы

Выборка (ограничение, селекция)

Выборку называют горизонтальным срезом отношения по некоторому условию.

Выборкой на отношении R с условием С называется отношение с тем же заголовком, что и у отношения R, и телом, состоящим из кортежей, значения атрибутов которых при подстановке в условие С дают значение ИСТИНА.

Обычно условие С имеет вид R11 R12, где принадлежит {=}, а R11 и R12 атрибуты отношения R или скалярные значения. Такие выборки называются - выборки.

Синтаксис R where C или R where R11 R12

Выборка R where стипендия >250

Проекция

Проекцией отношения R по атрибутам R1, R1, R1…Rn, где каждый атрибут принадлежит R, называется отношение с заголовком (R1, R2, R3…Rn) и телом, содержащим множество кортежей вида (r1,r2,r3,…rn). При этом дубликаты кортежи удаляются.

Проекцию называют вертикальным срезом отношения.

Синтаксис R

R[факультет]

Соединение

Обычно рассматривают несколько разновидностей операции соединения.

Общая операция соединения

Соединение

Экви-соединение

Естественное соединение

Наиболее важным из этих операций является операция естественного соединения. Так как остальные разновидности соединения являются частными случаями общей операции соединения.

Общая операция соединения:

Соединением отношений R1 и R2 по условию называется отношение

(R1 times R2) where C, где С представляет собой логическое выражение, в которое могут входить атрибуты отношений R1 и R2 и/или скалярные выражения. То есть, чтобы выполнить операцию соединения, необходимо выполнить последовательно операцию декартова произведения и выборки. Если в отношениях R1 и R2 имеются атрибуты с одинаковыми наименованиями, то перед выполнением соединения такие атрибуты необходимо переименовать.

Соединение

(R1 times R2) where R11R21 - -соединение отношения R1 по атрибуту R11 с отношением R2 по атрибуту R21. Записывают и

Какие экзамены должны быть сданы студентами, закончившими учебный год

R1[семестр <=2*курс]R2

Наименование

Математика

Философия

Философия

Математика

Леонидов

Математика

Леонидов

Леонидов

Философия

Экви соединение это соединение, когда есть равенство.

Естественное соединение

Пусть даны отношения R1(R11,R12,R13,..R1n,Z1,Z2,…Zn) и R2(Z1,Z2,…Zn, R21,R22,R23,..,R2m). Тогда естественным соединением отношений R1 и R2 называется отношение с заголовком (R11,R12,R13,..R1n,Z1,Z2,…Zn, R21,R22,R23,..,R2m) и телом, содержащим множество кортежей (r11,r12,r13,…r1n,z1,z2,z3,…zn, r21, r22,…r2m), таких что (r11,r12,r13,…r1n,z1,z2,z3,…zn) принадлежит R1, а (z1,z2,z3,…zn, r21, r22,…r2m) принадлежит R2

Синтаксис

Соединение производится по одинаковым атрибутам.

R1 join R2 join R3

У операции деления два операнда бинарное и унарное. Результативное отношение состоит из одноатрибутивных кортежей, включающих значения первого атрибута кортежей первого операнда-отношения, таких что множество значений второго атрибута совпадает со множеством значений единственного атрибута второго операнда-отношения.

Синтаксис R1 divideby R2

Для работы с БД, которые частично или полностью используют реляционную модель данных предназначен язык SQL. Язык разработан на основе реляционной алгебры и относится к непроцедурным языкам программирования (можно определить то, что необходимо выполнить, а не то как это сделать). Язык оперирует отношениями и в результате инструкций языка получается отношение.

Первый стандарт языка разработан в 1989 году Национальным институтом стандартизации США (ANSI). В 1992 году появилась версия SQL92, в 1999 году SQL3. Сегодня различают различные типы диалектов, расширяющие стандарт языка.

Существуют две формы языка:

Интерактивный - создание запросов в режиме диалога

Встроенный - инструкции языка, которые встраиваются внутрь программ, написанных на другом языке (например, при разработке приложений, обрабатывающих данные, расположенные в БД).

Рассмотрим интерактивную форму.

Типы команд языка

DDl- язык определения данных

CREATE TABLE, ALTER TABLE, DROP TABLE, CREATE VIEW, ALTER VIEW, DROP VIEW, CREATE INDEX, DROP INDEX

DML - язык манипулирования данными

INSERT, UPDATE, DELETE

DQL - язык запросов к данным

DCL - язык управления данными, либо команды администрирования данных

CREATE DATABASE, ALTER DATABASE, DROP DATABASE, GRANT (предоставление прав доступа для действий над заданными объектами БД), REVOKE (лишение прав доступа для действий над заданными объектами БД) и др.

Команды администрирования данных- предоставляют возможность аудита и анализа операций внутри БД. Могут использоваться при анализе производительности системы данных в целом.

START AUDIT, STOP AUDIT

Команды управления транзакциями - позволяют выполнить обработку информации, объединенной в транзакцию

COMMIT, ROLLBACK, SAVE POINT, SET TRANSACTION (назначение имени транзакции)

Процедурный язык

DECLARE, OPEN, FETCH, CLOSE, EXECUTE и др.

8. Структурная модель предметной области

Под моделью предметной области понимается некоторая система, имитирующая структуру или функционирование исследуемой предметной области и отвечающая основному требованию - быть адекватной этой области.

К моделям предметных областей предъявляются следующие требования:

· формализация, обеспечивающая однозначное описание структуры предметной области;

· понятность для заказчиков и разработчиков на основе применения графических средств отображения модели;

· реализуемость, подразумевающая наличие средств физической реализации модели предметной области в ИС;

· обеспечение оценки эффективности реализации модели предметной области на основе определенных методов и вычисляемых показателей.

Для реализации перечисленных требований, как правило, строится система моделей, которая отражает структурный и оценочный аспекты функционирования предметной области.

Структурный аспект предполагает построение:

· объектной структуры, отражающей состав взаимодействующих в процессах материальных и информационных объектов предметной области;

· функциональной структуры, отражающей взаимосвязь функций (действий) по преобразованию объектов в процессах;

· структуры управления, отражающей события и бизнес-правила, которые воздействуют на выполнение процессов;

· организационной структуры, отражающей взаимодействие организационных единиц предприятия и персонала в процессах;

· технической структуры, описывающей топологию расположения и способы коммуникации комплекса технических средств.

Для отображения структурного аспекта моделей предметных областей в основном используются графические методы, которые должны гарантировать представление информации о компонентах системы. Главное требование к графическим методам документирования -- простота. Графические методы должны обеспечивать возможность структурной декомпозиции спецификаций системы с максимальной степенью детализации и согласований описаний на смежных уровнях декомпозиции

основе различных методологий моделирования предметной области ИС лежат принципы последовательной детализации абстрактных категорий. Обычно модели строятся на трех уровнях: на внешнем уровне (определении требований), на концептуальном уровне (спецификации требований) и внутреннем уровне (реализации требований). Так, на внешнем уровне модель отвечает на вопрос, что должна делать система, то есть определяется состав основных компонентов системы: объектов, функций, событий, организационных единиц, технических средств. На концептуальном уровне модель отвечает на вопрос, как должна функционировать система? Иначе говоря, определяется характер взаимодействия компонентов системы одного и разных типов. На внутреннем уровне модель отвечает на вопрос: с помощью каких программно-технических средств реализуются требования к системе? С позиции жизненного цикла ИС описанные уровни моделей соответственно строятся на этапах анализа требований, логического (технического) и физического (рабочего) проектирования. Рассмотрим особенности построения моделей предметной области на трех уровнях детализации.

Объектная структура

Объект -- это сущность, которая используется при выполнении некоторой функции или операции (преобразования, обработки, формирования и т.д.).

На внешнем уровне детализации модели выделяются основные виды материальных объектов (например, сырье и материалы, полуфабрикаты, готовые изделия, услуги) и основные виды информационных объектов или документов (например, заказы, накладные, счета и т.д.).

На концептуальном уровне построения модели предметной области уточняется состав классов объектов, определяются их атрибуты и взаимосвязи. Таким образом строится обобщенное представление структуры предметной области.

Далее концептуальная модель на внутреннем уровне отображается в виде файлов базы данных, входных и выходных документов ЭИС. Причем динамические объекты представляются единицами переменной информации или документами, а статические объекты -- единицами условно-постоянной информации в виде списков, номенклатур, ценников, справочников, классификаторов. Модель базы данных как постоянно поддерживаемого информационного ресурса отображает хранение условно-постоянной и накапливаемой переменной информации, используемой в повторяющихся информационных процессах.

Функциональная структура

Функция (операция) представляет собой некоторый преобразователь входных объектов в выходные.

На внешнем уровне моделирования определяется список основных бизнес-функций или видов бизнес-процессов. Обычно таких функций насчитывается 15-20.

На концептуальном уровне выделенные функции декомпозируются и строятся иерархии взаимосвязанных функций.

На внутреннем уровне отображается структура информационного процесса в компьютере: определяются иерархические структуры программных модулей, реализующих автоматизируемые функции.

Структура управления

События вызывают выполнение функций, которые, в свою очередь, изменяют состояния объектов и формируют новые события, и т.д., пока не будет завершен некоторый бизнес-процесс.

На внешнем уровне определяются список внешних событий, вызываемых взаимодействием предприятия с внешней средой (платежи налогов, процентов по кредитам, поставки по контрактам и т.д.), и список целевых установок, которым должны соответствовать бизнес-процессы (регламент выполнения процессов, поддержка уровня материальных запасов, уровень качества продукции и т.д.).

На концептуальном уровне устанавливаются бизнес-правила, определяющие условия вызова функций при возникновении событий и достижении состояний объектов.

На внутреннем уровне выполняется формализация бизнес-правил в виде триггеров или вызовов программных модулей.

Организационная структура

Организационная структура представляет собой совокупность организационных единиц, как правило, связанных иерархическими и процессными отношениями. Организационная единица -- это подразделение, представляющее собой объединение людей (персонала) для выполнения совокупности общих функций или бизнес-процессов.

На внешнем уровне строится структурная модель предприятия в виде иерархии подчинения организационных единиц или списков взаимодействующих подразделений.

На концептуальном уровне для каждого подразделения задается организационно-штатная структура должностей (ролей персонала).

Подобные документы

    Основные понятия и классификация систем управления базами данных. Модели организации данных. Проектирование реляционных баз данных. Основные особенности создания и использования баз данных для информационного обеспечения управленческой деятельности.

    курсовая работа , добавлен 20.01.2013

    Раскрытие понятий "информация", "данные", "знания". Описание внемашинного и внутримашинного информационного обеспечения, систем показателей, классификации и кодирования. Изучение состава информационного обеспечения управления на конкретном примере.

    курсовая работа , добавлен 26.09.2012

    Состав и способы создания информационного обеспечения. Организация внутримашинного информационного обеспечения. Организация данных во внутримашинной сфере. Подразделение информационного обеспечения на внемашинное и внутримашинное. Компоненты базы данных.

    контрольная работа , добавлен 24.04.2009

    Структура и назначение внемашинного информационного обеспечения. Документы внемашинной сферы, их классификация и типовые формы. Логическая структура экономической информации и ее элементы. Операции по образованию дебиторской, кредиторской задолженности.

    контрольная работа , добавлен 27.07.2009

    Изучение особенностей информационного процесса обработки данных. Процессы, связанные с поиском, хранением, передачей, обработкой и использованием информации. Основные режимы обработки данных на ЭВМ. Организация обслуживания вычислительных задач.

    реферат , добавлен 28.09.2014

    Информационное обеспечение, система автоматизированного управления. Классификаторы технико-экономической информации, унифицированные документы. Этапы проектирования информационного обеспечения. Анализ методов и матрицы смежности информационного графа.

    реферат , добавлен 29.10.2010

    Современные системы управления базами данных (СУБД). Анализ иерархической модели данных. Реляционная модель данных. Постреляционная модель данных как расширенная реляционная модель, снимающая ограничение неделимости данных, хранящихся в записях таблиц.

    научная работа , добавлен 08.06.2010

    Методы организации процесса обработки информации; основные направления реализации внутримашинного информационного обеспечения. Принципы построения и эффективного применения технологий баз и банков данных как основных компонентов автоматизированных систем.

    дипломная работа , добавлен 30.05.2013

    Функции автоматизированной системы "Отдел аспирантуры". Проектирование реляционной модели и разработка SQL-кода базы данных. Анализ информационного обеспечения функций. Проектирования глобальной ER-модели. Спецификации локальных ограничений и правил.

    курсовая работа , добавлен 01.04.2011

    Сущность и характеристика типов моделей данных: иерархическая, сетевая и реляционная. Базовые понятия реляционной модели данных. Атрибуты, схема отношения базы данных. Условия целостности данных. Связи между таблицами. Общие представления о модели данных.



Есть вопросы?

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: