Разработка структуры хранилища данных. Технология построения информационного блока управленческой отчетности и аналитической обработки данных в сфере управления финансами

Семантика - слово, пришедшее в наш язык из греческого, где его смыслом было «значимый». В филологии оно впервые было применено во Франции М. Бреалем, занимавшимся не только развитием языка, но и историей. О том, что такое семантика, могут рассказать многие языковеды. Под термином принято понимать такую науку, которая посвящена смыслу слова, множеству букв и предложений.

А если попонятнее?

Наиболее общее значение термина (именно его обычно подразумевают) можно уточнить как «лексическая семантика». Она занимается осмысленной нагрузкой отдельно взятых слов. А вот языковеды, исследующие алфавиты, сохранившиеся с древности, знают, какова смысловая нагрузка отдельных букв. Некоторые специалисты занимаются текстами, фразами, законченными предложениями. Такая область - еще одно из полей применения семантического научного подхода.

Разбирая, что такое семантика, нужно обязательно упомянуть о родстве с другими дисциплинами. В частности, тесны связи с:

  • логикой;
  • языковой философией;
  • коммуникационными теориями;
  • антропологией (языка, символов);
  • семиологией.

Рассматривая науку подробнее, необходимо сразу сформулировать объект, который она исследует: семантическое поле. Это такой комплекс терминов, для которых свойственен некий общий фактор.

Объект исследования

Если спросить филолога, что такое семантика, специалист расскажет: термином принято обозначать науку, занимающуюся не только осмысленной нагрузкой слов, но и философскими языковыми аспектами. Кроме того, распространяется дисциплина и на используемые программистами языки, на формальную логику, семиотику. Посредством разработанных в семантике инструментов можно провести результативный анализ текста. Благодаря этой науке можно вычленить соотношения фраз, слов, символов, взаимосвязь со значениями.

Впрочем, описанное значение - лишь общее представление, что такое семантика. На самом деле в настоящее время понятие намного шире. Оно применяется для некоторых специализированных философских течений и даже в рамках одного из подходов, призывающих людей изменить свое отношение в мире, уйти прочь от «культуры потребления». Проблема эта в последние годы стала действительно актуальной, и одно из ее решений получило наименование «общая семантика». Стоит признать, у нее есть немало поклонников.

Понимание сути

Так сложилось, что семантика языка - наука, для которой очень актуальна проблема понимания. Проще говоря, обыватель запросто может сказать, чем занимается математика или физика, но не всякий быстро сориентируется в сфере исследования семантики. Что удивительно, не столько лингвисты, сколько психологи поставили перед собой задачу формулирования понимания сути семантики. В то же время интерпретация символов, знаков - вопрос, свойственный строго лингвистике и никакой иной науке. Значение отыскивают с учетом обстановки, в которой объекты применялись: специфики сообщества, контекста, обстоятельств.

Лингвистическая семантика особенное внимание уделяется мимике, телодвижениям, звукам, как способам передачи информации. Все это формирует значимый контекст. Для письменного языка роль таких структурных факторов играют абзацы и знаки препинания. Общий термин, обозначающий эту область информации - семантический контекст. Аналитическая деятельность в области семантики тесно связана с рядом сопутствующих дисциплин, занимающихся лексикой, этимологией символов и слов, правилами написания и произношения. Наука связана и с прагматикой.

Особенности науки

Семантика языка занимается строго определенными вопросами, ей характерна конкретная область знаний. Свойства этой дисциплины зачастую позволяют характеризовать ее как синтетическую. Рассматриваемая сфера тесно сплетается с языковой философией, имеет связь с филологией, семиотикой. В то же время наблюдается резкий контраст с синтаксическими правилами, комбинаторикой, не обращающей внимание на смысловую нагрузку используемых символов и знаков.

Особенность семантики в наличии значимых связей с репрезентативными смысловыми теориями, в том числе рассматривающими взаимосвязи, соответствия и истинность смысла. Это уже не просто языковая наука, но философская дисциплина, которая фокусируется на реальности и отражении ее через возможности языка.

Лингвистика

Эта наука - одна из дополнительных областей, включенных в общее дерево семантики как дисциплины исследования. Объект внимания этой сферы семантики - лексика. Лингвистика занимается смысловой нагрузкой, характерной словарным уровням, предложениям и фразам. В равной степени лингвистика анализирует и более крупные объекты - тексты, расширенные повествования.

Изучая лингвистику и семантику, необходимо четко представлять тесные взаимосвязи субъектов. Для лингвистики становятся важными перекрестные ссылки и примененные обозначения. Особенность этого направления - исследования взаимоотношений, свойственных единицам лингвистики. Как и семантика предложения, лингвистика особенное внимание уделяет словосочетаниям, правда, в несколько ином ключе. Здесь исследователи фокусируются на омонимах, анонимах, синонимах, паронимах, метрономах. Задача, стоящая перед ними, - осмыслить довольно крупные элементы текста, скомпоновав их из небольших, и расширить смысловую нагрузку, насколько это представляется возможным.

Монтагская грамматика

Автором этой структуры семантики стал Ричард Монтегю. Впервые свои теории он озвучил в 1960-м. Идея заключалась в такой систематизации определений, которая применяла бы терминологию лямбда-исчисления. Продемонстрированные им материалы наглядно доказали, что присущий тексту смысл можно разложить на части, элементы, используя правила сочетания. Внимание обратили и на факт относительной немногочисленности таких правил.

В то время впервые прозвучал термин «смысловой атом». Его понимание, равно как и работа с примитивами, легли в базу семантики вопросов в семидесятые годы. Так начала развиваться мыслительная гипотеза. И сегодня многие признают, что грамматика Монтегю была исключительно стройным, логичным изобретением. К сожалению, ее отличием от семантики речи была выраженная изменчивость, определяемая контекстом. Язык, как считал Монтегю, был не просто системой ярлыков, закрепленных за предметами и явлениями, но инструментальным набором. Он обращал внимание, что значимость каждого из таких инструментов не в привязке к конкретным объектам, а в специфике функционирования.

А на примерах?

Семантика в прочтении Монтегю хорошо иллюстрируется следующим образом. Филологам знакомо понятие «семантическая неопределенность». Это ситуация, когда в отсутствии ряда частей контекста невозможно определить точный смысл объекта (слова, фразы). Более того, нет таких слов, идентификация которых была бы стопроцентно возможной и верной в отсутствии окружения.

Формальная семантика

Эта идея была сформулирована, как усовершенствование постулатов Монтегю. Она принадлежит к теоретическим высоко-формализованным подходам и работает с естественными языками. Таким методом может быть проанализирована и русская семантика. Особенность - в присвоении различным единицам значений: истинности, функциональной зависимости, индивидуальности. Для каждой единицы затем выявляется истинность, соотношение в аспектах логики относительно иных предложений. Все это позволяет получить достаточный объем сведений для анализа текста в целом.

Истинно-условная семантика

Автором этой теории выступил Дональд Дэвидсон. Теория принадлежит к числу формализованных. Основная идея - в определении связей между предложениями. Подход предполагает работу с естественными языками. Семантика слова, предложения, текста обязывает выискивать и описывать такие условия, при которых некоторый объект исследования становится истинным.

Например, только в ситуации, когда снег белого цвета, истинным будет выражение «снег белый». То есть фактически задача филолога - определить, в каких условиях значение фразы становится истиной. В семантике слова заранее задан набор значений, выбранных на базе конкретного объекта, и задается набор правил, позволяющих их объединять. Практическое применение такого метода - формирование абстрактных моделей, в то же время суть подхода - в определении соответствия между выражениями и реальными вещами и событиями, а не абстрактными результатами моделирования.

Искусственная семантика

Под этим термином принято понимать такие фразы, слова, на базе которых формируется полезное содержимое. Задача лингвиста - составить семантическое ядро, которое будет привлекать внимание читателя. Наиболее актуален этот термин в настоящее время в применении к современным технологиям, в частности, интернету. Чтобы повысить посещаемость виртуальной странички, важно таким образом сформировать ее текстовое наполнение, чтобы присутствовали ключи, способные заинтересовать пользователя. Искусственная семантика в настоящее время широко применяется в рекламных целях.

Информатика предлагает трактовать семантику как раздел, занимающийся осмысленностью конструкций, свойственных языку. Это, в некоторой степени, противоположно синтаксису, чья сфера ответственности - форма выражения конструкций. Семантика - набор правил, позволяющих трактовать синтаксис. В то же время значения заданы непрямо, лишь ограничены возможности понимания объявленных слов, символов. Принято говорить о семантике как отношениях, свойствах, дающих формальное представление об объекте. Применяется логический подход, на основании которого строятся модели и теории, базирующиеся на интерпретации полученной информации.

Семантика как метод продвижения проекта

Применяя базовые правила семантики, специалист может разработать такое ядро, которое затем будет базой для формирования СЕО-программы. Семантическое ядро - список запросов, которые аудитория может ввести в виртуальной системе поиска, чтобы ознакомиться с услугами, товарами, в которых нуждается. Чтобы сформировать такое ядро корректно, нужно представлять, в чем клиент нуждается, какие перед ним стоят цели.

Определение потребностей целевой аудитории чаще всего предполагает интервьюирование либо бриф-опрос. Правильно подойдя к этой задаче, можно сформулировать с высокой степенью точности, в чем нуждается пользователь.

Семантическое ядро: особенности

Чтобы правильно сформировать этот базовый для продвижения проекта объект, необходимо сперва разобраться с природой пользовательских запросов. Таковые подразделяются на четыре крупные категории:

  • информация;
  • транзакции;
  • навигация;
  • общие запросы.

Информационные поисковые запросы

Таковые люди спрашивают у поисковой системы, если перед ними стоит какой-то нуждающийся в решении вопрос. Система выдает список сайтов, в большей или меньшей степени соответствующих заданному, после чего клиент начинает поочередно переходить по страничкам из верхнего перечня выдачи, изучая результаты на предмет релевантности. Останавливается человек, когда удается обнаружить необходимые данные.

Чаще всего информационные запросы начинаются с вопросительного слова, хотя нередко прибегают к относительно неочевидному для машинного языка выражению мысли - запрашивают помощь или советы, отзывы или правила (инструкции). Если владелец ресурса знает, какие именно запросы чаще всего приводят к нему пользователя (или могли бы приводить), необходимо формировать семантическое ядро под каждую страницу с учетом этой информации. Если проект некоммерческий, то именно информационные запросы приносят почти весь объем трафика. Чтобы монетизировать сайт, можно прибегнуть к контекстной рекламе или другим сходным возможностям.

Навигация и транзакции

Навигационные - это такие запросы, которые дают четкую характеристику виртуальной странички. Именно благодаря им в будущем будут осуществляться переходы.

Транзакции, по мнению многих специалистов СЕО, являются наиболее любопытной категорией из всех возможных запросов. Через них можно получить представление, для каких целей клиент ищет сайт. Одни нуждаются в материале для ознакомления, другие скачивают файлы, третьи совершают покупки. Зная особенности транзакционных запросов, можно построить собственный бизнес в интернете. Между прочим, некоторое время назад именно через них развивались почти все, предлагающие услуги, сайты, а также виртуальные магазины.

Особенность вопроса

Не все так легко и просто. Запросы, которые может выявить СЕО-специалист, составляя семантическое ядро, применяются всеми конкурентами. С одной стороны, их использование не может быть гарантом успеха программы продвижения - слишком много соперников. В то же время их отсутствие делает программу развития сайта практически невозможной. Применяя конкурентные запросы, можно успешно привлечь аудиторию на продвигаемую страницу. Если предполагается раскрутка на основе именно таких запросов, нужно проконтролировать, что пользователь, оказавшись на страничке, может совершить соответствующую транзакцию.

Не все уверены, стоит ли применять такой тип запросов, если продвигается страница не коммерческого, а информационного характера. Специалисты заверяют, что это абсолютно корректное решение. При этом нужно предусмотреть возможность совершения пользователем действий на страничке. Самый простой вариант - контекстная реклама, соответствующая содержимому, партнерская программа.

Общие запросы

Это такие формулировки, из которых сложно понять, что именно ищет пользователь. Например, это могут быть «двигатель авто» или «кисточка для румян». По какой причине пользователь ищет информацию, только из самого запроса совершенно не ясно. Кто-то заинтересован, как предмет устроен и из чего сделан, другой ищет возможность купить, а третий исследует ассортимент предложения на рынке. Возможно, пользователь хочет найти инструкцию по самостоятельному изготовлению предмета или осуществлению работы, но другой человек заинтересован в том, чтобы заказать услугу - например, поклейку обоев в комнате. Учитывать общие запросы при формировании контекстного ядра нужно, но не стоит делать на них особенный акцент, если проект не посвящен, например, всем возможным типам кисточек для румян или обоям и всему, что с ним связано, от производственных вопросов до правил окрашивания.

Частотность: конкуренция на каждом шагу!

Характеристика частотности - одна из ключевых при выборе подходящего наполнения семантического ядра. В общем случае все запросы делятся на три крупные группы, при этом к низкой частоте относятся попадающие в месяц в поисковую систему менее двух сотен раз, к высокой частоте причисляют запрашиваемые более тысячи раз вопросы, а средний уровень - все, что между указанными границами.

Указанные значения - общие, для каждой конкретной области они будут уникальными, цифры существенно варьируются. Чтобы правильно сформировать семантическое ядро, нужно не просто знать показатели поисковой системы по запросам, которые предполагается включить, но и представлять иерархическую структуру развиваемого сайта, прорабатывать внутреннюю оптимизацию. Одним из самых полезных современных инструментов для формирования семантического ядра специалисты признают «Яндекс.Вордстат». Он помогает выявить частоту запросов, на основании чего можно составить расширенный перечень и избавиться от лишних, пустых запросов. Для создания структуры рекомендуется сделать не менее трех циклов работы с перечнем запросов при применении возможностей «Яндекс.Вордстат».

СЕМАНТИЧЕСКОЕ ПРОСТРАНСТВО - предложенная американским физиком Д. Бомом модель целостности мира как всеобъемлющего движения (Holomovement). Он поставил задачу построения концепции, которая в рамках единого методологического подхода объединила бы материальную Вселенную и сознание. Фундаментальная отличительная черта космологии Бома состоит в признании неразрывного единства реальности, ее неделимой целостности. С этой точки зрения мы являемся частью целого, которое обладает способностью генерировать идеи о самом себе и регистрировать их внутри себя самого. Эта парадигма объединенного бытия напоминает индийскую концепцию акаша.

В России близкий подход развивал математик и философ В.В. Налимов. Однако в его концепции смыслы и материя - это не различные проявления единой реальности, как у Бома, а две автономные реальности - физический мир и мир семантический, которые непосредственно связаны между собой через геометрию мира. По мнению Налимова, такой подход обладает тем преимуществом, что создает предпосылки для построения сверхъединой теории поля, которая будет объединять оба слоя реальности. Придавая смыслам самостоятельное существование как особой реальности, Налимов формулирует основную аксиоматику своей концепции. Весь воспринимаемый нами мир интерпретируется как множество текстов. Что касается биосферы, то здесь текстами следует считать отдельные особи, виды, популяции; в ноосфере в качестве текстов следует принимать различные аспекты сознательной деятельности.

Ключевым понятием тезауруса концепции С.п. является понятие смысла. Согласно Дж. Колеру, смысл есть сеть значений в определенных состояниях и алгоритм для решения проблем. Природа смысла раскрывается через одновременный анализ семантической триады - смысл, текст, язык (код). «Смысл смысла, - пишет австро-американский психолог В. Франкл, - в том, что он направляет ход бытия». Эволюция текста связана со спонтанным появлением фильтра, взаимодействующего с исходной функцией. Для описания этого взаимодействия Налимов предлагает использовать формулу Байеса, которая применяется при решении статистических задач о минимуме риска. Формула Байеса позволяет рассчитать апостериорную вероятность каждого из возможных событий. По Налимову, изначально все возможные смыслы мира спрессованы вдоль семантической оси подобно тому, как на действительной оси спрессованы числа (линейный континуум Кантора). Поскольку спрессованность смыслов в одномерном С.п. следует понимать как их непроявленность, их исходное состояние надо интерпретировать как семантический вакуум. Распаковывание смыслов, или появление текстов, осуществляется путем формализма Байеса, который осуществляет вероятностное взвешивание вдоль семантической оси. Возникновение вдоль этой оси функции распределения статистических весов (плотности вероятности) и означает появление текста. В общем случае, полагает Налимов, можно говорить о текстах, задаваемых функцией распределения не только вдоль оси, но и в многомерном С.п. Если физический мир и мир семантики - два автономных слоя реальности, то их взаимосвязь должна обеспечиваться потоками информации. В рамках анализируемой концепции информацию следует рассматривать как сложный процесс, состоящий из элементарных актов, протекающих в многомерном мире самоорганизующихся систем. Такое понимание информации соответствует философии А. Бергсона и А. Уайтхеда, ориентированной на системный подход постнеклассической науки. Информация, обеспечивающая связь между материальным и семантическими слоями реальности, может быть только необратимым процессом, развивающимся в многомерном и нелинейном мире.

Недостаток концепции В.В. Налимова состоит в том, что, постулируя самостоятельное существование С.п., он не видит необходимости определить соответствующий ему физический референт. Уход от поисков такого референта равнозначен отказу от исследования проблемы методами теоретической и экспериментальной физики.

Независимую попытку обнаружить такой физический референт в 1960-х гг. предпринял российский физико-химик Н.А. Кобозев. По его мнению, для того, чтобы мозг человека был способен мыслить безэнтропийно, должен существовать внешний источник антиэнтропии, или энтропийный вакуум. Связь между этим источником и атомно-молеку- лярными структурами коры головного мозга, согласно гипотезе Кобозева, обеспечивается квантовым ансамблем сверхлегких частиц, обладающих спином S. Однако эти частицы не были обнаружены экспериментально.

Другое решение проблемы предложено Л.B. Лесковым, который сформулировал мэоническую парадигму. Используя в качестве исходного пункта концепцию С.п. Налимова, Лесков дополнил ее двумя постулатами: а) физическим референтом С.п. является мэон - разновидность физического, или квантового, вакуума; б) все объекты материального мира, начиная от элементарных частиц и кончая мозгом человека, обладают свойством консиенции - способностью информационного взаимодействия с семантическим потен-циалом мэона (conscientia на латыни означает осведомленность в чем-либо, совместное знание). Преимущество такого подхода очевидно: он открывает путь к использованию достижений современных теорий физического вакуума, а также к проведению на этой основе специальных экспериментальных исследований.

Свойства мэона парадоксальны. Не будучи объектом материального мира, включенным в метрику Эйнштейна-Минковского, мэон не подчиняется закономерностям термодинамики и теории относительности. Если передача информации осуществляется с участием мэона, то скорость этого процесса может значительно превышать скорость света. Не подчиняясь закону роста энтропии, мэон не характеризуется стрелой времени: прошлое, настоящее и будущее для него как бы синхронны. Эти свойства мэона не укладываются в картезианско-ньютонову парадигму, но здесь нет противоречия, т.к. речь идет о квантово-механическом феномене, соответствующем постнеклассической картине мира. Процессы информационного взаимодействия семантического потенциала мэона с материальными объектами можно описывать на языке современных теорий физического вакуума (торсионные волны в модели А.Е. Акимова - Г.И. Шилова, взаимодействие бюонов по Ю.А. Баурову).

Остается открытым вопрос о механизме кодирования семантического потенциала в квантовых структурах мэона. Существует, однако, один радикальный способ обойти эту трудность: достаточно предположить, что мэон выполняет функцию не банка, а транспортного агента смыслов, а их генерацию в этом случае можно связать с индивидуальным и «коллективным» сознанием. Этой гипотезе соответствует семантический принцип, которому можно придать либо слабую, либо сильную форму. В первом случае это будет означать, что существует планетарное семантическое поле, а во втором - этому соответствует космическое поле.

Литература:

Налимов В.В. Спонтанность сознания. М., 1989;Лесков Л.В. Семантическая Вселенная // Вестник Московского университета. Серия 7. Философия. 1994. № 2.

Словарь философских терминов. Научная редакция профессора В.Г. Кузнецова. М., ИНФРА-М, 2007, с. 487-489.

Значение языкового выражения - это сложное структурное образование, состоящее из компонентов. Б.Ю.Городецкий предложил для описания таких компонентов семантической структуры языкового выражения понятие семантического слоя. В значении каждого выражения выделяется несколько слоев, каждый из которых несет информацию особого рода. Таких слоев выделяется 4, хотя они получают разное наименование у разных исследователей.

1. Денотативный слой значения или просто денотат языкового выражения, — это передаваемая им информация о внеязыковой действительности, о том реальном или воображаемом мире, о котором идет речь. Чтобы каждый раз не делать оговорку о реальности / ирреальности мира, с которым соотносится языковое выражение, используется нейтральный в этом отношении термин мир дискурса. Денотативное значение выступает в языке в двух основных модификациях — актуальной и виртуальной. Актуальный денотат языкового выражения — это тот предмет или ситуация из мира дискурса, которые имеет в виду говорящий, употребляя это выражение в речи. Виртуальным денотатом языкового выражения является множество объектов мира дискурса, которые могут именоваться данным выражением. Вместо термина «актуальный денотат» предпочтительно использовать термин референт, а вместо термина «виртуальный денотат» - термин денотат. В том же значении широко используется термин экстенсиоиал (= «объем понятия»), пришедший в лингвистику из логики.

Пример: Мама спит.

Денотат имени мама - множество всех объектов мира дискурса, которые являются чьими-либо мамами.

Денотат глагола спать - множество всех ситуаций, которые могут быть поименованы этим глаголом.

Денотат предложения - подмножество всех ситуаций сна, имеющих место в момент речи, субъектами которых выступают чьи-либо мамы.

О референте можно говорить только в том случае, когда это предложение рассматривается как употребленное в речи (только глагол референта не имеет).

2. Сигнификат языкового выражения, - это информация о том способе, каким объект или ситуация мира дискурса отражаются в сознании говорящего. В отличие от денотата, представляющего собой некоторый класс предметов или ситуаций, сигнификат - это не сам класс, а те свойства, на основании которых эти предметы/ситуации объединены в данный класс и противопоставлены членам других классов. В направлениях современной семантики, которые применяют при анализе выражений естественного языка, методы формальной логики (например, в формальной семантике), в том же смысле используется термин интенсионал.

Сигнификат имени мама включает в себя признаки «человеческое существо», «женского пола», «родитель некоторого человекаа».

Сигнификат глагола спать включает такие свойства: «физическое состояние живого существа», «форма отдыха».

Различие между денотатом и сигнификатом проявляется в том, что 1 и тот же референт может быть обозначен языковыми выражениями с различными сигнификатами. Та же самая женщина в другой ситуации может быть названа по-другому.

3. Прагаматическое значение языкового выражения - это содержащаяся в нем информация об условиях его употребления - многообразных аспектах коммуникативной ситуации,в которых оно используется. В число этих аспектов входит: отношение говорящего к денотату языкового выражения, отношения между говорящим и адресатом, обстановка общения, цель, которую говорящий хочет достичь и др.параметры.

Если бы прагматический слой значения слова мама был пуст, не заполнен, то мамой можно было бы назвать чьего-либо родителя женского пола в любой ситуации. Однако есть ситуации, в которых надо употребить другое слово с тем же денотатом и сигнификатом — слово мать . Таким образом,в прагматическом значении слова мама содержится определенная информация об отношении говорящего либо к референту данного имени, либо к лицу X которому референт имени доводится матерью.

4. Синтаксический слой значения, или синтаксическое значение языкового выражения содержит информацию об отношениях между данным выражением и другими языковыми выражениями в составе речевого отрезка. Это разного рода требования, предъявляемые языковым знаком к своему окружению. Данный тип значения хорошо изучен применительно к слову и почти не исследован на уровне предложения. Так, знак может предъявлять требования к наличию/отсутствию в своем окружении других знаков, принадлежащих к определенной лексико-грамм.категории и имеющих определённую грамматическую форму. Эти требования называются морфо-синтаксической сочетаемостью слова. Например, безличный глагол спать выступает в предложении в сопровождении именной группы.

В синтаксическое значение слова мама входит информация о том, что это: 1)имя существительное, 2)одушевлённое., 3)женского рода, 4)единственного числа., 5)в именительном падеже.

В последнее время появляются исследования, позволяющие говорить о синтаксическом значении и на уровне предложения-высказывания. Например, если первой репликой диалога будет вопрос Мама спит?, то при нормальных условиях следующая реплика должна представлять собой предложение с вполне определенным денотативным, сигнификативным и прагматическим значением: это должен быть положительный или отрицательный ответ на вопрос о том, спит ли мама, а не какое-либо другое высказывание.

С противопоставлением типов значений, выделяемых по характеру передаваемой информации, определенным образом соотносится противопоставление лексического и грамматического значения.

Соответственно требованиям системного моделирования выделим три направления моделирования образа мира (структура, функция, генез).

  • 1. Описание образа мира как существующей системы значений человека (содержательная, продуктивная модель).
  • 2. Описание функций образа мира (процессуальная, продуктивная, целевая модель).
  • 3. Описание генеза образа мира (модель развития, модель консервации).

Понятно, что ни одна из трех моделей не является полной. Полной является только их совокупность. Разделить существующие модели можно лишь условно, так как их авторы осознанно или интуитивно стремились создать полную модель.

Первая линия моделирования активно реализуется в исследованиях в рамках субъективной семантики и психосемантики (Артемьева, Стрелков, Серкин, 1983, 1991; Артемьева, 1999; Доценко, 1998; Петренко, 1983, 2005; Стрелков, 2001; Шмелев, 1983, 2002 и др.). Большинство авторов выделяет существование ядерных и поверхностных структур образа мира (Леонтьев, 1983; Петухов, 1984; Смирнов, 1985 и др.) (рис. 3.1).

Рис. 3.1.

К функциональным моделям образа мира можно отнести трехслойную модель образа мира (Артемьева, Стрелков, Серкин, 1983, 1991; Артемьева, 1999) (рис. 3.2), выделенную С. Д. Смирновым (Смирнов, 1985) совокупность функций образа мира, модель образа мира профессионала (Климов, 1995), деятельностную структуру образа мира (Серкин, 1988).

Рис. 3.2.

К моделям, в которых предпринимаются попытки объяснить генез образа мира, относятся: описание А. Н. Леонтьева (Леонтьев, 1983); двухполюсная модель формирующей образ мира психической системы "ребенок – родитель" (Смирнов, 1985); деятельностная структура образа мира (Серкин, 1988); модели эволюционной детерминации.

В психологической литературе разрабатывается вопрос о наличии ядерных (амодальных, отторгнутых от чувственности) и поверхностных (чувственно оформленное представление) структур образа мира (Смирнов, 1985 и др.). В образ мира включаются принципиально не сводимые к модальностному оформлению характеристики, абстрагированные признаки и понятия, "сверхчувственные" и предметные (т.е. приобретаемые только с опытом деятельности или с системами других абстрактных понятий) характеристики. Самим А. Н. Леонтьевым (Леонтьев, 1983) выделены картина мира и амодальные ядерные структуры – образ мира (см. рис. 3.1), различающиеся не по психическому материалу, а по функциям. Амодальность понимается А. Н. Леонтьевым как "безразличность" системы значений (идеальной формы существования предметного мира) к чувственной модальности своего оформления.

Опираясь на результаты своих экспериментальных исследований и рассматривая образ мира в функциональном аспекте, С. Д. Смирнов (Смирнов, 1985) определяет образ мира как многоуровневую систему познавательных гипотез. Обсуждая понятие "оперативный образ", С. Д. Смирнов (1997) проводит следующую мысль: раз существует оперативный образ, то должен существовать и долговременный образ, который и является "образом мира". Таким образом, вопрос о функциях образа мира можно обсуждать и как вопрос об экстраполяции функций оперативных образов.

На основе сформулированного А. Н. Леонтьевым положения о том, что любое актуальное воздействие "вписывается" в образ мира, Б. М. Величковским (Величковский, 1983) было предложено определение образа мира как гетерархии систем отсчета. На основании проведенного им анализа стадий микрогенеза зрительного образа Б. М. Величковский пришел к выводу, что на первых стадиях (до 100 мс) микрогенеза зрительного образа любое актуальное воздействие вписывается в некоторое целое, интерпретируемое им как иерархия пространственных систем отсчета. Оценивая время опознания означенного и не означенного стимулов (означенные опознавались быстрее в среднем на 400 мс, что является для микрогенеза восприятия весьма значительным временем), Б. М. Величковский пришел к выводу, что другой характеристикой первых стадий восприятия является их семантическая наполненность. Совокупность иерархических структур, в которые вписывается актуальное воздействие, и была названа Б. М. Величковским гетерархией систем отсчета (образом мира).

По аналогии с различаемыми С. Д. Смирновым (Смирнов, 1985) миром образов и образом мира В. В. Петухов пишет, что при изучении мыслительных представлений следует различать (см. рис. 3.1) представления о мире (поверхностные структуры, в которых уже соединяются антиципация, обобщенность и чувственность, происходит селекция неслучайных признаков) и представление мира (более ранняя в генетическом плане, связанная с аффективными переживаниями глубинная ядерная структура). В этой же статье В. В. Петухов отмечает, что при исследовании эмоциональных форм психического отражения "различение закрепилось бы в терминах “мир переживаний” (или чувств) и "переживание (чувство) мира" (Петухов, 1984, с. 14).

Представление мира (ядерные структуры) чаще всего не рефлексируется, являясь, тем не менее, субъектным условием любой деятельности. Без рефлексии ядерные структуры "обнаруживаются" только в форме специфических и пока мало исследованных психологами переживаний, таких, например, как чувство внутренней определенности, очевидности. Такие переживания были зафиксированы как результаты интроспекции в исследованиях Вюрцбургской школы. В. В. Петухов считает, что объективные условия для изучения ядерных структур создаются при сравнении различных представлений мира, например, при проведении кросскультурных исследований.

Рефлексируются представления, знания о мире, т.е. уже трансформированные результаты представления мира. В. В. Петухов подчеркивает, что в наш образ мира входят понятия, не только не раскрываемые чувственно, но и не приобретенные как составляющие индивидуального опыта (в ходе индивидуальной деятельности). Эти понятия как продукты культурноисторического развития фиксируются в языке и усваиваются человеком в ходе обучения речевой деятельности вместе с множеством структурных взаимосвязей языка.

А. Г. Шмелев (Шмелев, 2002), сопоставляя универсальные интегрирующие факторы коннотативного семантического пространства (ОСА – оценка, сила, активность) и семантических пространств, задаваемых шкалами личностных семантических дифференциалов, предполагает существование слоя эволюционной детерминации и слоя социальной детерминации структур репрезентации опыта в сознании, оставляя возможность дальнейшего развития модели детерминации.

В статьях E. Ю. Артемьевой, Ю. К. Стрелкова и В. П. Серкина (Артемьева, Стрелков, Серкин, 1983, 1991) на основании тезиса о том, что следы деятельностей образуют устойчивые внемодальные системы (субъективные семантики), предлагается рассматривать три таких слоя: перцептивный мир; картина мира (семантический мир); образ мира (см. рис. 3.2).

Перцептивный мир модален, как и образы восприятия, но он является одновременно и представлением (до окончания акта восприятия, достраивание образа восприятия ), регулируемым более глубокими слоями . По стадиям генеза субъективных семантик мы можем отнести к перцептивному миру предсмыслы (они амодальны, до собственно перцептивного этапа восприятия) как нечто, превращающее образы уже в представления (Артемьева, 1999) и системы перцептивных признаков, имеющие субъективную окраску (отношение) и субъективно изменяемые пространственно- временные характеристики. Перцептивный мир осознается как множество упорядоченных в пространстве и времени движущихся объектов (как и свое тело) и отношение к ним. Возможно, что собственное тело задает одну из ведущих систем пространственно-временных координат. Внешние границы перцептивного мира очерчиваются горизонтом (но мы знаем, что за ним), внутренние – тем, что не воспринимается до внешних границ.

Семантический слой является переходным между поверхностными и ядерными структурами. Семантический слой, в отличие от перцептивного мира, целостен. На уровне семантического слоя Е. Ю. Артемьева выделяет собственно смыслы (интегрирующие целостность отношения) как отношения субъекта к объектам перцептивного мира. Эта целостность определяется уже осмысленностью, означенностью семантического мира.

Глубинный слой (ядерный) амодален. Его структуры образуются в процессе "переработки" семантического слоя, однако для рассуждения о "языке" этого слоя образа мира и о его структуре данных пока недостаточно. Составляющими ядерного слоя являются личностные смыслы. В трехслойной модели ядерный слой характеризуется авторами как целемотивационный комплекс, в который включается не только мотивация, но и наиболее обобщенные принципы, критерии отношения, основы эталонных систем (перцептивной, оперативной, эмоциональной, сценарной).

Отдельной линией анализа является развиваемое Ю. К. Стрелковым и его сотрудниками направление изучения специфики динамической организации образа мира на основе специфики динамической организации профессиональной деятельности (Стрелков, 2001,2003 и др.). Образ мира рассматривается здесь как структура, опосредствующая многообразие событий и их субъективное временное единство. Ю. К. Стрелковым выделены следующие временные характеристики образа мира (профессионала): длительность и переживание длительности, ритм, срок, сеть сроков, синхронизация, разрывы и деформации временной связности, многоаспектность одновременно отслеживаемых и переживаемых временных процессов.

Неравномерность, обратимость и непоследовательность (нарушения, изменения временной последовательности в сознании) этих процессов является одной из характеристик субъективности образа мира.

Отметим, что все исследователи отмечают существование ядерных и поверхностных структур образа мира, целостность образа мира (несводимость просто к системе образов). Необходимость такого структурирования обусловлена необходимостью описания и смысловых, обобщенных и "ситуативных", конкретных характеристик образа мира. Также все исследователи отмечают активную роль образа мира, его антиципирующее влияние (предшествование) на каждый акт восприятия, на каждый акт действия и его специфичность (субъектность), обусловленную специфичностью индивидуального опыта субъекта.

С философской точки зрения введение понятия "образ мира" можно рассматривать как попытку преодоления антиномий целостности при объяснении процесса восприятия, шире – при моделировании субъективного мира человека . В современном философском и конкретно-научном анализе предпринимается много попыток "синтезирования" антиномий целостности, но проблема до сих пор не решена.

  • По нашим данным до перцептивной обработки следует две ступени семантической оценки стимула: 1) опасный – безопасный; 2) привлекательный – непривлекательный.
  • Близкое понятие "картина поля действия" описывал П. Я. Гальперин (Гальперин, 1999), рассуждая о функциях образа. Он, кроме того, выделял и два плана образов: внешний и план внутреннего состояния.
  • 1. Тезис: целое – сумма частей. Антитезис: целое больше суммы частей. 2. Части предшествуют целому. Целое предшествует частям. 3. Целое обусловлено частями. Целостный подход противоположен частичному и исключает его. 4. Целое познается через знание частей. Часть может познаваться лишь на основе знания о целом.

Об анализе информации в приложении к бизнес-процессам в последнее время говорят много. Плохо лишь, что под этим термином каждый понимает свое. Фрагментарность в подходе, к сожалению, напоминает другое распространенное явление - «лоскутную автоматизацию», когда на рабочие места устанавливаются разрозненные, слабо взаимосвязанные программные средства.

С анализом информации ситуация аналогична: зачастую в качестве «полнофункционального решения» предлагаются разрозненные механизмы, охватывающие только незначительную часть задач.

Как человек принимает решения?

Объяснить, как рождается мысль, мы, конечно, не в состоянии. Поэтому сконцентрируемся на том, как использовать в этом процессе информационные технологии. Первый вариант: лицо, принимающее решение (далее буду называть его ЛПР), видит в компьютере только средство извлечения данных, а выводы делает самостоятельно. Для решения такого рода задач служат системы отчетности, многомерный анализ данных, диаграммы. Второй вариант: программа не только извлекает данные, но и проводит их предобработку, например очистку, сглаживание и пр., а к обработанным данным применяет математические методы анализа - кластеризацию, классификацию, регрессию и т. д. В этом случае человек работает уже с моделями, подготовленными компьютером.

В первом случае практически всё, что связано с принятием решений, возлагается на человека, а потому подбор адекватной модели и выбор методов обработки выносится за пределы механизмов анализа. Базой для принятия решения является либо инструкция (например, каким образом реализовать механизмы реагирования на отклонения), либо интуиция. Иногда этого достаточно, но если ЛПР интересуют более глубокие знания, простое извлечение данных тут не поможет. Это и есть тот самый второй случай, когда лишь надежные механизмы предобработки и анализа позволят ЛПР действовать на более высоком уровне. И если первый вариант хорошо подходит для решения тактических и оперативных задач, то второй - для тиражирования знаний и решения стратегических проблем.

В идеале человеку нужна возможность применять оба подхода к анализу, выбирая методики в зависимости от задач. Вместе они позволяют удовлетворить почти все потребности организации при работе с бизнес-информацией.

Элементы анализа

Часто при описании того или иного продукта, анализирующего бизнес-информацию, применяют такие термины, как «риск-менеджмент», «прогнозирование», «сегментация рынка»… Но в действительности решение каждой из этих практических задач сводится к применению одного из описанного ниже методов анализа. Например, прогнозирование - это задача регрессии, сегментация рынка - это кластеризация, управление рисками - это комбинация кластеризации, классификации и, возможно, других методов. Фактически, они являются атомарными (базовыми) элементами, из которых собирается решение той или иной задачи (см. схему).

Источники данных

В качестве первичного источника данных должны выступать все сведения, которые могут пригодиться для принятия решения: базы данных систем управления предприятием, офисные документы, Интернет. Причем речь идет не только о внутренних, но и о внешних данных (макроэкономические показатели, конкурентная среда, демографические показатели и т. п.).

Хранение данных

Хотя в хранилище данных не реализуются технологии анализа, оно является той базой, на которой нужно строить аналитическую систему. При отсутствии хранилища на сбор и систематизацию необходимой для анализа информации будет уходить большая часть времени. Что в значительной степени сведет на нет все достоинства анализа - ведь одним из ключевых показателей любой аналитической системы является возможность быстро получить результат.

Семантический слой

Следующий элемент схемы - семантический слой. Независимо от того, как будет анализироваться информация, необходимо, чтобы она была понятна ЛПР. В большинстве случаев анализируемые данные располагаются в различных базах данных, а ЛПР не должен вникать в нюансы работы с СУБД. Поэтому требуется создать некий механизм, трансформирующий термины предметной области в вызовы механизмов доступа к БД. Эту задачу и выполняет семантический слой. Желательно, чтобы он был один для всех приложений анализа - так легче применять к задаче разные подходы.

Системы отчетности

Предназначение систем отчетности - отвечать на вопрос «что происходит?». Первый вариант их использования - регулярные отчеты для контроля оперативной ситуации и анализа отклонений. Например, система ежедневно готовит отчеты об остатке продукции на складе, и когда его значение меньше значения средней недельной продажи, необходимо отреагировать подготовкой заказа на поставку. Обычно этот подход в том или ином виде реализован в компаниях (пусть даже просто на бумаге), но нельзя допускать, чтобы это был единственный из доступных подходов к анализу данных.

Второй вариант - обработка нерегламентированных запросов. Когда ЛПР хочет проверить какую-либо мысль (гипотезу), ему необходимо получить пищу для размышлений, подтверждающую либо опровергающую идею. Идеи, как известно, приходят спонтанно, а потому невозможно предсказать, какого рода информация потребуется. Это означает, что необходим инструмент, позволяющий быстро и в удобной форме нужную информацию получить.

Механизм OLAP

Для построения систем отчетности можно применять различные подходы, однако самый распространенный на сегодня - это OLAP. Его основная идея - представление информации в виде многомерных кубов, где оси являют собой измерения (время, продукты, клиенты и пр.), а в ячейках помещаются показатели (например, сумма продаж, средняя цена закупки). Пользователь манипулирует измерениями и получает информацию в нужном разрезе.

Благодаря простоте понимания и наглядности, OLAP получил широкое распространение в качестве механизма анализа данных, но его возможности в области более глубокого анализа - например, прогнозирования - крайне ограничены. Основная проблема при решении задач прогнозирования - не возможность сведения данных в таблицы и диаграммы, а построение адекватной модели. Если модель есть, дальше все просто: на ее вход подается новая информация, пропускается через нее, а результат - это и есть прогноз. Но собственно построение такой модели является совершенно нетривиальной задачей! Конечно, можно заложить в систему несколько готовых простых моделей, например линейную регрессию или что-то аналогичное. Но, увы, это проблему не решает, поскольку реальные задачи почти всегда выходят за рамки простых моделей. А значит, будут обнаружены только явные зависимости, ценность которых незначительна. Приведу пример: если при анализе курса акций на фондовом рынке вы исходите из предположения, что завтра акции будут стоить столько же, сколько и сегодня, то в 90% случаев вы угадаете. Но насколько ценны такие знания? Интерес для брокеров представляют только оставшиеся 10%. Примитивные модели дают результат примерно того же уровня.

Собственно, задача построения прогнозов и тому подобные вещи выходят за рамки механизмов систем отчетности, поэтому и не стоит здесь ждать от OLAP положительных результатов. Для этого применяется совершенно другой набор технологий - Knowledge Discovery in Databases.

Knowledge Discovery in Databases

KDD - это процесс поиска полезных знаний в «сырых данных». KDD включает в себя вопросы подготовки данных, выбора информативных признаков, очистки данных, применения методов Data Mining (DM), постобработки данных, интерпретации полученных результатов.

Привлекательность этого подхода в том, что, независимо от предметной области, мы применяем одни и те же операции:

    Извлечь данные. В нашем случае для этого нужен семантический слой.

    Очистить данные. «Грязные» данные могут свести на нет применяемые в дальнейшем механизмы анализа.

    Трансформировать данные. Различные методы анализа требуют данных, подготовленных в специальном виде. Например, где-то в качестве входов может использоваться только цифровая информация.

    Провести собственно анализ - Data Mining.

    Интерпретировать полученные результаты.

Процесс повторяется итеративно, и, по сути, это все, что необходимо для автоматизации извлечения знаний. Дальнейшие шаги уже делает эксперт, он же ЛПР.

И снова человек

Интерпретация результатов компьютерной обработки возлагается на человека, ведь никакой результат не имеет значения, пока не будет применен к конкретной предметной области. Но зато существует возможность тиражировать знания. Например, ЛПР при помощи того или иного метода определил, какие показатели влияют на кредитоспособность покупателей, и представил вывод в виде правила. Правило можно внести в систему выдачи кредитов и таким образом значительно снизить кредитные риски, поставив их оценки на поток. При этом от человека, занимающегося выпиской документов, не требуется глубокого понимания причин того или иного вывода. Основная идея - переход от разовых и неунифицированных методов к конвейерным.

Я нигде не упоминал о том, какие технологии будут использоваться для анализа, так как сами задачи и методы их решения не зависят от инструментария. Практически все реальные бизнес-задачи - прогнозирование, сегментация рынка, оценка эффективности рекламных кампаний и множество других - сводятся к вышеописанным и решаются одним из указанных методов (или их комбинацией).

На практике под системой анализа бизнес-информации часто понимается только OLAP. Получается, что под толстым слоем рекламных лозунгов находится всего лишь система построения отчетов. Но достаточно отталкиваться от предложенной схемы, и вы будете понимать действительное положение вещей. Лишь имея в распоряжении инструмент, позволяющий решить все названные задачи, можно говорить, что независимо от природы исследуемых объектов вы готовы выжать из данных максимум полезной информации и справиться с любой задачей бизнес-анализа.



Есть вопросы?

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: