Вычислительные сети, теория и практика. Контент-анализ — описание метода Объектами контент анализа могут быть

💖 Нравится? Поделись с друзьями ссылкой

1. Типы информационных массивов и единицы контент-анализа

Основа контент-анализа - это подсчет встречаемости некоторых компонентов в анализируемом информационном массиве, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними, а также снабжением их теми или иными иными количественными или качественными характеристиками. Отсюда понятно, что главная предпосылка контент-анализа - это выяснение того, что считать; иными словами, определение единиц анализа.

Единицы эти в зависимости от целей анализа, типа информационного массива, а также ряда дополнительных причин могут быть (и реально бывают) весьма разнообразными. К ним предъявляются два естественных, но, к сожалению, обычно плохо совместимых требования. С одной стороны, они должны легко и по возможности однозначно идентифицироваться в тексте; в идеале хотелось бы, чтобы их выявление вообще могло быть алгоритмизовано.

Понятно, что такому требованию лучше всего удовлетворяют формальные элементы текста или же элементы, имеющие четко выраженные и однозначные формальные соответствия, например слова. С другой стороны, от единиц контент-анализа чаще всего требуется некая субъективная, да к тому же еще и зависящая от контекста значимость, делающая их распределение и динамику такого распределения диагностичными для выявления изменений в индивидуальном и общественном сознании, системах убеждений и т.д. - иными словами, единицы должны быть интересными для последующей (политологической, культурологической, социологической и т.д.) интерпретации.

Между тем такие единицы (например, темы) носят собственно содержательный характер, и упоминание их в тексте может осуществляться многими разнообразными способами. Их идентификация в общем случае предполагает семантический анализ текста, проблема автоматизации которого, несмотря на многолетние усилия лингвистов и программистов, далека от решения. Характеристику единиц контент-анализа необходимо предварить кратким соображением о природе анализируемого информационного массива.

В самом определении метода контент-анализа нет ничего, что препятствовало бы применению его к отдельно взятому тексту; более того, примеры такого анализа известны. Тем не менее существует ряд причин, по которым объектом контент-аналитических проектов обычно является не отдельный текст, пусть даже значительный по объему, а именно информационный массив, или информационный поток, состоящий из большого количества текстов.

Во-первых, статистические закономерности проявляются тем более отчетливо, чем больше объем выборки.

Во-вторых, большинство целей контент-анализа предопределяют его тяготение к компаративности; аналитиков чаще всего интересуют не одномоментные срезы, а динамика изменений, а если и срезы, то, как правило, «пестрые», отражающие, например, различные СМИ или сознание различных социальных групп.

Наконец, при всем разбираемом ниже разнообразии единиц контент-анализа наиболее популярными являются различные макроединицы: темы и/или проблемы, пропозиции, образы и идеологемы. Таковых в отдельно взятых текстах и особенно в небольших по объему текстах СМИ обычно немного, да и новые макроединицы появляются не столь часто, поэтому оценить их динамику можно лишь на большом временном промежутке или при широком «горизонтальном сопоставлении».

Таким образом, идея контент-анализа предполагает анализ больших информационных массивов; с другой стороны, его относительная дешевизна и технологичность делают такой анализ принципиально возможным. Поэтому не приходится удивляться тому, что в истории контент-анализа имеются такие проекты, как анализ 427 школьных учебников, 481 частной беседы, 4022 рекламных слоганов, 8039 (в 1938) и 19 533 (в 1952) редакционных статей или 15 000 персонажей в 1000 часов телевизионного эфирного времени. Конкретное разнообразие единиц контент-анализа практически безгранично, однако среди них можно выделить несколько основных типов. (Классификация, приводимая ниже, построена с учетом типологии К.Криппендорфа, однако отличается от нее весьма существенно.)

Информационные технологии, способствующие повышению мотивации при обучении говорению.

Использование фразеологических единиц в языке детективного жанра (на примере творчества Агаты Кристи)

При исследовании фразеологического состава современного английского языка мы считаем необходимым ознакомиться с понятиями идиомы (или фразеологической единицы), представленными в различных лингвистических источниках...

Контент-аналитические исследования текстов и текстовых массивов

Контент-аналитические исследования можно разделить на два больших класса, которые, пользуясь вышеупомянутой «военной метафорой», можно назвать фронтальными и рейдовыми...

Лаборатория информационной безопасности: языковой аспект

Всемирная федерация ученых в августе 2000 г. первой в списке угроз человечеству в XXI веке поставила угрозу информационной безопасности. Почему угрозы в информационной сфере вырвались вперед, обогнав экологию...

Методы статистического анализа текста

Появление такого метода как контент-анализ среди других методов статистического анализа было обусловлено прежде всего тем, что возникла потребность в создании определенного объективного метода анализа текста...

Методы статистического анализа текста

Известно, что методика контент-анализа нашла широкое применение именно в информационную эпоху, переживая второе рождение вместе с развитием Интернета. Однако, стоит помнить, что появился данный метод задолго до создания глобальной сети...

Методы статистического анализа текста

Процедура контент-анализа различается в зависимости от источников информации и особенностей задач их анализа. В общем виде она описывается как набор следующих этапов...

Методы статистического анализа текста

В научной литературе принято выделять следующие основные виды контент-анализа : · Количественный контент-анализ...

Сложное синтаксическое целое

В соответствии с вышеизложенным текст может быть проанализирован по следующей схеме, предложенной профессором Солгаником Г.Я. : 1. Характеристика текста с точки зрения его состава (предложение, строфа или фрагмент) и его композиция. 2...

Как и в начале предыдущего, в данном разделе необходимо дать определения некоторым терминам. Информация - все те сведения, которые уменьшают степень неопределенности нашего знания о каком-либо объекте. А, соответственно...

Современные информационные и коммуникационные технологии и их использование при обучении иностранному языку

Все средства ИКТ, применяемые в системе образования можно разделить на два типа: аппаратные и программные. (Сводную таблицу средств ИКТ см. в Приложении 1). Аппаратные средства: Компьютер - универсальное устройство обработки информации...

Теоретические аспекты морфологии

Аналитический подход к языку (путь от языковых средств к их функциям и значениям) во многом предполагает использование одинаковых исследовательских процедур по отношению к единицам фонологического...

Функционирование неологизмов в сфере информационных технологий

Мы уже определили, что входит в понятие языковых неологизмов. Неологизмы сферы информационных технологий делятся на семантические и лексические...

Основа контент-анализа - это подсчет встречаемости некоторых компонентов в анализируемом информационном массиве, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними, а также снабжением их теми или иными иными количественными или качественными характеристиками. Отсюда понятно, что главная предпосылка контент-анализа - это выяснение того, что считать; иными словами, определение единиц анализа.

Единицы эти в зависимости от целей анализа, типа информационного массива, а также ряда дополнительных причин могут быть (и реально бывают) весьма разнообразными. К ним предъявляются два естественных, но, к сожалению, обычно плохо совместимых требования. С одной стороны, они должны легко и по возможности однозначно идентифицироваться в тексте; в идеале хотелось бы, чтобы их выявление вообще могло быть алгоритмизовано.

Понятно, что такому требованию лучше всего удовлетворяют формальные элементы текста или же элементы, имеющие четко выраженные и однозначные формальные соответствия, например слова. С другой стороны, от единиц контент-анализа чаще всего требуется некая субъективная, да к тому же еще и зависящая от контекста значимость, делающая их распределение и динамику такого распределения диагностичными для выявления изменений в индивидуальном и общественном сознании, системах убеждений и т.д. - иными словами, единицы должны быть интересными для последующей (политологической, культурологической, социологической и т.д.) интерпретации.

Между тем такие единицы (например, темы) носят собственно содержательный характер, и упоминание их в тексте может осуществляться многими разнообразными способами. Их идентификация в общем случае предполагает семантический анализ текста, проблема автоматизации которого, несмотря на многолетние усилия лингвистов и программистов, далека от решения. Характеристику единиц контент-анализа необходимо предварить кратким соображением о природе анализируемого информационного массива.

В самом определении метода контент-анализа нет ничего, что препятствовало бы применению его к отдельно взятому тексту; более того, примеры такого анализа известны. Тем не менее существует ряд причин, по которым объектом контент-аналитических проектов обычно является не отдельный текст, пусть даже значительный по объему, а именно информационный массив, или информационный поток, состоящий из большого количества текстов.

Во-первых, статистические закономерности проявляются тем более отчетливо, чем больше объем выборки.

Во-вторых, большинство целей контент-анализа предопределяют его тяготение к компаративности; аналитиков чаще всего интересуют не одномоментные срезы, а динамика изменений, а если и срезы, то, как правило, «пестрые», отражающие, например, различные СМИ или сознание различных социальных групп.

Наконец, при всем разбираемом ниже разнообразии единиц контент-анализа наиболее популярными являются различные макроединицы: темы и/или проблемы, пропозиции, образы и идеологемы. Таковых в отдельно взятых текстах и особенно в небольших по объему текстах СМИ обычно немного, да и новые макроединицы появляются не столь часто, поэтому оценить их динамику можно лишь на большом временном промежутке или при широком «горизонтальном сопоставлении».

Таким образом, идея контент-анализа предполагает анализ больших информационных массивов; с другой стороны, его относительная дешевизна и технологичность делают такой анализ принципиально возможным. Поэтому не приходится удивляться тому, что в истории контент-анализа имеются такие проекты, как анализ 427 школьных учебников, 481 частной беседы, 4022 рекламных слоганов, 8039 (в 1938) и 19 533 (в 1952) редакционных статей или 15 000 персонажей в 1000 часов телевизионного эфирного времени. Конкретное разнообразие единиц контент-анализа практически безгранично, однако среди них можно выделить несколько основных типов. (Классификация, приводимая ниже, построена с учетом типологии К.Криппендорфа, однако отличается от нее весьма существенно.)

BC/NW 2013, №2 (23):10

BC / NW 2013, №2 (23):10.4

ТЕХНОЛОГИИ СОЗДАНИЯ И ОБРАБОТКИ ЦИФРОВОГО МЕДИА КОНТЕНТА. СОВРЕМЕННЫЕ СТАНДАРТЫ 3D-ВИДЕОКОНТЕНТА

Кушелев И.Ю.

(ФГБОУ ВПО "Национальный исследовательский университет "МЭИ")

1. Введение.

Основные понятия. Типология медиа контента. Тенденции.

Наблюдения за развитием информационных технологий за последние двадцать лет дает основания констатировать тот факт, что сфера информационной медиа среды переживает период существенных изменений, в результате которых классическая древовидная система распространения информации радикально меняет свою топологию, превращаясь в многомерное сообщество, в котором каждый может общаться с каждым или с выборочной группой или со всем сообществом одновременно . Возникают совершенно новые формы общения: форумы, блоги, социальные сети и т.д. . Конечно, эти процессы необходимо изучать и всячески анализировать, чтобы выявить закономерности и прогнозировать дальнейшее развитие процесса. Применим классический способ изучения сложного процесса - разобъем сложное на элементарные составляющие и выявим закономерности их участия в общем процессе.

1.1. Контент .

С понятием «контент» мы сталкиваемся ежедневно. Однако не каждый может дать правильное определение этому понятию. Что же такое «контент».

Контентом называется все информационное наполнение какого-либо ресурса электронного (сайт, электронный журнал, форум и т.п.) или классического - печатного (книга, газета, научный труд и т.д.). В переводе с английского языка «content» означает «содержание». К контенту можно отнести любое информационное наполнение: тексты, таблицы, изображения, видеоряд и т.д. Например эта статья также является контентом.

1.2. Медиа контент.

Всемирная информационная сеть (world wide web) развивается очень быстро. Развитие новых технологий приводит к тому, что очень быстро начинают меняться и способы представления информации. Если в начале развития информационных сетей основным передаваемым контентом был текст, то в настоящее время более эффективным и наглядным способом ее подачи является использование медиа контента, определим это понятие.

Термин медиа (от английского media), в зависимости от контекста, может означать следующее: Медиа данные - совокупность различных видов данных, содержащих дополнительную звуковую и визуальную информацию - графику, видео, анимацию (т. н. мультимедиа). Разделение мультимедиа контента на компоненты позволяет структурировать его в общем виде, исходя из восприятия пользователя ,. Однако при разработке мультимедиа продуктов требуется детальное описание контента в специальной терминологии, однозначно определяющей структурные единицы с учетом их технологических особенностей и функциональных возможностей.

Минимальной структурной единицей (термом) мультимедиа контента является медиаэлемент. Медиа элементы это элементарные составляющие, комбинирование которых и рождает мультимедиа контент.

Типологически можно выделить две категории медиаэлементов: статические и динамические. Первая категория - текст (символьная информация), графическое неподвижное изображение. К группе динамических (меняющихся во времени) медиаэлементов относятся: звуковой ряд, видеоряд.

Цифровые кодировки медиаэлементов имеют множество форматов, так что каждый медиаэлемент может быть представлен в нескольких форматах (так например статическое цифровое изображение может быть сохранено в стандартизированных типах графических файлов: bmp - bit map picture, jpeg - joint photographic experts group). Медиаэлемент любого формата располагается в одном компьютерном файле.

Структурная единица мультимедиа контента следующего, более высокого уровня – медиа комбинация объединяет в одном файле несколько динамических медиаэлементов. Медиа комбинация – это синхронизированная совокупность одинаковых или разных динамических медиаэлементов, размещаемых в одном компьютерном файле. Типичные примеры медиа комбинаций – стереозвук (например: wav - wave form audio format, mp3 - более точно, от англ. MPEG-1/2/2.5 Layer 3; но не MPEG-3), озвученные видео или анимация (например: avi - Audio Video Interleave чередование аудио и видео, mov - Apple QuickTime Movie).

Не следует путать медиа комбинации с динамическими медиаэлементами, в которые включена имитация статических. Например, фрагментом видео может быть статическое изображение или текст, получаемые путем повтора идентичных видеокадров, что не мешает отнесению всего видеофайла к динамическим медиаэлементам. Управление воспроизведением линейной динамической последовательности путем перемещения по оси времени не является взаимодействием с контентом, иными словами – контент медиа комбинаций не является интерактивным.

Объединение медиаэлементов и/или медиа комбинаций для одновременного воспроизведения определяется как мультимедиа композиция. С технологический точки зрения основное отличие композиции от элемента и комбинации заключается в использовании группы файлов, каждый из которых содержит некоторый медиаэлемент или медиа комбинацию. К мультимедиа композициям относится также 3D анимация, составляющие которой располагаются в нескольких файлах.

Если существует согласованный алгоритм представления медиаэлементов и медиа кобинаций – то такое представление уже является программным компонентом, реализующим размещение элементов медиа контента на экране, распределение во времени демонстрации аудиовизуальных элементов или при наступлении определенного события, их синхронизацию и т.д. Для интерактивной медиа композиции программный алгоритм определяет также ответные реакции на действия пользователя (оператора интерактивного медиа контента) . Однако, допускаются и неинтерактивные мультимедиа композиции, например, слайд-шоу или 3D анимация происходящие полностью в автоматическом режиме.

Интегрирующей, содержательно и функционально завершенной единицей мультимедиа контента является сцена. Мультимедиа сцена – полноэкранный интегральный терм (образ), объединяющий единым замыслом и логическими связями медиа элементы, медиа комбинации и мультимедиа композиции для представления определенной совокупности объектов и процессов в интерактивном алгоритме .

Мультимедиа сцена полностью занимает отведенное данному программному приложению поле контента, для построения сцены используется множество файлов, обязательным условием является интерактивность всех или части представляемых в сцене объектов и/или процессов.

Динамично обновляемый медиа контент вызывает большой интерес для интернет-аудитории. Именно поэтому он широко используется для привлечения к интернет - ресурсам новых пользователей и удерживания уже имеющихся. Интерес пользователей к медиа контенту возрос еще и благодаря существенному увеличению скорости доступа к ресурсам интернета, стандартизации конечных пользовательских устройств и соответствующих программных сред разработчиков приложений и контента. В парке настольных персональных компьютерных систем – семейство OS Windows, Mac OS и Linux; на мобильных платформах – iOS, android и windows phone. Выдержки из статистики компании Apple на конец сентября 2013 года подтверждают высокий рост в процессе создания и дальнейшего потребления медиа контента: если на начало 2012 года в магазине AppStore было выложено 750 000 мобильных приложений то на сентябрь 2013 года их количество выросло до 950 000, что интересно 50 000 новых приложений появились лишь за два последних месяца . Общее количество загрузок приложений из AppStore превысило 40 миллиардов на январь 2013 года, из них 20 миллиардов скачиваний приходится на 2012 год.

В настоящее время, каждую минуту на ресурсе YouTube загружается 35 часов видеоконтента или более 50 000 часов в месяц. В месяц на Youtube загружается пользовательского видео больше, чем произведено всеми телевизионными каналами и студиями США с момента начала их работы. Для сравнения: в начале 2008 года в YouTube загружалось 10 часов в минуту. Объем рынка цифрового контента в мире в 2008 г. превышал 700 млрд. долл. США, в России - 2,5 млрд. долл. В 2011 г. объем мирового рынка оценивается более, чем в 1 трлн. долл. США, в России – 5 млрд. долл. США . Растет объем контента, передаваемого через сети мобильной связи: объем передаваемого трафика в российских сотовых сетях с введением формата 3G удвоился.

Таким образом, понимание закономерностей создания и распространения медиа контента является одной из основ для понимания того, как развиваются и будут развиваться массовые коммуникаци.

В следующем разделе мы более подробно рассматрим типология контента и его создателей, а также возможности распространения медиа контента.

(Продолжение следует )

Список литературы :

1. Capitalising on Convergence: Delivering Value and Driving Growth in the Digitally Converged World, Intellect, 2005.

2. The Network Society: A Shift in Cognitive Ecologies? by Mathew Wall-Smith, 2010.

3. The Death of “e” and the Birth of the Real New Economy, Peter Fingar and Ronald Aronica, 2000.

4. Digital Radio Broadcast Bureau, DAB Digital Sales Top 3 Million, 2 May 2006.

5. Computing: BBC’s IT outsourcing may be start of trend, Daniel Thomas, 2 March 2005.

6. Facing Piracy: Digital Theft in the Filmed Entertainment Industry, Deloitte MCS UK Ltd., 2004.

7. APP Empire, Chad Mureta, John Wiley & Sons, Inc., 2013.

8. iPhone and iPad APPS marketing, Jeffrey Hughes, QUE, 2012.

Контент-анализ — описание метода

Контент-анализ (от англ. contens содержание) — метод качественно-количественного анализа содержания документов с целью выявления или измерения различных фактов и тенденций, отраженных в этих документах. Особенность контент-анализа состоит в том, что он изучает документы в их социальном контексте. Может использоваться как основной метод исследования (например, контент-анализ текста при исследовании политической направленности газеты), параллельный, т.е. в сочетании с другими методами (напр., в исследовании эффективности функционирования средств массовой информации), вспомогательный или контрольный (напр., при классификации ответов на открытые вопросы анкет).

Не все документы могут стать объектом контент-анализа. Необходимо, чтобы исследуемое содержание позволило задать однозначное правило для надежного фиксирования нужных характеристик (принцип формализации), а также, чтобы интересующие исследователя элементы содержания встречались с достаточной частотой (принцип статистической значимости). Чаще всего в качестве объектов исследования контент-анализа выступают сообщения печати, радио, телевидения, протоколы собраний, письма, приказы, распоряжения и т.д., а также данные свободных интервью и открытые вопросы анкет. Основные направления применения контент-анализа: выявление того, что существовало до текста и что тем или иным образом получило в нем отражение (текст как индикатор определенных сторон изучаемого объекта — окружающей действительности, автора или адресата); определение того, что существует только в тексте как таковом (различные характеристики формы — язык, структура, жанр сообщения, ритм и тон речи); выявление того, что будет существовать после текста, т.е. после его восприятия адресатом (оценка различных эффектов воздействия).

В разработке и практическом применении контент-анализа выделяют несколько стадий. После того, как сформулированы тема, задачи и гипотезы исследования, определяются категории анализа — наиболее общие, ключевые понятия, соответствующие исследовательским задачам. Система категорий играет роль вопросов в анкете и указывает, какие ответы должны быть найдены в тексте. В практике отечественного контент-анализа сложилась довольно устойчивая система категорий — знак, цели, ценности, тема, герой, автор, жанр и др. Все более широко распространяется контент-анализ сообщений средств массовой информации, основанный на парадигматическом подходе, в соответствии с которым изучаемые признаки текстов (содержание проблемы, причины ее возникновения, проблемообразующий субъект, степень напряженности проблемы, пути ее решения и др.) рассматриваются как определенным образом организованная структура.

Категории контент-анализа должны быть исчерпывающими (охватывать все части содержания, определяемые задачами данного исследования), взаимоисключающими (одни и те же части не должны принадлежать различным категориям), надежными (между кодировщиками не должно быть разногласий по поводу того, какие части содержания следует относить к той или иной категории) и уместными (соответствовать поставленной задаче и исследуемому содержанию). При выборе категорий для контент-анализа следует избегать крайностей: выбора слишком многочисленных и дробных категорий, почти повторяющих текст, и выбора слишком крупных категорий, т.к. это может привести к упрощенному, поверхностному анализу. Иногда необходимо принимать во внимание и отсутствующие элементы текста, которые могут быть значимыми для контент-анализа.

После того, как категории сформулированы, необходимо выбрать соответствующую единицу анализа — лингвистическую единицу речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явления. В практике отечественных контент-аналитических исследований наиболее, употребительными единицами анализа являются слово, простое предложение, суждение, тема, автор, герой, социальная ситуация, сообщение в целом и др. Сложные виды контент-анализа обычно оперируют не одной, а несколькими единицами анализа. Единицы анализа, взятые изолировано, могут быть не всегда правильно истолкованы, поэтому они рассматриваются на фоне более широких лингвистических или содержательных структур, указывающих на характер членения текста, в пределах которого идентифицируется присутствие или отсутствие единиц анализа — контекстуальных единиц. Например, для единицы анализа «слово» контекстуальная единица — «предложение». Наконец, необходимо установить единицу счета — количественную меру взаимосвязи текстовых и внетекстовых явлений. Наиболее употребительны такие единицы счета, как время-пространство (число строк, площадь в квадратных сантиметрах, минуты, время вещания и т.п.), появление признаков в тексте, частота их появления (интенсивность).

Важен выбор необходимых источников, подвергаемых контент-анализу. Проблема выборки содержит в себе выбор источника, количества сообщений, даты сообщения и исследуемого содержания. Все эти параметры выборки определяются задачами и масштабами исследования. Чаше всего контент-анализ проводится на годичной выборке: если это изучение протоколов собраний, то достаточно 12 протоколов (по числу месяцев), если изучение сообщений средств массовой информации — 12—16 номеров газеты или теле-, радиодней. Обычно выборка сообщений средств массовой информации составляет 200—600 текстов.

элементы логич. модели предмета контент-анлиза (см.). Содержание текста может быть измерено при помощи двух типов измерения (мер): единиц протяженности и единицы частоты. Единицы протяженности характеризуют содержание в целом, без учета его деления на элементы. В качестве таких единиц чаще всего используются квадратный сантиметр (дюйм), стандартные строки верстки, минута (час) эфирного времени. Использование таких единиц позволяет достаточно точно определить объем внимания коммуникатора к различн. категориям анализа. В силу своей объектности указанные единицы пригодны для измерения только тех свойств коммуникатора, к-рые непосредственно выражаются в его тексте. Единица частоты позволяет измерять поведение и на уровне содержания текста (в частности, измерять структуру тематич. содержания текста). Если мера протяженности представлена достаточно большим видом единиц измерения, то мера частоты представлена единственной единицей измерения - единичным присутствием элемента содержания. Применительно к тексту приведенные единицы исчерпывают арсенал единиц измерения, поскольку текст и его содержание характеризуются только двумя свойствами, к-рые могут быть измерены: протяженностью и дискретностью структуры этой протяженности. Поэтому выделение большого числа типов единиц измерения (мер) является признаком нестрогости или эклектизма. Все единицы анализа в зависимости от характера их связи с единицами измерения можно разбить на два типа: частотные и частотно-протяженные. К частотным в качестве меры приложима только единица частоты (напр., к ним относятся слово, суждение); к частотно-протяженным - оба типа единиц измерения (напр., сообщение). В том случае, когда возможно использование обоих типов единиц измерения, встает проблема оптимальности выбора, сущность к-рой состоит в том, чтобы ответить на вопрос: "Выражается ли данный признак наиболее адекватно при помощи протяженности или при помощи частоты?". Ответ на такой вопрос не является тривиальным и требует проведения специальных исследований. В принципе можно предположить, что число типов единиц анализа велико. Можно считать, что каждая из единиц содержания текста может быть потенциально единицей анализа. Введение новых единиц анализа определяется соответствующими теоретич. предпосылками. Поскольку запас языковых единиц содержания (как типов) ограничен, то и число единиц анализа, рекрутируемых из этой сферы, невелико. Значительный по объему источник потенциальных единиц анализа представляют тематич. элементы содержания текста. Единицы анализа могут быть классифицированы по следующим трем основаниям: языковые-тематич., объектные-необъектные, коммуникационные-структурные. Как правило, языковые единицы (элементы структуры языка) крайне редко используются в качестве единиц анализа в социологич. исследованиях. Тематич. единицы (элементы структуры содержания текста) в настоящее время занимают все большее место в контент-аналитич. исследованиях (напр., тема сообщения, герой, ситуация). Те единицы анализа, к-рые непосредственно представлены в тексте, являются объектными. К ним относятся единицы протяженности (сообщение, рубрика, слово, предложение). К необъектным единицам относятся все тематич. единицы. Противопоставление коммуникационных единиц структурным связано с онтологическим статусом единиц анализа. Естественно, что все языковые единицы обладают этим статусом (т. е. используются и при создании текста, и при его потреблении). Таким статусом обладают и нек-рые тематич. единицы (напр., тема сообщения). Наиболее часто используются следующие единицы анализа. Слово (словосочетание) - наименьшая единица анализа (из языковых), приемлемая в социологич. исследовании; используется в анализе политич. языка, исследовании стиля сообщений. Сообщение - одна из наиболее часто используемых единиц анализа. Характеризуется целостностью. Размер и структура сообщений зависят от типа коммуникации. Выделение сообщения в структуре текста обычно не требует к.-л. специальных инструкций. Герой (характер) - определенный тип деятеля, обладающего четко выраженными соц. чертами. Наиболее часто эта единица используется при анализе небольших произведений литературы (рассказ, очерк). Примером этой единицы является герой информации, выделяемый в содержании на основе рода его занятий. Тема - очень широко применяемая и очень плохо разработанная единица анализа. В амер. литературе термины "суждение" и "тема" употребляются как синонимы, причем чаще всего тема определяется через понятие суждения. Понятие темы используется в таких случаях в категориальном значении, т. е. говорится скорее о тематич. признаке, чем о единице анализа, ибо темы могут выделяться и в целых сообщениях, и в их частях различн. объема (абзацах, предложениях). Тема может быть выражена не только суждением, но и словом, и словосочетанием (напр., наименование рубрики в газете). Суждение - наиболее мощная и сложная в использовании единица анализа. В качестве его определения может быть принято определение суждения в логике с учетом двух особенностей использования этой единицы в контент-анализе. Во-первых, суждение обладает высокой степенью конструктивности и поэтому, вероятно, не является коммуникационной единицей. Во-вторых, структура суждения как единицы анализа обычно является более расчлененной и сложной, чем в логике. Чаще всего она состоит более чем из трех элементов (субъекта, предиката и связки). В общем виде структура суждения может быть представлена в фасетной форме, т. е. в виде ряда ячеек, в к-рых расположены однотипные элементы. Такое представление означает, что при конкретном наполнении такая структура порождает огромное число типов суждений (напр., при шести фасетах и числе элементов в каждом из них от 5 до 10 общее число типов суждений может достигать нескольких миллионов). Практически в исследуемых текстах на один тип суждения в среднем приходится 1-2 упоминания, следовательно, значительное число типов суждений вообще не встречается в содержании текста. Поэтому чаще всего информация анализируется не в виде суждений в целом, а в виде отдельных фасетов, т. е. единицей анализа практически является элемент суждений. При использовании ЭВМ можно выделить эмпирически наиболее значимые в статистич. отношении типы суждений и вести их анализ. Возможно также и такое решение: определить уровень отождествления суждений (напр., на основе их модальности), и различать суждения согласно этому уровню; при этом число типов суждений уменьшается до приемлемой величины (5-10 типов). Суждение является гибкой единицей анализа, может быть использовано для относительно небольших частей содержания текста. Ситуация - это единица, к-рая имеет целью представить содержание текста в виде структуры, отражающей фрагменты действительности. Фрагменты могут быть представлены не только в виде действующего лица, но и в виде мотивов, средств, целей деятельности. В состав структуры ситуации могут входить следующие элементы: субъект деятельности, локальность субъекта (сфера соц. жизни и т. п.), характер представления субъекта коммуникатором, знак отношения коммуникатора к субъекту, интересы субъекта, его цели, мотивы действий и т. п. Близкой по замыслу к ситуации является такая единица анализа, как единица действия, к-рая может быть использована как элемент ситуации. Классич. примером такой единицы является функция действующих лиц волшебных сказок, разработанная В.Я.Проппом. В большинстве контент-аналитич. исследований используется несколько единиц анализа. Это связано с кодировочной операцией в контент-анализе, где необходимо взаимодействие единиц анализа. Указанное взаимодействие может быть рассмотрено в связи с двумя процессами, во многом обеспечивающими получение аналитич. информации (т. е. информации о предмете исследования, получаемой в соответствии с задачами исследования): процессом кодирования и процессом структурирования закодированного материала. В процессе кодирования выделяются два аспекта: разбиение содержания текста на единицы (юнитизация) и их классифицирование по категориям анализа. В рамках разбиения содержания текста выделяются единицы: выборочн., наблюдения, фиксирующая, кодировочная контекста. Эти пять типов единиц представляют наиболее общий случай. В отдельных исследованиях число единиц может быть меньшим. Границы между типами единиц являются достаточно подвижными, т. е. возможен переход конкретных единиц из типа в тип. Выборочн. единица определяет объем исследуемого текста. Чаще для этого используется макросообщение (номер газеты, день вещания или программа вещания). Однако можно представить себе иерархич. структуру выборки, в к-рой в роли единиц последовательно выступают, напр., номер газеты, материал, суждение. Единицей наблюдения, т. е. единицей, в рамках к-рой производится семантич. анализ содержания текста с целью кодирования, обычно является сообщение (напр., статья, очерк и т. а). При иерархич. структуре выборки в роли единицы наблюдения могут выступать и части сообщения. Фиксирующая единица - это та часть содержания текста, в пределах к-рой происходит фиксация категорий анализа. Смысл введения этой единицы определяется спецификой частотного измерения (основанного на использовании единицы частоты). В границах фиксирующей единицы появление категории фиксируется только один раз. Выбор этой единицы сказывается на рез-тах анализа. Поэтому важно определение относительной протяженности единицы фиксирований. Пока часто используется механич. разбиение текста на фиксирующие единицы (напр., 50, 100, 150 строк). Однако следует признать, что механич. разбиение не является обоснованным и очень плохо связано с тематич. структурой содержания. По-видимому, объем указанной единицы должен определяться характером коммуникационного процесса. Кодировочная единица обеспечивает фиксирование категорий анализа и тем самым измерение интенсивности появления признаков объекта исследования. В качестве кодировочных обычно выступают такие единицы, как слово, тема, сообщение, суждение, ситуация, действие. Кодировоч. единица зависит от единицы контекста - части содержания текста, знание к-рой позволяет произвести классифицирование единицы содержания, релевантной принятой кодировочной единице, и соответствующую категорию анализа. Естественной единицей контекста выступает сообщение. (В этом случае может совпадать с единицей наблюдения; однако факт совпадения на означает, что не нужно функциональное разграничение этих типов жизнь ниц. ведь эти единицы выполняют различ. функции) Возможно использование меньших и больших, чем сообщение, единиц контекста (напр., абзаца, страницы). При использовании для измерения единиц протяженности фиксирующая единица сливается с кодировочной. В этом случае процесс кодирования осложняется необходимостью измерения протяженности единиц содержания, релевантных кодировочной единице. Основание классификации связано с выделением единицы анализа, при помощи к-рой производится структурирование закодированного материала, т. е. представление структуры ана-литич. информации. Здесь выделяются единицы классификации и единицы структурирования. В роли первых выступают единицы, используемые в качестве кодировочных. Единицы структурирования - это единицы, в терминах к-рых ведется анализ. Выбор единицы структурирования обосновывается целями исследования и часто существенно влияет на выводы аналитика. Существует еще одна возможность взаимодействия единиц, к-рая связана со стадиями анализа. Поскольку большая по объему единица анализа может быть охарактеризована при помощи меньших, то при использовании в качестве кодировочных наименьших (из приемлемых для проводимого исследования) единиц мы сохраняем возможность использовать закодированный материал для целей интегрирования на уровне единиц анализа. Так, возможен переход от слов и суждений к сообщениям. Конечно, возможность такого перехода определяется категориальной системой предмета исследования (т. к. иногда единицы анализа определенного объема могут быть нерелевантными принятым в исследовании категориям анализа). Наиболее оптимальным является вариант одновременного интегрирования категорий и единиц анализа. Он дает возможность измерения в одном исследовании различн. уровней содержания текста. Лит.: см. к ст. Контент-анализ. Е.Л. Гаршис.

Рассказать друзьям