Контакты

Контент-анализ текста. Метод и его описание

Контент-анализ сайта нужен для оценки эффективности размещенных статей, обзоров, описаний и других видов контента. Анализ позволяет понять, как на контент будут реагировать пользователи и поисковые системы, что можно улучшить для повышения позиций в выдаче, от каких приемов лучше отказаться. Контент-анализ сайта обычно используют после запуска веб-ресурса, когда появляется первый трафик, в процессе развития портала или после смены подачи материалов, тематики сайта, его оформления.

Мы решили написать свою статью про контент-анализ и рассказать в ней, на что нужно обратить внимание и какие методики оценки существуют. Будем оценивать не только смысловую составляющую, но и многие технические параметры текста. Статья будет полезна начинающим вебмастерам, SEO-специалистам и владельцам бизнеса, которые хотят контролировать все сами.

Важно: слишком ярко оформленный текст - тоже не очень хорошо. Если в нем расставлено много акцентов в виде выделений жирным, курсивом, цветом, пользователь не сможет сконцентрировать внимание. Оптимальное решение - лаконичное, но понятное оформление.


Какую из статей вам удобнее читать?

Иллюстрации . Иллюстрации важны для - о нем мы тоже рассказывали в отдельной статье . Они помогают лучше понять статью или показывают пользователю очередность действий, кнопку, на которую стоит нажимать, конкретный результат. Если в статье есть уместные GIF-анимация, скриншоты и картинки, она становится привлекательнее для пользователей. Но не стоит добавлять картинки только ради картинок. Они не несут добавочной ценности контенту, поэтому бесполезны.

Чтобы оценить качество иллюстраций, достаточно бегло просмотреть страницу. Если картинки сильнее раскрывают тему, они уместны. Если нет, их можно удалить.


Пример хорошей иллюстрации, которая является частью контента

Ссылки на связанные по теме страницы . Они нужны для внутренней перелинковки сайта и выполняют важную функцию для пользователей - помогают им глубже разобраться в теме. Например, в этой статье мы оставим ссылку на статью о профессии : это поможет понять, обязан ли он делать контент-анализ.

Чтобы оценить число ссылок и корректность их расположения, нужно просмотреть все содержимое страницы.


Вводный абзац - вода, никак не помогающая лучше понять смысл текста

Соответствие заголовку . Здесь тоже придется хотя бы бегло просмотреть содержимое страницы. Если контент отвечает на главный вопрос в заголовке так, что у читателя не остается вопросов - ничего не нужно менять. Если же содержимое статьи не совсем соответствует заголовку или теме, лучше ее переписать.


Для оценки с точки зрения машин

Релевантность . Ее можно оценить с помощью семантического анализа текста. На первом месте должны быть слова и словосочетания, характеризующие основную тему материала - например, слова «строительство» и «дом» в статье о строительстве дома. Для семантического анализа статей можно использовать онлайн-сервисы Адвего, Текст.ру, istio.com.

Уникальность . Уникальность контента - один из факторов ранжирования страниц в поисковых системах. Чем она выше, тем лучше - статьи со 100% уникальностью воспринимаются поисковыми системами хорошо, конечно, если пользователи дочитывают их. Чтобы определить уникальность страницы, можно использовать онлайн-сервисы Текст.ру, Адвего, Etxt.ru, content-watch.ru.

Если уникальность текста в пределах 85-100%, не нужно ничего менять. Если показатель ниже, стоит доработать текст. Но учитывайте, что уже опубликованные статьи при условии индексации имеют уникальность 0%. Если в результатах проверки стоит ссылка только на ваш сайт, все нормально. Если нет - вашу статью скопировали конкуренты, и лучше ее уникализировать. А на будущее добавлять весь публикуемый контент в сервис «Оригинальные тексты» в .

Вхождение ключевых слов . Оптимизированный текст - тот, в котором есть ключевые словосочетания. Желательно, чтобы они находились на первых местах в семантическом ядре: тогда поисковая система поймет, о чем статья, и будет показывать ее по использованным ключевым словам.

Для оценки вхождений ключевых слов используйте сервисы семантического анализа - о них мы говорили выше. Сразу оцените тип вхождения: прямое вхождение «кривых» ключей может негативно повлиять на продвижение. Не используйте фразы типа «купить окно пластик Москва недорого», приведите их к человеческому «купить недорогое пластиковое окно в Москве».

Объем текста . Объем текста можно посмотреть в визуальном редакторе в админ-панели или в любом редакторе типа Word. Здесь нет единого канона, на который нужно равняться: пользователи читают и короткие описания до 500 символов в интернет-магазинах, и длинные лонгриды на 25 000 символов. Этот показатель позволит оценить, похожи ли статьи на тексты в ТОПе выдачи поисковой системы, и доработать их при необходимости.

Метатеги . Здесь нужно оценить Title и Description, а также заголовки от h1 и меньше. Делать это придется вручную. Желательно, чтобы в были вхождения главных ключевых слов - это тоже поможет поисковой системе понять, о чем статья, и показывать ее по правильным запросам.

Уникальность метатегов можно просмотреть в сервисах типа «Яндекс.Вебмастер». А узнать, заполнены ли они - в сервисах «Серпстат», «Пиксель Тулс». Или проверить вручную.

Поведенческий фактор . Оцените количество посещений, среднее время сеанса, глубину просмотра сайта и другие параметры. В коммерческих проектах также нужно оценивать конверсию. Чем выше число уникальных посетителей, процент конверсии, время сеанса - тем лучше. Если показатели низкие, значит, на ваш сайт не заходят, или быстро покидают его, или ваш контент не убеждает сделать покупку.

Оценить поведенческий фактор можно с помощью специальных сервисов, плагинов, дополнений. Например, используйте .

Видимость в поисковых системах . Весь контент за исключением сугубо технических страниц, не предназначенных для пользователей, должен быть виден в поисковых системах. Если нет индексации, пользователи не будут видеть ваш сайт в органической выдаче, а значит, для привлечения трафика придется потратить деньги на закупку рекламы.

Просмотреть видимость сайта и отдельных страниц в поисковых системах можно в специальных сервисах - например, в «Яндекс.Вебмастере» для поисковой системы Яндекс или в сервисе «Серпстат».

Количество расшариваний. Чем больше репостов набирают статьи - тем больше пользователи доверяют им. Чтобы просмотреть количество расшариваний, достаточно просмотреть счетчик на странице. Если у вас подключен плагин расшаривания, на каждой странице будет указано количество репостов в каждой социальной сети и в каждом сервисе. Если счетчика нет, можно найти репосты вручную - ввести в строку поиска по новостям соцсети ссылку на страницу или полностью статью.

В результате оценки сайта по параметрам могут получиться такие таблицы:

Приведённые таблицы и метрики — это наглядный пример алгоритма оценки и анализа контента у себя на сайте. Ваш отчёт, при необходимости и в зависимости от задач, может содержать больше или меньше параметров оценки.

Что делать с полученными данными

Если есть ошибки - исправьте их, если контент не оптимизирован - добавьте ключевые слова, если нет иллюстраций - сделайте тематические скриншоты или картинки, помогающие лучше понять материал. Все зависит от целей контент-анализа и параметров, которые вы проверяли.

Оценивайте контент в зависимости от того, для каких целей и задач он предназначен. Например:

  • для коммерческого обзора товара важно число переходов по ссылке в интернет-магазин, в котором он продается;
  • для важно количество лидов;
  • для описания категорий и товаров в интернет-магазинах важна оптимизация и видимость в поисковых системах;
  • для важно число комментариев и расшариваний в социальных сетях.

Какие можно сделать выводы

  • На оценку всего сайта может уйти огромное количество времени, поэтому для анализа выбирайте самые важные (товарные категории, посадочные под услуги и так далее).
  • Контент должен быть полезен и для пользователей, и высоко оцениваться поисковыми системами, поэтому лучше использовать оба метода контент-анализа.
  • Нужно выбирать метрики и показатели в зависимости от целей и задач размещенного контента.
  • Хорошие статьи - релевантный текст с грамотной структурой, иллюстрациями, без ошибок, уникальный и оптимизированный.
  • Чем выше время просмотра, число посетителей и количество расшариваний, тем эффективней контент на сайте.

А делаете ли вы контент-анализ, и в каких конкретно случаях его используете? Поделитесь своим мнением в комментариях, нам будет очень интересно.

Уже неоднократно повторяли, что контент является одним из значимых способов ранжирования как в Яндексе, так и в Google. И чтобы продвинуть свой сайт, стоит огромное внимание уделить его наполнению. При этом учесть и технические характеристики, и пользу, которую извлечет для себя потенциальный клиент, посетив ваш ресурс.

Если вы хотите, чтобы ваше «детище» радовало хорошими позициями, отличным трафиком и притоком клиентов, проведите контент-анализ сайта. Благодаря ему вы выявите ошибки (может, и незначительные), которые мешают вашему ресурсу покорить заветный топ. Ну что, давайте разбираться?

Условно контент-анализ можно разделить на 3 части:

Ох, сколько на свете существует сайтов, наполненных ненужными, неинтересными и просто «несваримыми» текстами, после прочтения которых остается легкое (а порой и не совсем) чувство сожаления о потраченном времени. Помните, наполнять сайт контентом нужно не «от балды», а постоянно держа в голове мысль: важно ли это будет моему потенциальному клиенту или я вставил этот абзац для красного словца? Итак, о чем всегда нужно помнить.

Уникальное торговое предложение

Даже если вам кажется, что вы ничем не отличаетесь от конкурентов, всегда можно найти фишечку, которая выделит вас среди «серой массы». Причем не только можно, но и нужно! Ведь если вы сами не знаете, почему именно в вашу компанию стоит обратиться за определенным продуктом, то как это поймет сам клиент? Люди всегда ищут что-то лучше/дешевле/красивее - это аксиома. Вот лучшее/красивое/недорогое и есть уникальное торговое предложение.

Про виды УТП, а также про то, как его составить, мы уже писали ранее - советуем ознакомиться. Главное помнить, что уникальное торговое предложение не должно быть обманкой, а то лишитесь доверия клиента как по мановению волшебной палочки: вжух, и его нет. Ведь вряд ли вашим заказчикам будет приятно узнать, что громкий лозунг «на нашем сайте цены ниже на 50%, чем у конкурентов» - всего лишь маркетинговый ход. Кроме того, запомните, что фразы «высокое качество», «высококвалифицированные специалисты», «оперативная доставка» - это не УТП, а заезженные штампы, от которых давно стоит избавиться. А если у нас и правда оперативная доставка? - возмущенно можете заявить вы. Прекрасно, тогда подтвердите это цифрами и извлеките для клиента пользу. Например: Доставим изделие в течение 2 часов после оформления заказа. Вуаля - клишированная, потерявшая ценность фраза превратилась в отличное торговое предложение.

Ловите еще один пример неплохого УТП, подходящего для B2B сферы.

Структура продающего текста

Вы все еще думаете, что разместив огромное «полотно» пусть и полезного текста, пользователь с готовностью потратит добрых полчаса, чтобы это прочесть? А вот как бы не так. Количество - далеко не синоним качества. Как показывает практика, пользователи чаще всего покидают сайт в первые 10 секунд просмотра, когда понимают, что не осилят громоздкий текст. Соответственно, все это негативно отражается не только на настроении клиента, ведь он не нашел для себя ничего ценного, но и на поведенческих факторах.

Позаботьтесь о своих потенциальных клиентах, уделите особое внимание структуре текста. Чем проще будет изложена информация, тем быстрее в мозг потенциальных заказчиков поступит сигнал «о, это именно то, что я ищу». И не нужно быть дальним родственником Пабло Пикассо или иметь дизайнерское образование, чтобы красиво оформить текст. Иконки, подчеркивания, выделения, шрифты - поэкспериментируйте и найдите свой стиль. Только не переборщите, буйство красок и объемов - тоже отнюдь не лучший вариант.

Пример эстетичного и привлекательного размещения:

И это отнюдь не все секреты по правильному оформлению текста. Подробные иллюстрированные советы, как сделать текст читабельным для пользователей, вы найдете .

Смысловая уникальность текста

Нет, сейчас не о той уникальности, которую можно проверить через специальные сервисы - о ней поговорим позже. Мы имеем в виду добавочную ценность. То, что делает вас непохожим на сотни других сайтов с похожей тематикой. Помимо проработки хорошего УТП, можно использовать и другие приемы. Например, быть ориентированными на определенную целевую аудиторию. Допустим, пока ваши конкуренты пытаются продвинуть свой музыкальный портал, направленный на всех меломанов, вы можете «нацелиться» только на любителей джаза. Да, мы резко ограничили ЦА, но фанаты Эллы Фицджеральд, Рэя Чарльза и других культовых личностей могут сделать вам такой трафик (если найдут для себя что-то интересное), который вашим конкурентам с широкой целевой аудиторией даже и не снился. Чтобы узнать о других способах вычленить добавочную ценность, добро пожаловать сюда .

Отсутствие ошибок

Наивно полагаете, что наличие опечаток и орфографических/грамматических/стилистических ошибок ни на что не влияет? Придется вас разочаровать - еще как влияет. Вы даже не представляете, насколько дотошно большинство пользователей читают тексты, а, найдя элементарные недочеты, ярые фанаты русского языка трагически морщатся, тут же закрывают страницу и больше никогда не возвращаются на сайт. Вроде бы незначительная оплошность, но авторитет компании может подорвать. Да и на показателе отказов тоже отразится негативно. Поэтому обязательно проверяйте ваши тексты, используя сервисы glvrd.ru , orfogrammka.ru и палочку-выручалочку, знающую ответы на все вопросы - сайт Грамота.ru . А если хотите на 100% быть уверены в качестве своего контента, обращайтесь к профессиональным копирайтерам .

Анализ технических характеристик текста для пользы SEO

Итак, о «возвышенном» поговорили - время перейти к статистическим данным, без которых о хороших позициях сайта можно забыть. Тут также важна комплексная работа - порой даже за маленький промах можно «схлопотать ремня» от поисковиков. Но отложим философию до лучших времен, приступим к делу.

Оценка объема текста

Чтобы страница хорошо индексировалась, необходим текст объемом не менее 500 символов. Но ориентироваться на это значение стоит далеко не всегда - все зависит от сферы бизнеса и типа ресурса. К примеру, для карточки товара интернет-магазина 500 знаков будет более чем достаточно.

Но для главной страницы такого объема хватит лишь для описания деятельности вашей компании. Оптимальным показателем считается текст размером в 1500-2500 символов. Но и тут нужно держать руку на пульсе: если у ваших конкурентов, которые уже в ТОПе объем информации превышает 4000 знаков, то стоит увеличить и ваш текст, а то есть риск потеряться.

Техническая уникальность текстового контента

Из статьи в статью мы повторяем, как мантру, что тексты должны быть уникальными. Для проверки рекомендуем использовать сервисы TEXT.RU или CONTENT-WATCH .

Однако даже если к вашему контенту не придерешься, стоит защитить себя от воровства. Да-да, поверьте, существуют не только воры-карманники: признали конкуренты вашу статью шедевром копирайтерского мастерства и «позаимствовали» себе. Но самое обидное, что поисковики могут посчитать неуникальным текст именно на вашем ресурсе и исключить страницу из индекса. Чтобы уберечь свой контент, обязательно закрепите права в Яндекс.Вебмастер. О том, как это сделать, мы уже писали .

Вхождение ключевых слов в текст

Скоро страшилка о Баден-Бадене встанет в один ряд с историями о Пиковой даме и «черном-черном городе». О том, что сейчас речь идет об алгоритме и соответственно санкциях Яндекса , а не об известном немецком курорте, не поймет только пещерный человек. Но шутки в сторону: прежде чем размещать текст, обязательно проверьте тошноту по сервису Advego. Оптимальный показатель составляет 9-11%.

Превышение значения уже грозит переспамом и мелькающим на горизонте поездом до Баден-Бадена. После размещения текста на сайте мы также рекомендуем отследить тошноту и количество ключевых слов через сайт pr-cy.ru.

Нормой является показатель от 4 до 8%. Если значение меньше, стоит добавить ключевых запросов в текст, а то мечта о заветном топе так и останется мечтой. При переоптимизации, наоборот, удалите несколько ключевиков, иначе последующая борьба с фильтрами отнимет много времени и сил.

И еще пара слов об уникальности

Только теперь уже об изображениях. Оригинальные и уникальные картинки способны принести вам дополнительный трафик: поисковики проиндексируют изображения и будут отражать их в выдаче. О пользе фотографий и правильной работе с ними мы рассказывали в одной из наших статей , поэтому сегодня акцентировать на этом внимание не будем.

Корректное написание заголовка title

Один из важнейших тегов, ведь именно он отражается в поисковой выдаче, формируя часть сниппета. Глядя на заголовок, люди решают, стоит ли им заходить на этот сайт или лучше еще полазить по просторам Интернета. Поэтому к созданию title стоит отнестись очень внимательно.

  1. Максимальная длина - не более 70 символов. Поисковики индексируют и длинные заголовки, однако в выдаче он получается обрезанным, что выглядит неэстетично и непривлекательно.
  2. Использование ключевых слов. Если вы все еще думаете, что нашпиговав title ключами сразу попадете на топ-10, то мы сейчас вас сильно-сильно разочаруем. Поверьте, чем меньше ключевиков используется в заголовке, тем больший вес они приобретают. Поэтому используйте 1-2 важных запроса.
  3. Релевантность. Заголовок должен отражать содержимое страницы. Поэтому если у вас в title содержится ключевой запрос «цены» или «услуги», а в тексте этой информации нет, то потенциальный клиент покинет сайт спустя 7-10 секунд, недовольно бурча себе под нос. А оно вам надо?
  4. Цельная фраза. Помните, что вы ориентируетесь (чаще всего) на человека, владеющего русским языком, поэтому и заголовки должны представлять из себя цельную цепляющую фразу. А набор слов в стиле «купить зеленая корсет красивый и недорого» лучше оставить для Ali Express.

Анализ соответствия текстов ожиданиям читателей

Ну и заключительный блок, который очень часто оставляют без внимания. И напрасно. Чтобы сайт не упал в выдаче, не следует забывать о 3 важных моментах.

Определение релевантности страниц

Напомним, что релевантность - это соответствие страницы ключевому запросу. Размытие релевантности может привести к потере веса страницы, ухудшению поведенческих факторов и, как результат, к снижению трафика. Поэтому к проверке стоит отнестись со всей серьезностью. Да, это трудоемкий процесс, требующий времени и терпения, но кто сказал, что продвижение сайта - это быстро, весело и легко?

Определение релевантности страницы можно провести вручную, вбив запрос в поисковую систему и нажав «Искать на сайте».

Видите первую появившуюся страницу? Она и есть релевантная. Чтобы не запутаться в ключевиках, все данные отражаем в табличке. Да, в этом случае стоит быть педантом. =)

Ручной метод, пожалуй, самый надежный. Но если темперамент не позволяет вам скрупулезно проверять каждый запрос, то на ваше счастье есть несколько сервисов, которые проверят релевантность страниц за пару минут: Топвизор , All Positions или Анализсайта.com .

Выглядит это примерно так:

Точно так же формируем отчет, только теперь на его подготовку уйдет не 2 часа, а максимум 20 минут. Если умная машина нашла релевантные страницы не для всех запросов, рекомендуем не полениться и проверить их вручную.

Определение посадочных страниц

Секундочка ликбеза: посадочной страницей называют ту, на которую пользователь попадает прямиком из поиска. И если релевантность страницы определяют Его Величества поисковики, то ответственным за «посадочность» являетесь вы сами. Но не зря же мы столько мучились с составлением таблички - применяем результаты на практике.

Однако нередки случаи, когда Яндекс и Google не совпадают во мнениях и для одного и того же ключевого запроса определяют разные релевантные страницы. Вот яркий пример:

Естественно, продвигать две страницы по одному и тому же ключевику мы не можем, поэтому отталкиваемся от позиций в выдаче. По запросу «стрижка в салоне красоты» в Яндексе сайт занимает 192 позицию, а в Google - 213. Логично, что в качестве посадочной мы выберем страницу /strizhka/. Уверены, что вы захотите подняться в поиске, поэтому бросите все силы на продвижение этой статьи. И со временем Google сжалится и примет эту страницу в качестве релевантной.

Отслеживание смены релевантности

Решили, что раз разобрались с релевантными и посадочными страницами, то дело в шляпе? Не тут-то было, все может измениться. Причем не в лучшую для вас сторону. Отсматривать смену релевантных страниц нужно обязательно - в этом вам помогут сервисы, которые мы уже сегодня называли - Топвизор и All Positions. После каждой проверки они будут предоставлять вам данные и сообщать, насколько часто позиции меняются.

Постоянные скачки могут привести к каннибализации ключевых запросов, и тогда с мечтами о тысячах заказчиках придется распрощаться. Как этого не допустить, мы уже рассказывали .

Вместо заключения

В статье мы осветили алгоритм проведения контент-анализа сайта, с которым вы без труда сможете справиться собственными силами. Но, как говорится, одной теорией сыт не будешь =). Предлагаем вам рассмотреть для главной страницы от А до Я.

Однако если вы не уверены, что осилите продвижение сайта самостоятельно, а идея о потоке клиентов не дает вам спокойно спать по ночам, то добро пожаловать к нам. Проведем аудит сайта , выявим ошибки и устраним их. Ведь в нашей сфере, как в университете: сначала владелец работает на сайт, а потом сайт платит владельцу золотой монетой. Или приходите к нам на комплексный контент-маркетинг, тарифы можно посмотреть .

  • изучения контекста написания сообщения
  • условия написания
  • позиции адресата, адресантов и сообщения
  • общественный резонанс
  • форму документа

Внутренний анализ:

  • изучает достоверность указанных данных
  • установки автора сообщения
  • цель написания документа
  • латентный смысл написанного, его подтекст

Достоинством качественного метода изучения текста служит глубина познания, высокая информативность. Недостатками метода являются субъективность исследования, отсутствие возможности статистического подтверждения гипотез. Сложность проведения – высокие требования к уровню подготовки специалистов.

При проведении качественного анализа текста исследователь должен обладать глубоким знанием социальных теорий, навыками проведения ретроспективного анализа, широким кругозором в изучаемой сфере, пониманием ограничений качественного метода для профессиональной интерпретации полученных результатов.

Пример

Отрывок из “Качественный контент-анализ представления категорий культуры в СМИ”

“В современном обществе постмодерна, где истина имеет относительную значимость, французский социолог Ж. Бодрияр выделил важный критерий, по которому проблемы, описанные в СМИ, существуют реально. Если же в СМИ не освещается какое-либо социальное явление или ситуация, то этой проблемы нет для общества. Средства массовой информации обладают возможностью влиять на социум через фокусирование общественного внимания, «манипуляцией сознанием».

КОНТЕНТ-АНАЛИЗ

(Из истории метода)

Контент-анализ (contents – англ.: содержание, содержимое)научный метод, предполагающий формализованное исследование содержания текстовых массивов в целях выявления и измерения, представленных в них социальных, культурных, ментальных особенностей. Контент-анализ применяется при изучении источников, инвариантных по структуре или существу содержания, но внешне бытующих, как несистематизированный, беспорядочно организованный текстовой массив. Суть контент-анализа, как исследовательского метода, состоит в восхождении от многообразия текстового материала к абстрактной модели содержания текста. В указанном смысле, контент-анализ является одной из номотетическихпроцедур, используемых в сфере применения идеографическихметодов.

Термин coпteпt-aпalysisвпервые начал применяться в конце XIX – нач. ХХ вв. в американской журналистике (см. работы Б. Мэттью, А. Тенни, Д. Спиид, Д. Уипкинс). У истоков методологии контент-анализа находились американский социолог г. Лассуэл и французский журналист Ж. Кайзер.

Так, в начале 60-х гг. г. Лассуэл осуществил попытку политологического анализа СМИ, исходя из учета формальных критериев. Он ввел в научный оборот некую абстрактную единицу: «слово». Целью работы Лассуэла было получение собственно социологического результата на нетипичном для социологии материале: текстах печатных изданий. Исследователь проделал огромную работу, но, поскольку в методике Лассуэла качественные оценки не были адекватно соотнесены с количественные методы, результаты его трудов с трудом поддавались верификации.

В начале 60-х гг. Ж. Кайзер разработал оригинальную методику статистического анализа периодики. В ее основе лежал подход к тестовому массиву, как информационной системе. Тем самым Кайзер сформулировал теоретическую базу последующего распространения социологических методов в сферы изучения всех нарративных источников, включая эпиграфический и эпистолярный материал.



В работе Ж. Кайзера акцентировалось внимание на внешней форме организации материала: его расположении, оглавлении, оформлении и т.д. Кайзер разработал целый комплекс исследовательских процедур, обеспечивающих полную формализацию, как единичного газетного номера, так и совокупности однотипных периодических изданий. Тем самым Ж.Кайзер сформулировал систему, позволяющую фиксировать развитие тенденций в публикациях СМИ.

Свое дальнейшее развитие «кайзеровское направление» методологии контент-анализа получило в работах Э. Морэн. Э. Морен ввела в научный оборот термин «единица информации» – семантический блок, содержание которого отвечает на вопрос: «О чем говориться?» Последнее обстоятельство сделало возможным изучение любых форм организации текстового материала, причем, как на терминологическом уровне, так и на уровне фразы, абзаца, статьи и даже целых книг. Тем самым, Э. Морэн разрушила критерий однородности, применявшийся ранее при статистической обработке нарративов. Взамен, она предложила идеологию «семантических групп», которые, по ее мнению, должны учитываться по тематическому признаку. Кроме того, Э.Морэн разработала концепцию «тоню> материала, который определялся социометрически: «положительная информация», «отрицательная», «нейтральная».

В отечественной историографии методика контент-анализа описывается, как совокупность (комплекс) исследовательских процедур, направленных от формирования абстрактного объекта исследования и формулирования его конкретных задач, до интерпретации результатов и их статистической обработки.

В источниковедческих исследованиях контент-анализ используется не менее трех десятков лет. Суть применения метода состоит в формализации источникового материала.

Адекватность любого источника есть, по существу, его потенция к субъективации. Абстрагирование в процессе формализации, опосредовано содержанием сознания исследователя и потому, с неизбежностью, также оказывается субъективацией. Отсюда, формализация источника, iп пatura, оказывается созданием нового источника, т.е. творческим актом.

В социологии контент-анализ позволяет отслеживать тенденции развития социальных процессов, с целью прогноза функционирования социальных систем или их компонентов. В источниковедении этот метод выступает средством фундирования суждений о содержании источников.

В отечественной историографии контент-анализ, как правило, применялся для выявления тенденций трансформации взглядов конкретных авторов во временном аспекте, либо при сравнении позиций различных авторов по одному и тому же вопросу.

В силу известных экономических, социальных и политических причин, с конца 90-х гг., методический арсенал исторической науки практически не пополнялся. Вот почему вопросы методологии контент-анализа как метода исторических исследований, и теперь сохраняют свою актуальность.

Описывая процедуру контент-анализа, можно выделить несколько этапов, а именно:

Начальный этап исследования: На этом этапе, как правило, формулируется т.н. «эмпирическая теория» исследования. То есть, в ходе подготовки к проведению контент-анализа, ученый, как правило, систематизирует гипотезы, существующие в контексте данной проблематики и «отсеивает» те из них, которые не поддаются верификации на данных обусловленного информационного массива.

Кроме того, на первом этапе такого исследования формируется идеология исследовательской программы. Иначе говоря, в этот момент формулируются философские (теоретические), предпосылки, определяются основные задачи исследования и, вытекающие из них, базовые правила процедуры, а также выявляется логическая последовательность операций по классификации всего корпуса существующих гипотез.

С методической точки зрения, именно на этом этапе происходит актуализация системного соотношение цели, объекта и средств исследования и определяется их оптимальная конфигурация в процессе предстоящей работы.

Операциональный этап исследования: На втором этапе исследования создается основа для верификации используемых дефиниций и терминов. Как правило, в этот момент в сплошном текстовом массиве выделяются относительно автономные части – «единицы контекста», релевантные, как содержанию всего текстового массива, так и общей совокупности сформулированных дефиниций и терминов.

При этом при выявлении латентной информации, представляется

целесообразным использовать двухэтапную методику Р.Л. Лебедева­Р.В.Рывкина (см.: Лебедев Р.Л., Рывкин Р.В. О двух функциях категорий вконтент-анализе // Методологические и методические проблемы контент­анализа. Тезисы рабочего совещания социологов. М.-Л., 1973, Вып.1., с 71), которая предполагает существование в тексте двух категорий анализа: категорий структурирования как средства извлечения латентной информации и категорий интерпретации, зависимых от первых.

Этап счета: На третьем этапе исследования проводится собственно контент-анализ. То есть, осуществляется сбор информации, учет индикаторов, первоначальная обработка результатов, включающая установление видов и содержания отношений связей между элементами счета (индикаторами контент-анализа). Причем, последнее – как внутри совокупности данных, так и по отношению к самой совокупности как целостной информационной системе.

На этом этапе, принципиальную важность обретает то обстоятельство, что полученные данные должны гарантировать временную, интерсубъективную и инструментальную стабильность исследования, а также в полной мере соответствовать (находится в контексте) его теоретическим посылкам.

В случаях, если полученные данные расходятся с теоретическими посылками, применение контент-аналитических процедур завершается, и исследование начинается с начала.

Остаточный анализ данных. На четвертом этапе осуществляется агрегирование (интерпретация числового материала в целях его обобщения), структуризация и группировка полученных данных для формирования адекватных моделей в контексте задач, поставленных на первом этапе исследования.

В целом, нужно сказать, что анализ полученного материала впрямую зависит от трех режимов восприятия информации: режима «настройки», режима восприятия основной и режима восприятия возвратной информации. Причем, если первые два режима важны на первом и втором этапах контент-анализа, то третий режим приобретает особое значение на четвертом этапе и оказывается полностью обусловленным качеством работ на этапах 1-3.

Отдельно следует остановиться на проблеме отбора источникового материала.

Для того, чтобы применение контент-анализа было успешным, источник должен отвечать определенным требованиям. То есть, прежде всего, при выборе источника нужно определить, в какой мере его содержание соответствует поставленной задаче. Необходимо также изучить все существующие источники по данной проблеме и, если понадобится, выявить оптимальный размер репрезентативной случайной выборки.

Обычно выделяют три уровня стратегии исследовательского поиска при обработке текстовых массивов: формулятивный, описательныйи экспериментальныйпланы. В исторических исследованиях чаще всего используют описательныйплан, целью которого является системное качественно – количественное описание источника.

Описательный план всегда содержит элементы экспериментального. Сбор информации в контексте данного плана осуществляется на основе тотального или выборочного обследования (с обязательными расчетами размеров допустимой выборки). Описательный план предполагает особую строгость интерпретации понятий и точность В регистрации данных. Исследование по описательному плану обычно завершается классификацией данных, характеризующих структуру объекта исследования. К сказанному следует добавить, что изначально, описательный план, как правило, готовится в виде наброска, который уточняется и дополняется по мере «вживания» историка в источниковый материал и при реализации последовательности процедурных шагов. Принципиальное значение для реализации описательного плана контент-анализа имеет технический инструментарий историка.

В заключениенеобходимо сказать, что контент-анализ является весьма продуктивным методом исторических исследований, позволяющим порой получать весьма неожиданные результаты при изучении, как отдельных нарративных источников, так и больших несистематизированных информационных массивов.

Пример использования КОНТЕНТ-АНАЛИЗА в исторической науке.

Архангельская И.Д. К вопросу изучения периодической печати методами контент-анализа / отв. Ред. Косс Б.М. // Методы количественного анализа текстов нарративных источников. – М., 1983. – С. 110-125.

И.Д. Архангельская в своей статье на материалах «Торгово-Промышленной газеты» предприняла опыт разработки методики источниковедческого изучения периодики. Хронологические рамки исследования – 1910–1914 гг.

Исследование носило характер эксперимента. Свою задачу автор видел в разработке общих принципов и технических приемов выявления информативных возможностей газеты, отборе и систематизации как определяющих, так и второстепенных проблем, классификации информации по типам, ее концентрации, т.е. формализации информации, подготовке ее к оцениванию. В итоге полученные результаты могут классифицироваться как предварительные. Предложенная автором методика является перспективной в плане предварительного анализа ежедневной газеты. Подобная обработка газетной информации рассматривается как необходимый подготовительный этап для использования контент-анализа. Метод ориентирует на теоретическое осмысление изучаемого объекта.

При разработке методики извлечения и обработки информации И.Д.Архангельская ограничивалась двумя основными структурными подразделениями – отделами: Передовые и Хроника. Передовые статьи являются лицом издания. Им присущ аналитический характер. Данные статьи являются концентрированным выражением информационно-справочного характера «Т. – П.Г.». Они, с одной стороны, питают отдел «Передовые» материалом (однако, чаще косвенно, чем прямо), а с другой – являются резервуаром различных мнений в ходе обсуждения какой-либо проблемы, отражением событий общественной жизни. В этом автор увидел их основную функцию. Особенности этих статей наложили отпечаток и на характер пометок «Ред.»

Автор разделил информацию на 3 группы: А – «сквозная», В – «механическая», С – «сплошная». Группа А охватывает период 1910-1911 гг. В рамках каждого года рассматривалась информация первой недели декабря. Группа В охватывает 1912 г. и 1914 г. Рассмотрению подвергался каждый 10-й номер газеты. Группа С на ограниченном временном отрезке – октябрь-декабрь 1913 г. Применяя выборочный метод, автор исходил из гипотезы, что, поскольку издание является ежедневным, массовым по своему типу и достаточно четко организованным, внутри него существуют основные акценты, которые могут быть выявлены посредством выборки, примененной на большом временном отрезке (1910-1914 гг.). Автор предполагал, что информация конца года носит преимущественно оценочный характер, аккумулируя нерешенные проблемы и выдвигая новые. Элементы формализации, заложенные уже в самом отборе газетного материала, получили свое дальнейшее развитие в его проблемной систематизации, классификации информации по типам, выявлении ее внутренних взаимосвязей. Работа велась в 4 этапа:

1. Составление предварительного перечня проблем

2. Накопление материала

3. Изучение внутренней организации источника, общая характеристика его структурных подразделений, выявление структурных взаимосвязей и распределение информационной нагрузки, введение первичной карточки учета информации и авторской карточки, формирование проблемной и авторской картотеки.

1. Систематизация и концентрация информации:

o Корректировка перечня проблем на основе содержательного анализа

o Обработка первичной карточки информации, уточнение проблематики, выявление внутренних и хронологических взаимосвязей, проблемно-сопоставительный анализ

2. Систематизация информации по типу и содержанию:

o Выявление ключевых элементов зафиксированной информации

o Определение типа информации

o Общая оценка содержания информации

o Проверка карточки на соответствие номерным индексом

3. Концентрация информации:

o Групповой уровень

o Межгрупповой уровень

1. Анализ информации во внутренних взаимосвязях

o Выявление главных проблемно-координационных центров и линий взаимосвязи между ними и внутри них

o Проблемно-комплексная характеристика источника

1. Оценка информации

o Выявление характерных черт издания с точки зрения его классовой направленности

o Проблемно-комплексный сравнительный анализ информации (с привлечением других изданий)

В качестве «организатора памяти» на первом этапе формализации автором предлагается первичная карточка учета информации, в которой зафиксированы следующие категории анализа:

где + – буквенный индекс группы, в рамках которой ведется исследование

Х – номерной индекс проблемы, к которой относится карточка

ХХ – номерной индекс проблемы, которая тесно связана с первой.

Карточками такого вида укомплектовывается проблемная картотека, указателем к которой является перечень проблем. Составляя перечень, автор брал сведения из рубрик газет, а также изучения литературы по вопросам истории экономической политики и экономического развития России

Особые требования в процессе формализовано-системного анализа необходимо предъявить к такой категории как «краткое содержание статьи». Именно эта категория оказывает определяющее влияние на процесс систематизации информации по типу и содержанию в рамках второго этапа формализации информации. Во-первых, необходимо строго сохранять структуру статьи как костяк мысли ее автора, а, во-вторых, точно выделять главные ее элементы. Картотека дала возможность частично снять «дублирующие» проблемы. Вместе с тем работа с ней показала, что интуитивный подход к комплектованию информации по проблемам нуждается в подкреплении более устойчивым и менее субъективными принципами. Здесь на помощь приходят методы контент-анализа.

Одновременно с проблемной происходило комплектование авторской картотеки, основой которой была карточка следующего вида:

где Х – год публикации

Отправным моментом второго этапа формализации информации является обработка первичной карточки учета информации. Приведем пример обработки первичной карточки:

Ключевые элементы зафиксированной информации:

– о невозможности угольных фирм Петербурга выполнить заказы в связи с английской забастовкой и об использовании запасов топлива владельцев пароходных судов; предложения: о закупке более дорогого германского угля, об использовании донецкого угля (не приняты);

– решение: ограничиться пока наличными запасами. Тип информации – экстренная. Оценка: 1. причина состоит в сильной зависимости России от поставки английского угля; 2. несмотря на экстренный характер собрания, решение не найдено. Вынесенное решение: «Крупным судовладельцам поддержать более мелких ввиду общности интересов навигации». В итоге:

a) Некоторые крупные судовладельцы отнюдь не бедствуют, несмотря на английскую забастовку;

b) Сама апелляция к «общности интересов навигации» звучит в подобных условиях капиталистической действительности как насмешка.

Номерной индекс 5 соответствует проблеме «Ввоз и вывоз сырья», а также готовой продукции». Номерной индекс (9) – сопряженной с ней проблеме, а именно «Кризис топлива (топливный «голод»)».

В результате проведенного эксперимента удалось, прежде всего, определить степень эффективности применения каждого из трех принципов выборки, выявить предварительные проблемно-информационные возможности источника и наметить внутренне линии взаимосвязи информации. Опыт показал, что применение к источнику «сквозного» принципа выборки обеспечило выход информации в 6 проблем, «механического» – в 10 , «сплошного» – в 23. Таким образом, налицо оказалось преимущество сплошного принципа изучения материала даже на ограниченном временном отрезке.

В результате проведенного сопоставительного анализа на межгрупповом уровне из всего комплекса проблем были выделены две, характеризующие в целом период 1910-1914 гг.:

1. Статьи по крупным проблемам экономического развития ведущих капиталистических государств: в т.ч. и России

2. Состояние финансов России, финансовые проблемы

Выделение дух проблемно-координационных центров, является объективным отражением наличия взаимосвязей аналитического информационного газетного материала и позволяет характеризовать «Т.-П.Г.» как комплексный источник. Однако выводы, полученные экспериментальным путем, требуют подтверждения более точными количественными методами.

Предложенная методика источниковедческого изучения периодики на примере «Торгово-Промышленной Газеты» призвана, во-первых, помочь историку получить самое общее представление о данном печатном органе. Во-вторых, переориентировать историка с иллюстративного на комплексный подход к решению конкретной проблемы по материалам периодической печати.

На этом мы завершаем наш «Задачник». Надеюсь, он поможет любому интересующемуся разобраться в учебном курсе «Применение математических методов в историческом исследовании». Желаю успеха на практических (лабораторных) занятиях и в дальнейшей работе.

СПИСОК ДОПОЛНИТЕЛЬНОЙ ЛИТЕРАТУРЫ:

1. Учебно-методическая литература

Информационные технологии для гуманитариев. – Москва-Саранск, 1998. – 215 с.

Количественные методы в исторических исследованиях. – М.: Высшая школа, 1984 – 384 с.

Компьютеризированный статистический анализ для историков. – М.: изд-во МГУ, 1999. – 186 с.

Федорова Н.А. Математические методы в историческом исследовании. – Казань, изд-во Форт-Диалог, 1996. – 110 с.

2. Специальная литература

2.2 Математические методы в социально-экономических и археологических исследованиях. – М.: Наука, 1981. – 415 с.

2.3 Миронов Б.Н. История в цифрах. – Л. : Наука, 1991.- 178 с.

2.4 Миронов Б.Н., Степанов З.В. Историк и математика. – М.: Наука – 165 с.

2.5 Миронов Б.Н. Историк и социология. – Л.: Наука. – 1984. – 175 с.

2.6 Славко Т.И. Математико-статистические методы в исторических исследованиях. – М.: Наука, 1981. – 158 с.

2.7 ЭВМ и математические методы в исторических исследованиях. М., 1993. – 204 с.

2.8 ЭВМ и математические методы в исторических исследованиях. – М., 1994. – 223 с.

Периодические издания

3.1 Информационный бюллетень ассоциации «История и компьютер»/ Издается с 1994 года.

3.2 Круг идей. Сборник статей участников периодических конференций ассоциации «История и компьютер»/ Издается с 1994 г.

Качественный контент-анализ стал бурно развиваться во второй половине XX в. на волне критики поверхностного анализа содержания без учета контекста, что свойственно количественным вариантам контент-анализа, в которых, для того чтобы сделать возможным квантификацию, используются весьма упрощенные формы понимания содержания . Более подробно о подходе Поттера и Уезерелл речь пойдет в параграфе, посвященном дискурс- анализу в психологии. На данном примере уже можно видеть, как работа с категориями встраивается в дискурс-аналитические техники анализа текстовых данных.

Пример

Представления предпринимателей о роли психолога в организации .

Для выявления представлений предпринимателей о роли психолога в организации с предпринимателями проводилось полу- структурированное интервью. При анализе данных интервью использовалась техника индуктивного выделения категорий и кодирования. В тексте выделялись все фрагменты, в которых речь шла о функциях психолога в организации по представлениям предпринимателей. Затем исследователи отдельно работали с каждым выделенным фрагментом. На стадии открытого кодирования выделялись пробные категории, которые затем сопоставлялись друг с другом на предмет их смыслового сходства/различия и возможности объединения их в рамках более крупной категории. В итоге были выделены три категории, описывающие различные функции психолога в организации: психолог как релаксатор и психотерапевт, психолог как «активизатор бизнес-процесса», психолог как профессиональный манипулятор.

  • В примере использованы материалы исследования Н. Капорской.
  • Исследование проводилось нами совместно с Т. Мисягиной.
  • Исследование проводилось нами совместно с Е. Комаровой.
Понравилась статья? Поделитесь ей