Услуги по созданию ссылок


Вы можете получить доступ к огромному количеству маркетинговых данных: от веб-аналитики и поведения клиентов до анализа конкурентов и использования продуктов.

Однако, если данные нечисты, вы не сможете по-настоящему использовать их ценность. Или, что еще хуже, вы можете направить свой маркетинг в неправильном направлении и увидеть уменьшающуюся отдачу.

Джеймс Хантстарший консультант Vivanti, говорит, что очистка и моделирование данных необходимы для извлечения ценности и получения знаний и мудрости из информации. В своем выступлении перед Конференция по маркетинговой аналитике и науке о данных, в нем подробно описывается, почему это необходимо, основы очистки данных, а также роль управления и наблюдаемости.

Что такое моделирование данных?

Модели данных преобразуют данные во что-то полезное, и вам необходимо разбираться в моделировании данных, чтобы понимать лучшие варианты очистки. Джеймс объясняет, что моделирование данных включает три части: аддитивную, контекстную и предметную.

Добавка означает, что вы позволяете машинам разобраться, как стандартизировать данные. Вы не «исправляете» данные вручную, например, переводя спорадические имена в нижний регистр в верхний регистр в электронной таблице. По сути, это будет означать уничтожение данных, потому что, как говорит Джеймс: «Как люди, мы очень плохо умеем делать одно и то же дважды. »

Контекст организует данные, чтобы рассказать историю. Вы не добавляете новую информацию; вы вменяете существующие данные. Например, контекст транзакции купли-продажи может включать маркетинговые электронные письма, которые видел покупатель, контент социальных сетей, с которыми покупатель взаимодействовал, и другие продукты, которые он просматривал.

Домен — это набор всех возможных значений данных для данного элемента. Это может быть качественным и количественным. Джеймс выделяет эти пять распространенных типов доменов:

  • Идентифицировать — уникальное значение, которое четко и незаметно идентифицирует кого-либо, например адрес электронной почты, номер социального страхования или идентификатор клиента.
  • Именительный падеж — дополнительная идентификационная информация, недостаточно надежная, чтобы стоять отдельно, например полное имя человека или название продукта.
  • Категорический — группировка по произвольным границам, например, по типу клиента или отрасли; часто используется для разделения когорт
  • Денежный — валюта, которую можно сравнивать, заказывать, агрегировать и дезагрегировать, например, общая сумма заказа или цена за единицу.
  • Временной — точка или период дат и времени, например дата регистрации, дата последней покупки или период действия программы лояльности.
ЧИТАТЬ   Юридические лица, разгласившие персональные данные, заплатят штраф до 15 миллионов рублей

Имея это фундаментальное понимание моделирования, вы готовы узнать больше об очистке данных.

Какие виды очистки данных существуют?

Джеймс подробно описывает три типа очистки данных: механическое и явное сопоставление, а также модели и правила:

С механическая очисткаданные очищаются без изменения смысла информации, например, путем нормализации регистра имен и удаления ненужных пробелов. «Это все, что я могу делать самостоятельно как инженер по обработке данных, и это никого не расстраивает», — говорит Джеймс. «Никто не говорит: «Ну, вы убрали пробелы из его имени, значит, он другой человек».

Явное сопоставление использует действие под названием «уменьшение мощности» для уменьшения количества уникальных значений, связанных с атрибутом. Он упрощает набор данных за счет группировки значений, сохраняя при этом соответствующую информацию. Этими наборами данных легче управлять, и они могут улучшить производительность модели.

Например, говорит Джеймс, возможно, поле статуса клиента начинается с двух значений: активное и неактивное. Со временем объем расширился и теперь включает приостановленные, ожидающие и перспективные варианты. Явная очистка сопоставления может изменить состояние клиента с «приостановлено» на «активное».

Уборка для модели и правила выявляет и исправляет несоответствия, неточности или ошибки в данных на основе идентифицируемых структур (т. е. шаблонов) и ограничений (т. е. правил).

Стандартные шаблоны включают такие данные, как адреса электронной почты, строки дат и номера телефонов. Отклонения от этой структуры указывают на то, что данные нуждаются в очистке.

Правила относятся к логическим условиям или ограничениям. Так, например, если денежные данные страхового полиса превышают максимальное значение, запись необходимо очистить.

Джеймс говорит, что вы также можете устанавливать правила и шаблоны для отображения пути клиента. Допустим, бренду все равно, сколько раз кто-то открывает и нажимает на свое электронное письмо. Вместо этого он занимается определением тех, кто, скорее всего, совершит покупку в рамках маркетинговой кампании по электронной почте. Для этой цели он может установить правила очистки данных.

Например, все отправленные электронные письма будут иметь пометку «E», а все клики будут помечены «C», а заказ будет распознаваться как «O». Эти правила группируют данные так, чтобы они были более полезны для бренда и его маркетинговых целей.

ЧИТАТЬ   Дефицит кадров в IT: как привлечь внимание идеального кандидата

Какова роль управления в очистке данных?

«Каждый раз, когда вы очищаете данные, вы принимаете решение. Вы решаете, что актуально; вы решаете, что важно. Вы сами решаете, что оставить, а что вывести на поверхность», — говорит Джеймс.

Вам следует документировать эти решения по очистке данных во внутреннем репозитории, например в электронной таблице, или использовать систему контроля версий, например, с открытым исходным кодом. Гит.

Каждое решение должно отвечать на эти четыре вопроса:

  • Какое решение было принято?
  • Когда это было сделано? Эта конкретная ссылка облегчает исторический анализ.
  • Кто принял решение?
  • Почему было принято такое решение? Полезно информировать о будущих действиях. Например, если решение было принято из-за обновления правительства, его, вероятно, невозможно отменить. Но если решение было принято потому, что команда данных посчитала, что это лучший путь, изменение курса все еще может быть жизнеспособным вариантом, говорит Джеймс.

Давайте вернемся к примеру свертывания полей статуса клиента, чтобы «приостановленный» статус был сгруппирован в «активные» клиенты. Вот как можно записать это решение:

«Клиенты с «приостановленным статусом» по-прежнему считаются активными по состоянию на 22 октября 2024 года. Решение было принято Джеймсом Хантом, поскольку картографический анализ показал, что поведение клиентов можно лучше оценить по их активному или неактивному статусу.

«Люди играют важную роль в процессе управления», — говорит Джеймс. Компьютерные алгоритмы могут предлагать шаги по очистке данных, но человек должен быть в курсе, чтобы просмотреть предложения и одобрить или отклонить их.

Что такое наблюдаемость?

Даже после того, как вы установите правила и шаблоны для обеспечения чистоты данных, некоторые данные не будут соответствовать этим параметрам. Вместо того, чтобы передавать эти данные или автоматически очищать их, вам следует обеспечить наблюдаемость, которая, по словам Джеймса, в 10 раз важнее управления.

Вызов метаданных в результате очистки данных может выглядеть так, как показано в примере от клиента Джеймса. Правила очистки данных устанавливают нижний предел размера политик для обнаружения неверных данных. Это хорошо работало около шести месяцев, пока в систему не поступил полис с меньшим лимитом, чем установлен в правилах.

ЧИТАТЬ   8 подготовительных шагов для улучшения встреч клиентов с местными предприятиями

Джеймс отметил эту запись, а затем спросил клиента: «Хотите, чтобы мы скорректировали лимит?» »Клиент сказал «да», и правило данных о нижнем пределе было обновлено.

«Мы выяснили это с помощью цикла наблюдения, сказав: «Вот как мы ожидаем, что данные будут выглядеть». Когда мы его чистили, оно не выглядело так. Нам было неудобно принимать это решение (без участия клиента). И именно это вам даст наблюдаемость», — говорит Джеймс.

Правильные методы наблюдения могут сэкономить вам часы, дни, недели, месяцы и многое другое, отмечает он.

Готовы ли вы продолжить очистку данных?

Теперь, когда вы узнали о моделировании, очистке, управлении и наблюдении данных, вы готовы применить это в своем маркетинге, если у вас есть:

  • Наборы данных, целостность которых не является неповрежденной или идеальной
  • Наборы данных с большим количеством уникальных значений (т. е. где уменьшение количества элементов может упростить обработку и анализ)

Где бы вы нашли эти данные? Это может происходить из множества источников, таких как:

  • CRM-платформы
  • Записи контактов с клиентами
  • Анкеты для клиентов и формы обратной связи
  • Ответы на опрос
  • Веб-аналитика
  • Поведение клиентов
  • Информация о продукте или платформе
  • Анализ конкурентов

Начните с тех, которые больше всего выиграют от одного или нескольких из трех типов очистки данных, надлежащего управления и наблюдаемости. Затем вы можете решить заручиться поддержкой групп данных вашей организации, которые помогут вам.

ПОДБРАННЫЙ ПОХОЖИЙ КОНТЕНТ:

Изображение на обложке: Джозеф Калиновский/Институт контент-маркетинга.



Source link