UA-11904844-8

Выявление ценности новых источников данных

Один из лучших способов применения песочницы — постоянное выявление новых источников данных, которые следует добавить в организационные системы и процессы. Возможно, вы покупаете поток данных из социальных медиа или файл с демографическими данными или же получаете поток информации из нового источника больших данных. Как аналитики будут изучать эти новые данные и экспериментировать с ними?

Представьте себе, как нерационален был бы типичный подход использования новых данных до их исследования! Вам пришлось бы оправдать и описать проект для загрузки данных. После этого потребовалось бы разработать процессы извлечения, преобразования и загрузки данных (ETL), чтобы загрузить данные в систему. Необходимо было бы разработать, утвердить и реализовать модель данных. Затем все перечисленное пришлось бы протестировать. Через три-шесть месяцев процесс был бы запущен, а данные подготовлены к использованию. В этот момент анализ может показать, что эти данные не имеют большой ценности и вам не нужны. Сколько ресурсов было бы потрачено впустую на формальное добавление этих данных в систему!

Сначала опробуйте образец

Если люди не уверены, понравится ли им вкус мороженого, они его пробуют. Если вкус нравится, они заказывают целую порцию. Если нет, переходят к другому сорту. следуйте той же логике при работе с новыми источниками данных, особенно с источниками больших данных. Не покупайте целую порцию, если вы не уверены в том, что это именно то, что вам нужно. сначала поэкспериментируйте с данными в своей песочнице.

Чтобы избежать такого сценария, следует взять фрагмент новых данных, загрузить их в песочницу и протестировать. Если ожидания не оправдались, двигайтесь дальше! Если оправдались, можно начинать длительный и дорогостоящий процесс формального использования данных. Применить аналитическую песочницу для исследования и доказательства ценности новых источников данных значительно быстрее и дешевле, чем использовать традиционные способы.