UA-11904844-8

Гибридная песочница

Среда гибридной песочницы — это сочетание внутренней и внешней песочниц. Она позволяет аналитикам при необходимости использовать мощь производственной системы и гибкость внешней системы в целях глубокого анализа или решения задач, не являющихся дружественными для базы данных (рис. 5.4).

Гибридная песочница

Рис. 5.4. Гибридная песочница

Сильные стороны гибридной среды объединяют преимущества внутренних и внешних песочниц, а также гибкость в выборе подхода к анализу. При работе во внешней песочнице легко избежать воздействия на производственные процессы на стадии раннего тестирования. Когда приходит время для итогового тестирования и предварительного развертывания, можно использовать производственную песочницу. Среда MapReduce может дополнить гибридную песочницу путем поддержки как внутренней, так и внешней песочницы.

Другое преимущество проявляется, когда созданный аналитический процесс необходимо временно запустить в «псевдопроизводственном» режиме во время полного развертывания производственной системы. Такие процессы легко запустить из внутренней песочницы.

Слабые стороны гибридной среды включают недостатки обоих вариантов, но с некоторыми дополнениями. Одна из слабых сторон заключается в необходимости поддержания среды и внутренней, и внешней песочницы. В этом случае нужно поддерживать согласованность работы не только внешней песочницы и производственной среды, но и внешней песочницы и внутренней песочницы.

В каких случаях следует использовать тот или иной вариант песочницы? Необходимо определить конкретные виды задач, предназначенных для внешней и внутренней песочниц. Специалисты не могут произвольно использовать ту или иную среду. Команда аналитиков должна разработать рекомендации и придерживаться их.

Не переполняйте песочницу

В среду внешней песочницы следует копировать минимальный объем данных, необходимых для анализа. В песочнице должна размещаться только небольшая часть данных, хранящихся в производственной среде. со временем конкретные данные будут меняться в зависимости от текущих аналитических потребностей. создавать копии следует только в случае крайней необходимости.

Последний недостаток заключается в том, что могут потребоваться несколько двусторонних потоков данных; это усложнит работу. Данные, доступные для внутренней и внешней песочниц, должны быть согласованными. По мере разработки новых данных в одной из сред может потребоваться воспроизвести их в другой.