UA-11904844-8

Некоторые вычисления и алгоритмы невозможно точно преобразовать в код SQL или встроить в определенную пользователем функцию в рамках данных базы. В этих случаях необходимо поместить данные в более традиционную аналитическую среду и применить к ним аналитический инструмент традиционным способом.

В течение достаточно длительного времени для решения таких задач использовались крупные серверы. Проблема в том, что по мере увеличения числа специалистов, проводящих анализ, растут количество и размеры серверов. Это связано с большими затратами, а аналитики все равно быстро перегружают доступные вычислительные мощности.

Грид-вычисления могут оптимизировать как стоимость, так и производительность. Данное понятие относится к категории «высокопроизводительных вычислений». Вместо одного высокопроизводительного сервера (или нескольких серверов) используется большое количество менее дорогих компьютеров. В данном случае не сервер распределяет свои вычислительные ресурсы между заданий, а задания распределяются по разным компьютерам и обрабатываются параллельно. Каждый из этих компьютеров может обладать только частью возможностей исходного сервера и обрабатывать только одно задание за один раз. А в совокупности компьютеры этой грид-сети обрабатывают большие объемы данных. Таким образом, грид-вычисления могут стать экономически эффективным механизмом для увеличения общей пропускной способности и мощности, а кроме того, дадут возможность организации распределять рабочую нагрузку, приоритезировать задания и обеспечивать высокую доступность для аналитической обработки.

Такая сеть позволяет специалистам относительно дешево и быстро масштабировать среду. Однако использование грид-сети не всегда имеет смысл. При обработке нескольких заданий, требующих большой вычислительной мощности, грид-сеть может не являться оптимальным выбором. Поскольку каждое задание приходится на одну машину, обработка больших заданий с помощью дешевых компьютеров может занять гораздо больше времени, чем при использовании более крупного сервера. Тем не менее, если большая организация нуждается в управлении множеством процессов, большинство которых небольшого и среднего размера, грид-сеть может предоставить огромные преимущества.

Последняя инновация в грид-средах — высокопроизводительные аналитические архитектуры, в которых различные компьютеры сети знают друг о друге и могут обмениваться информацией. Это позволяет очень быстро справляться с объемными заданиями, одновременно используя все ресурсы грид-сети, а также решает проблему, связанную с ограничением количества заданий, обрабатываемых одним компьютером сети. Этот вид грид-сетей подает большие надежды и, вероятно, со временем получит широкое распространение. На момент написания этой книги развивается новый вариант, при котором грид-сеть связана непосредственно с системой управления базой данных, что позволяет еще больше увеличить производительность грид-сети. Примером может служить Инфраструктура высокопроизводительной аналитики (High-Performance Analytics) компании SAS.

По мере того как развиваются сложные методы моделирования и такие способы, как товарное моделирование (об этом — в главе 6), продолжают набирать популярность, грид-сеть поможет эффективно справиться с дополнительными рабочими нагрузками, возникающими при моделировании.