/  Базы данных: разнообразие мира – разнообразие моделей

Базы данных: разнообразие мира – разнообразие моделей

22.05.2025

Директор по развитию и цифровой трансформации РДТЕХ Евгений Осьминин рассказал о переосмыслении подхода к данным и их хранению, о недостатках реляционных БД и росте популярности нереляционных систем. Речь идет не об отказе от общепринятых моделей, а о преодолении их ограничений.  

КАК ВОЗНИКЛА КОНКУРЕНЦИЯ В МИРЕ СУБД

Реляционные базы данных в течение многих лет являлись стандартной моделью, обеспечивающей структурированное хранение данных, целостность, безопасность, широкие возможности интеграции, благодаря следованию определенным стандартам и протоколам, соответствие высоким требованиям безопасности и т.д. Это обеспечило абсолютное доминирование реляционной модели на рынке хранения данных, как за счет их использования ведущими мировыми вендорами такими как Oracle, Microsoft SQL, DB2 так и распространению в решениях с открытым исходным кодом, например, PostgreSQL, MySQL, которые, в свою очередь, также послужили основой для возникновения и развития ряда вендорских решений.

При этом подходы к архитектуре реляционных СУБД, сформировались еще в 70-х годах прошлого столетия и были ориентированы на поддержку компьютеризации документооборота, обусловили их архитектурные особенности, которые до настоящего времени остались практически неизменными – это хранение данных в строках, их индексирование, журналирование операций и т.д. Математическая теория отношений, лежащая в основе реляционной модели, обеспечивала строгую структуру и целостность данных.

В современном мире, бизнес вынужден более оперативно реагировать на изменения внешней среды, действовать в условиях неопределенности, при экспоненциально увеличивающимся количестве информации. Это привело к проявлению недостатков реляционных БД, связанных с масштабированием, гибкостью и обработкой неструктурированных данных, необходимостью учета финальной архитектуры системы на этапе проектирования, низкой производительностью на больших объемах данных и т.д. Данные факторы привели к росту популярности нереляционных систем управления базами данных, последователи и разработчики которых, стремились исправить указанные недостатки.

Конечно, лидеры разработки реляционных БД также стараются поддерживать конкурентоспособность своих продуктов, включая поддержку новых алгоритмов, в т.ч. с использованием искусственного интеллекта, интегрируют дополнительные инструменты масштабирования и резервирования на основе прогнозов возможных изменений и направлений развития. Все это существенно усложняет продукт, делает его более дорогим и ресурсоемким.

Интересно, что реляционная модель в середине прошлого века вытеснила сетевые и иерархические модели, поскольку они не удовлетворяли требованиям того времени. И реляционная модель, предложенная Эдгаром Коддом, обеспечивала высокую гибкость в проектировании баз данных и упрощала выполнение сложных запросов. В настоящее время изменившаяся внешняя среда требует большей гибкости в обработке данных, необходимости повышения оперативности их обработки, усложнения их структур и т.д., что ставит вопрос о возможностях других моделей в этих аспектах. И по прошествии 50 лет реляционные СУБД начинают испытывать конкуренцию со стороны нереляционных моделей.

КЛАССЫ НЕРЕЛЯЦИОННЫХ МОДЕЛЕЙ И ДРАЙВЕРЫ ИХ РАЗВИТИЯ

Современная история нереляционных СУБД (или NoSQL) началась с начала 2000-х годов в части поиска подходов к решению проблем, связанных с хранением и обработкой больших объемов данных, которые не всегда подходят для традиционных реляционных моделей.

В 2009 году появился термин "NoSQL" для обозначения систем, которые не следуют строго реляционной модели. Причем правильно интерпретировать данный термин не как "без SQL", а "не только SQL", поскольку, в основном ориентир был не на отказ от реляционных моделей, а преодоление их ограничений.

Нереляционные СУБД дифференцировались по классам, в зависимости от тех аспектов, которые были наиболее востребованы в различных ситуациях:

Документоориентрованные БД (MongoDB, CouchD) позволяют хранить данные в формате JSON и обеспечивать гибкость в их структуре,

Колоночные БД (Apache Cassandra, HBase) ориентированы на обработки больших объемов данных и обеспечивают высокую производительность при записи и чтении, что важно для технологий BigData,

Графовые БД (Neo4j и др.) ориентированы на работу с взаимосвязями между данными, что стало особенно актуально для соцмедиа и рекомендательных сервисов, БД «Ключ-значение» (Redis, Amazon DynamoDB) получили распространения за счет возможностей кэширования и т.д.

 Интерес к нереляционным моделям поддержало переосмысление подхода к самим данным и их хранению. Реляционная модель была ориентирована на задачу их сохранения и извлечения, при этом вопросы подготовки, очистки, структурирования, нормализации данных и т.д. отходили на второй план. Теперь главные приоритеты – оперативно принять решение, причем не только на основе данных, но и на основе информации и знаниях, вне зависимости от того, как они хранятся и какие модели при этом используются. Как правило, реляционные модели были так или иначе привязаны к предметной области или областям, предполагали параметризацию по объему, а современная среда требует снятие этих ограничений как по масштабам, так и предметным областям, и сферам деятельности.

 Кроме того, развитию нереляционных БД способствовали глобальные технологические тренды.

1. Потребность в интеграции на фоне увеличивающихся объемов данных привела к развитию мульти-модельных БД (ArangoDB, Couchbase), которые поддерживают несколько моделей данных и обеспечивают возможности использовать наиболее подходящую из них в рамках решения конкретной задачи.

2. Развитие облачных технологий в рамках тренда на оптимизацию затрат также стимулировало распространению нереляционных СУБД. Кроме того, возможности облачных систем хранения данных в части масштабирования органично вписались в динамично развивающуюся сферу e-commerce.

3. Развитие технологий искусственного интеллекта приводит к смещению акцентов с «данных» на «знания». Знания могут быть неструктурированными и содержать субъективные элементы, что требует от систем управления данными большей гибкости. Нереляционные базы данных, способные работать с неструктурированными данными, становятся важными инструментами для реализации таких задач, позволяя компаниям извлекать ценную информацию и принимать обоснованные решения.

4. Блокчейн-технологии являются важным драйвером развития нереляционных моделей, поскольку обеспечивают безопасность, защиту данных, масштабирование на принципиально новом эволюционном уровне.

5. Технологии BigData являются одним из драйверов развития нереляционых моделей, поскольку последние позволяют обрабатывать и анализировать большие объемы неструктурированных данных.

Таким образом, развитие нереляционных баз данных является ответом на современные вызовы и требования, связанные с обработкой и хранением данных. Глобальные технологические тренды, такие как интеграция данных, облачные технологии и Big Data, играют ключевую роль в формировании и эволюции этих систем, обеспечивая их актуальность и конкурентоспособность в быстро меняющемся мире технологий.

И, хотя, реляционные БД по-прежнему занимают и, очевидно, будут занимать в среднесрочной перспективе значительную долю ИТ-рынка, взгляд на реляционную модель как на эталон организации хранения данных претерпел изменения. Многие компании рассматривают альтернативные подходы к хранению данных, знаний, информации, а реляционные СУБД – как один из вариантов. Выбор той или иной модели все больше будет обуславливаться требованиями, бизнес-задачами, экономическими аспектами, рисками и т.д.

Опрос представителей компаний по использованию СУБД в бизнес-процессах

Нажимая на кнопку «Отправить», я соглашаюсь с правилами обработки моих персональных данных и политикой конфиденциальности компании