Две трети российских предприятий, по данным аналитиков, все еще эксплуатируют иностранные системы управления базами данных. Эксперт по работе с технологиями Oracle и PostgreSQL с более чем 15-летним опытом, преподаватель Учебного центра РДТЕХ Светлана Ткаченко объяснила, почему так происходит и когда использование российских аналогов критически важно. В интервью в рамках проекта Database Technologies обсудили как трудности обучения администрированию СУБД, так и актуальные вопросы рынка – сближение функционала решений вендоров, их производительность, рост интереса к нишевому ПО.
– Светлана, типов СУБД становится все больше. Почему растет востребованность на рынке альтернативных, специализированных СУБД взамен классическим?
– СУБД общего назначения – это очень сложные программные комплексы, предназначенные для выполнения всей совокупности функций по созданию и эксплуатации баз данных. Специализированные же СУБД создаются в тех случаях, когда невозможно или нецелесообразно использовать СУБД общего назначения. К ним относятся и информационно-поисковые системы. Развитие интернета, увеличение объема хранимой и обрабатываемой информации приводит к необходимости использования таких специализированных систем для оптимизации способа хранения данных, формирования аналитических отчетов и т.д. И хотя доля их возрастает, документные и мультимодельные базы данных, которые относятся к специализированным СУБД, постепенно набирают популярность, СУБД общего назначения пока занимают наибольшую долю рынка.
– Как в условиях роста массивов данных повысить производительность и масштабируемость СУБД?
– Для наращивания возможностей БД есть целый набор стратегий. Самые распространенные — это горизонтальное и вертикальное масштабирование. Также может использоваться секционирование (бывает, как вертикальным, так и горизонтальным). Современные СУБД предлагают различные варианты масштабирования, например, СУБД PostgreSQL поддерживает возможность создания реплик, а также шардинг, опирающийся на необходимость использования дополнительных расширений (например, Citus). Еще один способ организовать шардинг – использовать родственные PostgreSQL технологии. Так, можно воспользоваться системой GreenPlum, в которой шардинг заложен в архитектуру. Таким образом, проблема повышения производительности и масштабируемости решаема для большинства задач, но выбор конкретного решения и правильная настройка системы критически важны для достижения оптимальной работы.