Резюме проекта реального хранилища данных

Большие данные

задний план

  1. Бизнес компании интегрирован, управление индикаторами хаотично, проблема несогласованности данных серьезна, а эффективность разработки и итерации индикаторов также относительно низкая;
  2. Меры: Провести сертификацию групповых индикаторов и заново разработать индикаторы данных;

До строительства

проблема, с которой мы сталкиваемся

  1. Показателей много, бизнес сложный, изменения быстрые;
  2. Людей мало и график плотный, если эффективность разработки повышается;
  3. Удовлетворение основных требований: согласованность данных, высокая эффективность разработки данных и быстрое реагирование, высокое понимание пользователем и эффективность использования;

отправная точка

  1. Ориентация на спрос с использованием размерного моделирования;

  2. Обратитесь к методологии OneData для разработки индикаторов и решите проблему согласованности индикаторов (синонимы, синонимы)

  3. Обратитесь к мышлению, определенному спецификацией OneModel (логическая таблица, физическая таблица), спроектируйте схему модели и решите проблемы стандартизации разработки, масштабируемости и эффективности разработки (интеллектуальное построение модели);

в разработке

1. Сортировка требований

  1. Разберитесь с определением показателей и рассчитайте логику;
  2. Разобраться в бизнесе и разобраться в бизнес-процессе;
  3. Разбирать индикаторы (атомарные индикаторы, производные индикаторы, составные индикаторы, периоды времени, бизнес-модификаторы);
  4. Выполнить спецификацию именования индикаторов (наименование индикатора, именование модификатора с учетом бизнеса) и написать словарь данных;

2. Планирование хранилища данных

  1. Иерархическое разделение данных;
  2. Субъект данных, подразделение бизнес-процессов;
  3. Разработка спецификации хранилища данных (спецификация именования таблиц данных, спецификация именования полей, спецификация зависимости от крови, спецификация структуры таблицы данных ...), создание продукта, автоматическое построение мышления (повышение эффективности разработки и управления)
  4. Таблица фактов, таблица этикеток для бизнеса, дизайн таблицы сводной модели приложения

3. Разработка и внедрение

  1. Эффективность разработки: стандартизация модели, интерфейс и компонентизация (согласованная структура таблиц, реализация многоуровневой синхронизации);
  2. Эффективность управления: разработка инструментов продукта (планирование хранилища данных, управление моделями, управление индикаторами, инструменты построения пакетов моделей)
  3. проверка данных

после строительства

  1. Мышление пользователя: данные видны, понятны и удобны для использования (технический документ по хранилищу данных, информационный документ по индикаторам, инструмент построения графиков индикаторов)
  2. Проблемы качества данных: целостность данных, точность, непротиворечивость
  3. Стандартный аудит данных: стандартный аудит, проверка зависимостей
  4. Управление жизненным циклом: управление правами, онлайн- и офлайн-управление
  5. Количественная оценка значения данных: анализ использования пользователями, анализ хранилища, анализ Чен Бена
  6. Исследование приложений данных: продукты данных, расширение возможностей на основе сценариев