Изучение данных с помощью инструментов каталогизации
Инструменты каталогизации в Qlik Cloud помогают повысить эффективность работы с данными при соблюдении стандартов безопасности и соответствия. Доступ к критически важным бизнес-метаданным и возможность применять пользовательские теги и классификации имеют важное значение для аналитиков данных и бизнес-групп.
Администраторы данных могут проверять точность данных и оптимизировать их исследование путем присвоения и изменения бизнес-метаданных (имена, описания, теги и классификации). Пользователи бизнес-аналитики и разработчики приложений могут настраивать персонализированные теги, применять классификации и просматривать образцы набора данных и статистику профиля, чтобы убедиться, что наборы данных легко найти и они содержат нужную информацию.
Инструменты каталогизации особенно полезны для новых и существующих наборов данных, к которым у пользователя есть доступ в персональных и общих пространствах. В распоряжении пользователей имеются виды файлов данных, которые помогают им получить наблюдения и сделать выводы о данных. Пользователи видят, откуда данные поступили, какого они типа и как их можно лучше всего проанализировать и использовать. Эта информация помогает определить, следует ли создать новое приложение с данными или загрузить их в существующее приложение.
В центре активностиАналитика доступны для исследования данных и управления бизнес-метаданными следующие варианты Каталога:
- Обзор набора данных: в нем можно просмотреть бизнес-информацию и техническую информацию о наборе данных. сведения включают исходный тип файла, пространство, метки времени создания и изменения, количество полей и строк, данные о создателе и владельце, метрики использования, примененные теги и общие классификации данных. Полный список см. в разделе Управление метаданными набора данных.
- Присвоение тегов данным для улучшенного поиска: теги — это фильтруемые метатеги, которые помогают организовать и исследовать данные. Пользователи связывают теги, по которым можно вести поиск, для быстрого доступа и определения соответствующих ресурсов данных.
- Виды профилей данных и создание выборки данных: Каталог профилирует наборы данных с помощью статистики, такой как имя, тип данных, образцы значений, наиболее распространенные значения, частота значения и количество уникальных значений. Пользователи выбирают интересующую их статистику профиля, чтобы выявить тенденции и аномалии в данных. См. раздел Управление метаданными на уровне поля и профилирование данных для получения информации о визуализациях данных полей и списке доступной статистики профиля.
- Классификации набора данных: стандарты управления данными значительно различаются в зависимости от регионов и отраслей. На большинство процессов обработки данных так или иначе влияет необходимость защиты данных путем ограничения доступа. настраиваемые пользователем классификации, относящиеся к региональным и глобальным стандартам конфиденциальности и чувствительности данных, предоставляются для определения наборов данных с помощью пользовательских и отраслевых категорий. Дополнительную информацию см. в разделе Управление метаданными набора данных.
- Создание приложения из ваших данных: подход Qlik «сначала данные» предоставляет возможность загрузить файлы данных и получить представление о данных перед созданием приложения. Это ключевой элемент рабочего процесса от необработанных до готовых для анализа данных. См. раздел Создание приложения из данных для создания приложения из данных или раздел Добавление данных из загруженных файлов данных для загрузки файлов данных в существующее приложение.
- Просмотр происхождения данных: пользователь может вывести граф происхождения данных, на котором показаны источники приложений, наборы данных и другой аналитический контент. Для получения дополнительной информации см. Анализ происхождения в Аналитика.
- Просмотр анализа воздействия данных: можно просматривать выходные данные и проследить нисходящее воздействие приложений, наборов данных и другого аналитического контента в каталоге. Для получения дополнительной информации см. Интерпретация анализа воздействия в Аналитика.
Инструменты каталога Qlik Talend Cloud
Если есть лицензия Qlik Talend Cloud, в каталоге будут доступны дополнительные инструменты для работы с данными.
-
Качество данных
При просмотре набора данных или продукта данных можно получить представление о качестве содержащихся в них данных: от качества и новизны в целом до количества пустых или недействительных строк в каждом наборе данных. Для получения дополнительной информации см. Assessing data quality.
Примечание к информацииДля этого требуется Qlik Talend Cloud Enterprise. -
Продукты данных
Встроенная функция просмотра и использования продуктов данных, созданных и активированных в процессе интеграции данных. Просматривайте все подробные сведения, включая описание, назначение и контактную информацию для запросов, а также связанные документы и метрики качества. Для получения дополнительной информации см. Creating data products.
Примечание к информацииДля этого требуется Qlik Talend Cloud Enterprise. -
Публикация данных и графа происхождения из Talend Studio
Могут быть опубликованы наборы данных из заданий по интеграции данных из Talend Studio в Qlik Cloud, включая происхождение и анализ воздействия. Граф происхождения позволяет отслеживать происхождение данных, в том числе преобразования данных в направлении к оригинальному источнику (страница «Каталог Qlik Cloud»). Для получения дополнительной информации см. Публикация наборов данных и графа происхождения в Qlik Cloud.
Примечание к информацииТребуется Qlik Talend Cloud Premium или Qlik Talend Cloud Enterprise.