Поделиться через


Проектирование данных Databricks

Функции проектирования данных Databricks включают надежную среду для совместной работы между специалистами по обработке и анализу данных, инженерами и аналитиками. Задачи проектирования данных также являются основой решений машинного обучения Databricks.

Примечание.

Если вы являетесь аналитиком данных, который работает в основном с sql-запросами и инструментами бизнес-аналитики, вы можете использовать Databricks SQL.

Имя. Предназначение
Разностные динамические таблицы Узнайте, как создавать конвейеры данных для приема и преобразования с помощью Databricks Delta Live Tables.
Структурированная потоковая передача Сведения о потоковой передаче, добавочной и рабочей нагрузке в режиме реального времени, на основе структурированной потоковой передачи в Databricks.
Apache Spark Узнайте, как Apache Spark работает с Databricks и платформой Databricks.
Записные книжки Узнайте, что такое записная книжка Databricks и как использовать записные книжки и управлять ими для обработки, анализа и визуализации данных.
Работы Узнайте, как управлять рабочими процессами обработки данных, машинного обучения и анализа данных на платформе Databricks.
Работа с файлами Узнайте о вариантах работы с файлами в Databricks.
Папки Git Узнайте, как использовать Git для управления версиями записных книжек и других файлов для разработки в Databricks.
Библиотеки Узнайте, как сделать сторонний или пользовательский код доступным в Databricks с помощью библиотек. Узнайте о различных режимах установки библиотек в Databricks.
Миграция Узнайте, как перенести такие приложения данных, как задания ETL, корпоративные хранилища данных, машинное обучение, обработка и анализ данных в Databricks.
Оптимизация и производительность Узнайте об оптимизации и рекомендациях по производительности databricks.
DBFS Сведения о файловой системе Databricks (DBFS), распределенной файловой системе, подключенной к рабочей области Databricks и доступной в кластерах Databricks