Проектирование данных Databricks
Функции проектирования данных Databricks включают надежную среду для совместной работы между специалистами по обработке и анализу данных, инженерами и аналитиками. Задачи проектирования данных также являются основой решений машинного обучения Databricks.
Примечание.
Если вы являетесь аналитиком данных, который работает в основном с sql-запросами и инструментами бизнес-аналитики, вы можете использовать Databricks SQL.
Имя. | Предназначение |
---|---|
Разностные динамические таблицы | Узнайте, как создавать конвейеры данных для приема и преобразования с помощью Databricks Delta Live Tables. |
Структурированная потоковая передача | Сведения о потоковой передаче, добавочной и рабочей нагрузке в режиме реального времени, на основе структурированной потоковой передачи в Databricks. |
Apache Spark | Узнайте, как Apache Spark работает с Databricks и платформой Databricks. |
Записные книжки | Узнайте, что такое записная книжка Databricks и как использовать записные книжки и управлять ими для обработки, анализа и визуализации данных. |
Работы | Узнайте, как управлять рабочими процессами обработки данных, машинного обучения и анализа данных на платформе Databricks. |
Работа с файлами | Узнайте о вариантах работы с файлами в Databricks. |
Папки Git | Узнайте, как использовать Git для управления версиями записных книжек и других файлов для разработки в Databricks. |
Библиотеки | Узнайте, как сделать сторонний или пользовательский код доступным в Databricks с помощью библиотек. Узнайте о различных режимах установки библиотек в Databricks. |
Миграция | Узнайте, как перенести такие приложения данных, как задания ETL, корпоративные хранилища данных, машинное обучение, обработка и анализ данных в Databricks. |
Оптимизация и производительность | Узнайте об оптимизации и рекомендациях по производительности databricks. |
DBFS | Сведения о файловой системе Databricks (DBFS), распределенной файловой системе, подключенной к рабочей области Databricks и доступной в кластерах Databricks |