Модели Службы Azure OpenAI
Служба Azure OpenAI работает на платформе разнообразного набора моделей с разными возможностями и ценовыми категориями. Доступность модели зависит от региона и облака. Сведения о доступности модели Azure для государственных организаций см. в Azure для государственных организаций службе OpenAI.
Модели | Description |
---|---|
GPT-4o & GPT-4o mini & GPT-4 Turbo | Последние модели Azure OpenAI с многомодальными версиями, которые могут принимать как текст, так и изображения в качестве входных данных. |
GPT-4 | Набор моделей, которые улучшают GPT-3.5 и могут понимать и создавать естественный язык и код. |
GPT-3.5 | Набор моделей, которые улучшают GPT-3 и могут понимать и создавать естественный язык и код. |
Внедрение | Набор моделей, способных преобразовывать текст в числовую векторную форму для обеспечения сходства текстов. |
DALL-E | Серия моделей, которые могут создавать исходные изображения на естественном языке. |
Шептать | Серия моделей в предварительной версии, которая может транскрибировать и переводить речь в текст. |
Текст для речи (предварительная версия) | Серия моделей в предварительной версии, которая может синтезировать текст для речи. |
Площадка раннего доступа (предварительная версия)
6 августа 2024 года OpenAI объявила о последней версии своей флагманской модели 2024-08-06
GPT-4o. GPT-4o 2024-08-06
имеет все возможности предыдущей версии, а также:
- Улучшенная возможность поддержки сложных структурированных выходных данных.
- Максимальное число выходных маркеров увеличилось с 4096 до 16 384.
Клиенты Azure могут протестировать GPT-4o 2024-08-06
сегодня в новой игровой площадке ai Studio раннего доступа (предварительная версия).
В отличие от предыдущей площадки раннего доступа, платформа раннего доступа AI Studio (предварительная версия) не требует наличия ресурса в определенном регионе.
Примечание.
Запросы и завершения, сделанные с помощью начальной площадки доступа (предварительная версия), могут обрабатываться в любом регионе Azure OpenAI и в настоящее время подвергаются 10 запросам в минуту на ограничение подписки Azure. Этот лимит может измениться в будущем.
Мониторинг злоупотреблений службОй Azure OpenAI включен для всех пользователей начальной площадки доступа, даже если оно утверждено для изменения; Фильтры содержимого по умолчанию включены и не могут быть изменены.
Чтобы протестировать GPT-4o 2024-08-06
, войдите на тестовую площадку раннего доступа Azure AI (предварительная версия) с помощью этой ссылки.
GPT-4o и GPT-4 Turbo
GPT-4o интегрирует текст и изображения в одну модель, что позволяет одновременно обрабатывать несколько типов данных. Этот многомодальный подход повышает точность и скорость реагирования на взаимодействие с компьютером. GPT-4o соответствует GPT-4 Turbo в английском тексте и задачах программирования, обеспечивая более высокую производительность на языках, отличных от английского языка и задач визуального зрения, устанавливая новые тесты для возможностей искусственного интеллекта.
Разделы справки доступ к моделям GPT-4o и GPT-4o mini?
GPT-4o и GPT-4o mini доступны для стандартного и глобального развертывания модели.
Необходимо создать или использовать существующий ресурс в поддерживаемом стандартном или глобальном стандартном регионе, где доступна модель.
При создании ресурса можно развернуть модели GPT-4o. Если выполняется программное развертывание, имена моделей :
gpt-4o
, версия2024-05-13
gpt-4o-mini
Версия2024-07-18
GPT-4 Turbo
GPT-4 Turbo — это большая многомодальная модель (прием ввода текста или изображения и создание текста), которая может решить сложные проблемы с большей точностью, чем любая из предыдущих моделей OpenAI. Как и GPT-3.5 Turbo, и более старые модели GPT-4 GPT-4 Turbo оптимизированы для чата и хорошо работают для традиционных задач завершения.
Последний выпуск GPT-4 Turbo:
gpt-4
Версия:turbo-2024-04-09
Это замена для следующих моделей предварительной версии:
gpt-4
Версия:1106-Preview
gpt-4
Версия:0125-Preview
gpt-4
Версия:vision-preview
Различия между моделями OpenAI и Azure OpenAI GPT-4 Turbo GA
- Версия OpenAI последней
0409
модели turbo поддерживает режим JSON и функцию, вызывая для всех запросов вывода. - Версия Azure OpenAI последней
turbo-2024-04-09
в настоящее время не поддерживает использование режима JSON и вызова функций при выполнении запросов вывода с входными данными изображения (визуального зрения). Текстовые входные запросы (запросы безimage_url
встроенных изображений) поддерживают режим JSON и вызов функции.
Различия от gpt-4 vision-preview
- Интеграция СИИ с GPT-4 Turbo с Vision не поддерживается для
gpt-4
версии:turbo-2024-04-09
К ним относятся оптическое распознавание символов (OCR), заземление объектов, запросы видео и улучшенная обработка данных с помощью изображений.
GPT-4 Turbo подготовленная управляемая доступность
gpt-4
Версия:turbo-2024-04-09
доступен как для стандартных, так и подготовленных развертываний. В настоящее время подготовленная версия этой модели не поддерживает запросы на вывод изображений и визуального зрения. Подготовленные развертывания этой модели принимают только текстовые входные данные. Развертывания стандартной модели принимают как текстовые, так и запросы вывода изображений и визуального распознавания.
Доступность по регионам
Сведения о региональной доступности модели см. в матрице модели для стандартных и подготовленных развертываний.
Развертывание GPT-4 Turbo с помощью общедоступной версии vision
Чтобы развернуть модель общедоступной версии из пользовательского интерфейса Студии, выберите GPT-4
и выберите turbo-2024-04-09
версию из раскрывающегося меню. Квота по умолчанию для gpt-4-turbo-2024-04-09
модели будет совпадать с текущей квотой для GPT-4-Turbo. См. ограничения региональной квоты.
GPT-4
GPT-4 является предшественником GPT-4 Turbo. Обе модели GPT-4 и GPT-4 Turbo имеют базовое имя gpt-4
модели. Вы можете различать модели GPT-4 и Turbo, изучая версию модели.
gpt-4
Версия0314
gpt-4
Версия0613
gpt-4-32k
Версия0613
Вы можете увидеть длину контекста маркера, поддерживаемую каждой моделью в сводной таблице модели.
Модели GPT-4 и GPT-4 Turbo
- Эти модели можно использовать только с API завершения чата.
Ознакомьтесь с версиями моделей, чтобы узнать, как Служба Azure OpenAI обрабатывает обновления версий модели и работает с моделями , чтобы узнать, как просматривать и настраивать параметры версии модели развертываний GPT-4.
Model ID | Description | Максимальный запрос (токены) | Учебные данные (до) |
---|---|---|---|
gpt-4o-mini (2024-07-18) GPT-4o mini |
Последняя модель небольшой общедоступной версии — Быстрая, недорогая модель с поддержкой идеально подходит для замены моделей серии GPT-3.5 Turbo. — Текст, обработка изображений — режим JSON — параллельные вызовы функций |
Входные данные: 128 000 Выходные данные: 16 384 |
Октябрь 2023 г. |
gpt-4o (2024-05-13) GPT-4o (Omni) |
Последняя модель большой общедоступной версии — Текст, обработка изображений — режим JSON — параллельные вызовы функций — улучшенная точность и скорость реагирования — Четность с английским текстом и задачами кодирования по сравнению с GPT-4 Turbo с vision — высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения |
Входные данные: 128 000 Выходные данные: 4096 |
Октябрь 2023 г. |
gpt-4 (turbo-2024-04-09) GPT-4 Turbo с vision |
Новая модель общедоступной версии — замена всех предыдущих моделей vision-preview GPT-4 (, 1106-Preview , 0125-Preview ). - Доступность компонентов в настоящее время отличается в зависимости от метода ввода и типа развертывания. |
Входные данные: 128 000 Выходные данные: 4096 |
Декабрь 2023 г. |
gpt-4 (0125-Preview)*GPT-4 Turbo Preview |
Предварительная версия модели -Заменяет 1106-Preview — повышение производительности создания кода — уменьшает случаи, когда модель не завершает задачу — режим JSON — параллельные вызовы функций — воспроизводимые выходные данные (предварительная версия) |
Входные данные: 128 000 Выходные данные: 4096 |
Декабрь 2023 г. |
gpt-4 (визуально-предварительная версия)GPT-4 Turbo с предварительным просмотром визуального зрения |
Предварительная версия модели — принимает входные данные текста и изображения. — поддерживает улучшения — режим JSON — параллельные вызовы функций — воспроизводимые выходные данные (предварительная версия) |
Входные данные: 128 000 Выходные данные: 4096 |
Апрель 2023 г. |
gpt-4 (1106-preview)GPT-4 Turbo Preview |
Предварительная версия модели — режим JSON — параллельные вызовы функций — воспроизводимые выходные данные (предварительная версия) |
Входные данные: 128 000 Выходные данные: 4096 |
Апрель 2023 г. |
gpt-4-32k (0613) |
Старая модель общедоступной версии — Базовый вызов функции с инструментами |
32,768 | Сентябрь 2021 г. |
gpt-4 (0613) |
Старая модель общедоступной версии — Базовый вызов функции с инструментами |
8,192 | Сентябрь 2021 г. |
gpt-4-32k (0314) |
Старая модель общедоступной версии - Сведения о прекращении поддержки |
32,768 | Сентябрь 2021 г. |
gpt-4 (0314) |
Старая модель общедоступной версии - Сведения о прекращении поддержки |
8,192 | Сентябрь 2021 г. |
Внимание
Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания моделей предварительной версии до будущих версий предварительной версии или до последней стабильной или общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели Azure OpenAI.
- GPT-4 версии 0125-preview — это обновленная версия предварительной версии GPT-4 Turbo, выпущенная ранее в качестве версии 1106-preview.
- GPT-4 версии 0125-preview завершает такие задачи, как создание кода более полно по сравнению с gpt-4-1106-preview. Из-за этого в зависимости от задачи клиенты могут обнаружить, что GPT-4-0125-preview создает больше выходных данных по сравнению с gpt-4-1106-preview. Мы рекомендуем клиентам сравнивать выходные данные новой модели. GPT-4-0125-preview также устраняет ошибки в gpt-4-1106-preview с обработкой UTF-8 для языков, отличных от английского языка.
- GPT-4 — это последняя версия общедоступной версии
turbo-2024-04-09
и заменяет ,1106-preview
аvision-preview
также0125-Preview
.
Внимание
gpt-4
версии 1106-Preview, 0125-Preview и vision-preview будут обновлены с стабильной версиейgpt-4
в будущем. Развертывания версийgpt-4
1106-Preview, 0125-Preview и vision-preview, для которых задано значение "Автоматическое обновление по умолчанию" и "Обновление по истечении срока действия", начнет обновляться после выпуска стабильной версии. Для каждого развертывания обновление версии модели происходит без прерывания работы службы вызовов API. Обновления выполняются по регионам, а процесс полного обновления, как ожидается, займет 2 недели. Развертывания версий 1106-Preview, 0125-Preview и предварительной версии визуального представления, равные "Без автоматическойgpt-4
оценки", не будут обновлены и перестают работать при обновлении предварительной версии в регионе. Дополнительные сведения о времени обновления см. в статье об отмене использования модели OpenAI в Azure OpenAI.
GPT-3.5
Модели GPT-3.5 могут понять и создать естественный язык или код. Наиболее эффективной и экономичной моделью в семействе GPT-3.5 является GPT-3.5 Turbo, которая оптимизирована для чата и хорошо работает для традиционных задач завершения, а также. GPT-3.5 Turbo доступен для использования с API завершения чата. Служба GPT-3.5 Turbo Instruct имеет аналогичные возможности использования text-davinci-003
API завершения вместо API завершения чата. Мы рекомендуем использовать GPT-3.5 Turbo и GPT-3.5 Turbo Instruct над устаревшими моделями GPT-3.5 и GPT-3.
Model ID | Description | Максимальный запрос (токены) | Учебные данные (до) |
---|---|---|---|
gpt-35-turbo (0125) NEW |
Последняя модель общедоступной версии — режим JSON — параллельные вызовы функций — воспроизводимые выходные данные (предварительная версия) — более высокая точность при реагировании в запрошенных форматах. — Исправлена ошибка, из-за которой возникла проблема с кодировкой текста для вызовов функций, отличных от английского языка. |
Входные данные: 16 385 Выходные данные: 4096 |
Сентябрь 2021 г. |
gpt-35-turbo (1106) |
Старая модель общедоступной версии — режим JSON — параллельные вызовы функций — воспроизводимые выходные данные (предварительная версия) |
Входные данные: 16 385 Выходные данные: 4096 |
Сентябрь 2021 г. |
gpt-35-turbo-instruct (0914) |
Только конечная точка завершения — замена устаревших моделей завершения |
4,097 | Сентябрь 2021 г. |
gpt-35-turbo-16k (0613) |
Старая модель общедоступной версии — Базовый вызов функции с инструментами |
16,384 | Сентябрь 2021 г. |
gpt-35-turbo (0613) |
Старая модель общедоступной версии — Базовый вызов функции с инструментами |
4096 | Сентябрь 2021 г. |
gpt-35-turbo 1 (0301) |
Старая модель общедоступной версии - Сведения о прекращении поддержки |
4096 | Сентябрь 2021 г. |
Дополнительные сведения о взаимодействии с GPT-3.5 Turbo и API завершения чата см . в подробном руководстве.
1 Эта модель будет принимать запросы > 4096 токенов. Не рекомендуется превышать ограничение на 4096 входных маркеров, так как более новая версия модели ограничена 4096 токенами. Если возникают проблемы при превышении 4096 входных маркеров с этой моделью, эта конфигурация официально не поддерживается.
Внедрение
text-embedding-3-large
является последней и самой способной моделью внедрения. Обновление между моделями внедрения невозможно. Для перехода от использования text-embedding-ada-002
text-embedding-3-large
к вам потребуется создать новые внедрения.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
При тестировании OpenAI сообщает как о больших, так и небольших моделях внедрения третьего поколения, что обеспечивает более высокую производительность многоязычного извлечения с помощью теста MIRACL , сохраняя производительность для английских задач с помощью теста MTEB .
Тест оценки | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
Среднее значение MIRACL | 31,4 | 44.0 | 54.9 |
Среднее значение MTEB | 61,0 | 62,3 | 64.6 |
Модели внедрения третьего поколения поддерживают уменьшение размера внедрения с помощью нового dimensions
параметра. Как правило, более крупные внедрения являются более дорогими с точки зрения вычислений, памяти и хранилища. Возможность настроить количество измерений позволяет более контролировать общую стоимость и производительность. Параметр dimensions
не поддерживается во всех версиях библиотеки Python OpenAI 1.x, чтобы воспользоваться этим параметром, рекомендуется обновить до последней версии: pip install openai --upgrade
Тестирование тестов mtEB в OpenAI показало, что даже если размеры модели третьего поколения снижаются до менее text-embeddings-ada-002
1536 измерений производительности, остается немного лучше.
DALL-E
Модели DALL-E создают изображения из текстовых запросов, которые предоставляет пользователь. DALL-E 3 обычно доступен для использования с ИНТЕРФЕЙСами REST API. DALL-E 2 и DALL-E 3 с клиентскими пакетами SDK находятся в предварительной версии.
Шептать
Модели Whisper можно использовать для преобразования речи в текст.
Вы также можете использовать модель Whisper с помощью API пакетной транскрибирования службы распознавания речи Azure. Ознакомьтесь с тем, что такое модель Whisper? Чтобы узнать больше об использовании службы "Речь ИИ Azure" и "Служба OpenAI Azure".
Текст для речи (предварительная версия)
Текст OpenAI для моделей речи, в настоящее время в предварительной версии, можно использовать для синтеза текста для речи.
Вы также можете использовать текст OpenAI для речевых голосов с помощью службы "Речь ИИ Azure". Дополнительные сведения см. в статье OpenAI text to speech voices via Azure OpenAI Service or via Azure AI Speech guide.
Сводная таблица модели и доступность региона
Примечание.
В этой статье рассматривается доступность модели или региона, которая применяется ко всем клиентам Azure OpenAI с типами развертывания standard. Некоторые клиенты имеют доступ к сочетаниям моделей и регионов, которые не перечислены в единой таблице ниже. Дополнительные сведения о подготовленных развертываниях см. в нашем руководстве по подготовке.
Доступность модели развертывания уровня "Стандартный"
Регион | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4, turbo-2024-04-09 | gpt-4o, 2024-05-13 | gpt-4o-mini, 2024-07-18 | gpt-4-32k, 0613 | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 | gpt-35-turbo-instruct, 0914 | text-embedding-ada-002, 1 | text-embedding-ada-002, 2 | text-embedding-3-small, 1 | text-embedding-3-large, 1 | dall-e-2, 2.0 | dall-e-3, 3.0 | babbage-002, 1 | davinci-002, 1 | tts, 001 | tts-hd, 001 | шепет, 001 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | - | - | - | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | ✅ | - | - | - | - | - |
brazilsouth | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
canadaeast | ✅ | ✅ | - | - | - | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
eastus | - | - | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - |
eastus2 | - | ✅ | - | - | ✅ | ✅ | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ |
francecentral | ✅ | ✅ | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
japaneast | - | - | - | ✅ | - | - | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
northcentralus | - | - | ✅ | - | ✅ | ✅ | - | - | - | ✅ | - | ✅ | ✅ | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ |
norwayeast | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | ✅ |
southafricanorth | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
southcentralus | - | - | ✅ | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
southindia | - | ✅ | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | - | ✅ | - | - | - | - | - | - | ✅ |
swedencentral | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | - | - | ✅ | - | - | - | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - | - |
uksouth | - | ✅ | ✅ | - | - | - | - | - | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | ✅ |
westus | - | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
westus3 | - | ✅ | - | - | ✅ | ✅ | - | - | - | - | - | - | - | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
Эта таблица не включает региональную доступность глобальной стандартной модели для GPT-4o или подробные сведения о доступности регионов. Ознакомьтесь с выделенным разделом глобального стандартного развертывания и разделом тонкой настройки этой информации.
Квота модели развертывания уровня "Стандартный" и "Стандартный"
Область/регион | GPT-4 | GPT-4-32K | GPT-4-Turbo | GPT-4-Turbo-V | gpt-4o | gpt-4o-mini | GPT-35-Turbo | GPT-35-Turbo-Instruct | gpt-4o — GlobalStandard | gpt-4o-mini - GlobalStandard | GPT-4-Turbo — GlobalStandard | GPT-4o — global-Batch | GPT-4o-mini - Global-Batch | GPT-4 — глобальная пакетная служба | GPT-4-Turbo — глобальная пакетная служба | gpt-35-turbo - Global-Batch | Text-Embedding-Ada-002 | text-embedding-3-small | text-embedding-3-large | GPT-4o - finetune | GPT-4o-mini - finetune | GPT-4 — finetune | Babbage-002 | Babbage-002 - finetune | Davinci-002 | Davinci-002 - finetune | GPT-35-Turbo - finetune | GPT-35-Turbo-1106 - finetune | GPT-35-Turbo-0125 - finetune |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | 40 тыс. | 80 K | 80 K | 30 K | - | - | 300 K | - | 30 М | - | 2 млн | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - | - | - | - |
brazilsouth | - | - | - | - | - | - | - | - | 30 М | - | 2 млн | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - | - | - | - |
canadaeast | 40 тыс. | 80 K | 80 K | - | - | - | 300 K | - | 30 М | - | 2 млн | - | - | - | - | - | 350 K | 350 K | 350 K | - | - | - | - | - | - | - | - | - | - |
eastus | - | - | 80 K | - | 1 млн | 2 млн | 240 K | 240 K | 30 М | 50 М | 2 млн | 5 B | 5 B | 150 М | 300 М | 10 B | 240 K | 350 K | 350 K | - | - | - | - | - | - | - | - | - | - |
eastus2 | - | - | 80 K | - | 1 млн | - | 300 K | - | 30 М | - | 2 млн | - | - | - | - | - | 350 K | 350 K | 350 K | - | - | - | - | - | - | - | 250 K | 250 K | 250 K |
francecentral | 20 тыс. | 60 K | 80 K | - | - | - | 240 K | - | 30 М | - | 2 млн | - | - | - | - | - | 240 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
germanywestcentral | - | - | - | - | - | - | - | - | 30 М | - | 2 млн | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
japaneast | - | - | - | 30 K | - | - | 300 K | - | 30 М | - | 2 млн | - | - | - | - | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
koreacentral | - | - | - | - | - | - | - | - | 30 М | - | 2 млн | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
northcentralus | - | - | 80 K | - | 1 млн | - | 300 K | - | 30 М | - | 2 млн | - | - | - | - | - | 350 K | - | - | 100 тыс. | 100 тыс. | 100 тыс. | 240 K | 250 K | 240 K | 250 K | 250 K | 250 K | 250 K |
norwayeast | - | - | 150 K | - | - | - | - | - | 30 М | - | 2 млн | - | - | - | - | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
польшацентральная | - | - | - | - | - | - | - | - | 30 М | - | 2 млн | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
southafricanorth | - | - | - | - | - | - | - | - | 30 М | - | 2 млн | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - | - | - | - |
southcentralus | - | - | 80 K | - | 1 млн | - | 240 K | - | 30 М | - | 2 млн | - | - | - | - | - | 240 K | - | - | - | - | - | - | - | - | - | - | - | - |
southindia | - | - | 150 K | - | - | - | 300 K | - | 30 М | - | 2 млн | - | - | - | - | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
swedencentral | 40 тыс. | 80 K | 150 K | 30 K | 1 млн | 2 млн | 300 K | 240 K | 30 М | 50 М | 2 млн | 5 B | 5 B | 150 М | 300 М | 10 B | 350 K | - | 350 K | 100 тыс. | 100 тыс. | 100 тыс. | 240 K | 250 K | 240 K | 250 K | 250 K | 250 K | 250 K |
switzerlandnorth | 40 тыс. | 80 K | - | 30 K | - | - | 300 K | - | 30 М | - | 2 млн | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - | - | - | - |
switzerlandwest | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 250 K | - | 250 K | 250 K | 250 K | 250 K |
uksouth | - | - | 80 K | - | - | - | 240 K | - | 30 М | - | 2 млн | - | - | - | - | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | - | 240 K | - | 30 М | - | 2 млн | - | - | - | - | - | 240 K | - | - | - | - | - | - | - | - | - | - | - | - |
westus | - | - | 80 K | 30 K | 1 млн | - | 300 K | - | 30 М | - | 2 млн | 5 B | 5 B | 150 М | 300 М | 10 B | 350 K | - | - | - | - | - | - | - | - | - | - | - | - |
westus3 | - | - | 80 K | - | 1 млн | - | - | - | 30 М | - | 2 млн | - | - | - | - | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
Доступность подготовленной модели развертывания
Регион | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, turbo-2024-04-09 | gpt-4o, 2024-05-13 | gpt-4o-mini, 2024-07-18 | gpt-4-32k, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 |
---|---|---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
brazilsouth | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | ✅ | - |
canadacentral | ✅ | - | - | - | - | - | ✅ | - | ✅ |
canadaeast | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | - |
eastus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
francecentral | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ |
germanywestcentral | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | - |
japaneast | - | ✅ | ✅ | ✅ | ✅ | - | - | - | ✅ |
koreacentral | ✅ | - | - | ✅ | ✅ | - | ✅ | ✅ | - |
northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
norwayeast | ✅ | - | ✅ | - | - | - | ✅ | - | - |
польшацентральная | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ |
southafricanorth | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | - |
southcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
southindia | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | ✅ | ✅ |
swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
switzerlandwest | - | - | - | - | - | - | - | - | ✅ |
uksouth | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
westus | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
Примечание.
Подготовленная версия версии gpt-4
: turbo-2024-04-09
в настоящее время ограничена только текстом.
Разделы справки получить доступ к подготовленным?
Чтобы получить подготовленную пропускную способность, необходимо поговорить с группой по продажам и учетной записи Майкрософт. Если у вас нет команды по продажам и учетной записи, к сожалению, вы не можете приобрести подготовленную пропускную способность.
Дополнительные сведения о подготовленных развертываниях см. в нашем руководстве по подготовке.
Доступность глобальной стандартной модели
gpt-4o
Версия: 2024-05-13
Поддерживаемые регионы:
- australiaeast
- brazilsouth
- canadaeast
- eastus
- eastus2
- francecentral
- germanywestcentral
- japaneast
- koreacentral
- northcentralus
- norwayeast
- польшацентральная
- southafricanorth
- southcentralus
- southindia
- swedencentral
- switzerlandnorth
- uksouth
- westeurope
- westus
- westus3
gpt-4o-mini
Версия: 2024-07-18
Поддерживаемые регионы:
- eastus
Доступность глобальной пакетной модели
Поддержка регионов и моделей
Следующие модели поддерживают глобальный пакет:
Модель | Версия | Формат входных данных |
---|---|---|
gpt-4o-mini |
2024-07-18 | текст + изображение |
gpt-4o |
2024-05-13 | текст + изображение |
gpt-4 |
turbo-2024-04-09 | text |
gpt-4 |
0613 | text |
gpt-35-turbo |
0125 | text |
gpt-35-turbo |
1106 | text |
gpt-35-turbo |
0613 | text |
В настоящее время глобальный пакет поддерживается в следующих регионах:
- Восточная часть США
- Западная часть США
- Центральная Швеция
Доступность модели GPT-4 и GPT-4 Turbo
Общедоступные облачные регионы
Регион | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4, turbo-2024-04-09 | gpt-4o, 2024-05-13 | gpt-4o-mini, 2024-07-18 | gpt-4-32k, 0613 |
---|---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | - | - | - | ✅ |
canadaeast | ✅ | ✅ | - | - | - | - | - | ✅ |
eastus | - | - | ✅ | - | ✅ | ✅ | ✅ | - |
eastus2 | - | ✅ | - | - | ✅ | ✅ | - | - |
francecentral | ✅ | ✅ | - | - | - | - | - | ✅ |
japaneast | - | - | - | ✅ | - | - | - | - |
northcentralus | - | - | ✅ | - | ✅ | ✅ | - | - |
norwayeast | - | ✅ | - | - | - | - | - | - |
southcentralus | - | - | ✅ | - | ✅ | ✅ | - | - |
southindia | - | ✅ | - | - | - | - | - | - |
swedencentral | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | - | - | ✅ | - | - | - | ✅ |
uksouth | - | ✅ | ✅ | - | - | - | - | - |
westus | - | ✅ | - | ✅ | ✅ | ✅ | - | - |
westus3 | - | ✅ | - | - | ✅ | ✅ | - | - |
Выбор доступа к клиенту
Помимо указанных выше регионов, доступных всем клиентам Azure OpenAI, некоторые из них получили доступ к версиям GPT-4 в дополнительных регионах:
Модель | Область/регион |
---|---|
gpt-4 (0314) gpt-4-32k (0314) |
Восточная часть США Центральная Франция Южная часть США южная часть Соединенного Королевства |
gpt-4 (0613) gpt-4-32k (0613) |
Восточная часть США Восточная часть США 2 Восточная Япония южная часть Соединенного Королевства |
Модели GPT-3.5
Внимание
Новая gpt-35-turbo (0125)
модель имеет различные улучшения, включая более высокую точность при реагировании в запрошенных форматах и исправление ошибки, которая вызвала проблему кодирования текста для вызовов функций, отличных от английского языка.
GPT-3.5 Turbo используется с Chat Completion API. GPT-3.5 Turbo версии 0301 также можно использовать с API завершения, хотя это не рекомендуется. GPT-3.5 Turbo версии 0613 и 1106 поддерживают только API завершения чата.
GPT-3.5 Turbo версии 0301 является первой версией модели, выпущенной. Версия 0613 является второй версией модели и добавляет поддержку вызовов функций.
Ознакомьтесь с версиями моделей, чтобы узнать, как Служба Azure OpenAI обрабатывает обновления версий модели и работает с моделями , чтобы узнать, как просматривать и настраивать параметры версии модели для развертываний GPT-3.5 Turbo.
Доступность модели GPT-3.5-Turbo
Общедоступные облачные регионы
Регион | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 | gpt-35-turbo-instruct, 0914 |
---|---|---|---|---|---|---|
australiaeast | - | ✅ | ✅ | - | ✅ | - |
canadaeast | - | ✅ | ✅ | ✅ | ✅ | - |
eastus | ✅ | ✅ | - | - | ✅ | ✅ |
eastus2 | - | ✅ | - | - | ✅ | - |
francecentral | ✅ | ✅ | ✅ | - | ✅ | - |
japaneast | - | ✅ | - | - | ✅ | - |
northcentralus | - | ✅ | - | ✅ | ✅ | - |
southcentralus | ✅ | - | - | ✅ | - | - |
southindia | - | - | ✅ | - | - | - |
swedencentral | - | ✅ | ✅ | - | ✅ | ✅ |
switzerlandnorth | - | ✅ | - | - | ✅ | - |
uksouth | ✅ | ✅ | ✅ | - | ✅ | - |
westeurope | ✅ | - | - | - | - | - |
westus | - | - | ✅ | - | - | - |
Модели Embeddings
Эти модели можно использовать только с запросами API внедрения.
Примечание.
text-embedding-3-large
является последней и самой способной моделью внедрения. Обновление между моделями внедрения невозможно. Чтобы перейти от использования text-embedding-ada-002
text-embedding-3-large
к вам, потребуется создать новые внедрения.
Model ID | Максимальный запрос (токены) | Измерения выходных данных | Учебные данные (до) |
---|---|---|---|
text-embedding-ada-002 (версия 2) |
8,191 | 1536 | Сентябрь 2021 г. |
text-embedding-ada-002 (версия 1) |
2,046 | 1536 | Сентябрь 2021 г. |
text-embedding-3-large |
8,191 | 3072 | Сентябрь 2021 г. |
text-embedding-3-small |
8,191 | 1536 | Сентябрь 2021 г. |
Примечание.
При отправке массива входных данных для внедрения максимальное количество входных элементов в массиве на вызов конечной точки внедрения составляет 2048.
Общедоступные облачные регионы
Регион | text-embedding-ada-002, 1 | text-embedding-ada-002, 2 | text-embedding-3-small, 1 | text-embedding-3-large, 1 |
---|---|---|---|---|
australiaeast | - | ✅ | - | - |
brazilsouth | - | ✅ | - | - |
canadaeast | - | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ |
eastus2 | - | ✅ | ✅ | ✅ |
francecentral | - | ✅ | - | ✅ |
japaneast | - | ✅ | - | ✅ |
northcentralus | - | ✅ | - | - |
norwayeast | - | ✅ | - | - |
southafricanorth | - | ✅ | - | - |
southcentralus | ✅ | ✅ | - | - |
southindia | - | ✅ | - | ✅ |
swedencentral | - | ✅ | - | ✅ |
switzerlandnorth | - | ✅ | - | - |
uksouth | - | ✅ | - | ✅ |
westeurope | - | ✅ | - | - |
westus | - | ✅ | - | - |
westus3 | - | ✅ | - | ✅ |
Модели DALL-E
Model ID | Доступность компонентов | Максимальный запрос (символы) |
---|---|---|
dalle2 (предварительная версия) | Восточная часть США | 1,000 |
dall-e-3 | Восточная часть США, Восточная Австралия, Центральная Швеция | 4000 |
Модели точной настройки
babbage-002
и davinci-002
не обучены следовать инструкциям. Запросы этих базовых моделей должны выполняться только в качестве точки ссылки на настраиваемую версию, чтобы оценить ход обучения.
gpt-35-turbo
— точная настройка этой модели ограничена подмножеством регионов и недоступна в каждом регионе, где доступна базовая модель.
Model ID | Точное настройка регионов | Максимальный запрос (токены) | Учебные данные (до) |
---|---|---|---|
babbage-002 |
Северная часть США Центральная Швеция Западная Швейцария |
16,384 | Сентябрь 2021 г. |
davinci-002 |
Северная часть США Центральная Швеция Западная Швейцария |
16,384 | Сентябрь 2021 г. |
gpt-35-turbo (0613) |
Восточная часть США2 Северная часть США Центральная Швеция Западная Швейцария |
4096 | Сентябрь 2021 г. |
gpt-35-turbo (1106) |
Восточная часть США2 Северная часть США Центральная Швеция Западная Швейцария |
Входные данные: 16 385 Выходные данные: 4096 |
Сентябрь 2021 г. |
gpt-35-turbo (0125) |
Восточная часть США2 Северная часть США Центральная Швеция Западная Швейцария |
16,385 | Сентябрь 2021 г. |
gpt-4 (0613) 1 |
Северная часть США Центральная Швеция |
8192 | Сентябрь 2021 г. |
gpt-4o-mini 1 (2024-07-18) |
Северная часть США Центральная Швеция |
Входные данные: 128 000 Выходные данные: 16 384 Длина контекста примера обучения: 64 536 |
Октябрь 2023 г. |
1 GPT-4 и GPT-4o мини-настройка в настоящее время находится в общедоступной предварительной версии. Дополнительные сведения см. в руководстве по оценке безопасности GPT-4o и GPT-4o.
Модели Whisper
Model ID | Доступность модели | Максимальный запрос (размер аудиофайла) |
---|---|---|
whisper |
Восточная часть США 2 Северная часть США Восточная Норвегия Южная Индия Центральная Швеция Западная Европа |
25 Мб |
Модели преобразования текста в речь (предварительная версия)
Model ID | Доступность модели |
---|---|
tts-1 |
Северная часть США Центральная Швеция |
tts-1-hd |
Северная часть США Центральная Швеция |
Помощники (предварительная версия)
Для Помощников требуется сочетание поддерживаемой модели и поддерживаемого региона. Для некоторых инструментов и возможностей требуются последние модели. Следующие модели доступны в API Помощников, пакете SDK, Azure AI Studio и Azure OpenAI Studio. Следующая таблица предназначена для оплаты по мере использования. Сведения о доступности подготовленной единицы пропускной способности (PTU) см . в статье о подготовленной пропускной способности. Перечисленные модели и регионы можно использовать как с помощниками версии 1, так и с версией 2. Вы можете использовать глобальные стандартные модели , если они поддерживаются в перечисленных ниже регионах.
Область/регион | gpt-35-turbo (0613) |
gpt-35-turbo (1106) |
fine tuned gpt-3.5-turbo-0125 |
gpt-4 (0613) |
gpt-4 (1106) |
gpt-4 (0125) |
gpt-4o (2024-05-13) |
gpt-4o-mini (2024-07-18) |
---|---|---|---|---|---|---|---|---|
Восточная Австралия | ✅ | ✅ | ✅ | ✅ | ||||
Восточная часть США | ✅ | ✅ | ✅ | ✅ | ||||
Восточная часть США 2 | ✅ | ✅ | ✅ | ✅ | ✅ | |||
Центральная Франция | ✅ | ✅ | ✅ | ✅ | ||||
Восточная Япония | ✅ | |||||||
Восточная Норвегия; | ✅ | |||||||
Центральная Швеция | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||
южная часть Соединенного Королевства | ✅ | ✅ | ✅ | ✅ | ||||
западная часть США | ✅ | ✅ | ✅ | |||||
Западная часть США — 3 | ✅ | ✅ |
Прекращение использования модели
Последние сведения о выходе на пенсию модели см. в руководстве по выходу на пенсию модели.