OpenAI publie des mises à jour pour l'inférence en temps réel dans les domaines de l'audio, de la vision et du texte

Bitget2024/10/02 14:17

Afficher le texte d'origine

Bitget propose un service de trading tout-en-un de cryptomonnaies, d'actions et d'or. Tradez dès maintenant !

Pack cadeau de 6200 USDT pour les nouveaux utilisateurs ! Inscrivez-vous dès maintenant !

Selon Cointelegraph, OpenAI a effectué quatre mises à jour de ses modèles en octobre pour aider ses modèles d'IA à mieux mener des conversations et améliorer la reconnaissance d'images. La première mise à jour majeure est une API en temps réel qui permet aux développeurs de créer des applications de synthèse vocale générées par l'IA à l'aide d'une seule invite, permettant des conversations naturelles similaires aux modèles de discours avancés de ChatGPT. Auparavant, les développeurs devaient « assembler » plusieurs modèles pour créer ces expériences. L'entrée audio devait généralement être entièrement téléchargée et traitée avant qu'une réponse ne soit reçue, ce qui signifie que les applications en temps réel telles que les conversations vocales ont une latence élevée. Avec les capacités de streaming de l'API en temps réel, les développeurs peuvent désormais réaliser des interactions instantanées et naturelles, tout comme un assistant vocal. Fonctionnant sur GPT-4, qui sera publié en mai 2024, l'API permet une inférence en temps réel à travers l'audio, la vision et le texte. Une autre mise à jour inclut des outils de réglage fin pour les développeurs qui leur permettent d'améliorer les réponses de l'IA générées à partir d'entrées d'images et de texte. Le réglage fin basé sur l'image permet à l'IA de mieux comprendre les images, conduisant à une recherche visuelle améliorée et à une détection d'objets. Le processus inclut des retours d'humains qui fournissent des exemples de bonnes et mauvaises réponses pour l'entraînement. En plus des mises à jour de la parole et de la vision, OpenAI a introduit la « distillation de modèle » et la « mise en cache d'indices », qui permettent à des modèles plus petits d'apprendre de plus grands et de réduire les coûts et le temps de développement en réutilisant le texte traité. OpenAI s'attend à ce que les revenus augmentent à 11,6 milliards de dollars l'année prochaine, contre 3,7 milliards de dollars prévus en 2024, selon Reuters.

Avertissement : le contenu de cet article reflète uniquement le point de vue de l'auteur et ne représente en aucun cas la plateforme. Cet article n'est pas destiné à servir de référence pour prendre des décisions d'investissement.

PoolX : Bloquez vos actifs pour gagner de nouveaux tokens

Jusqu'à 12% d'APR. Gagnez plus d'airdrops en bloquant davantage.

Bloquez maintenant !

Vous pourriez également aimer

Données : L'indice actuel de peur et d'avidité des crypto-monnaies est de 9, indiquant un état de peur extrême.

Chaincatcher•2026/06/09 04:34

Le marché boursier indonésien a augmenté de 3,9%.

格隆汇•2026/06/09 04:34

CBRS rebondit de 20 % en intraday, en tête du secteur des semi-conducteurs ; la position longue CBB du trader transforme sa perte en un gain de 330 000 $.

BlockBeats•2026/06/09 04:33

SK hynix introduit des équipements supplémentaires dans l'usine P&T6 pour répondre à la demande d'encapsulation et de tests de HBM4.

格隆汇•2026/06/09 04:33