OpenAI publie des mises à jour pour l'inférence en temps réel dans les domaines de l'audio, de la vision et du texte
Selon Cointelegraph, OpenAI a effectué quatre mises à jour de ses modèles en octobre pour aider ses modèles d'IA à mieux mener des conversations et améliorer la reconnaissance d'images. La première mise à jour majeure est une API en temps réel qui permet aux développeurs de créer des applications de synthèse vocale générées par l'IA à l'aide d'une seule invite, permettant des conversations naturelles similaires aux modèles de discours avancés de ChatGPT. Auparavant, les développeurs devaient « assembler » plusieurs modèles pour créer ces expériences. L'entrée audio devait généralement être entièrement téléchargée et traitée avant qu'une réponse ne soit reçue, ce qui signifie que les applications en temps réel telles que les conversations vocales ont une latence élevée. Avec les capacités de streaming de l'API en temps réel, les développeurs peuvent désormais réaliser des interactions instantanées et naturelles, tout comme un assistant vocal. Fonctionnant sur GPT-4, qui sera publié en mai 2024, l'API permet une inférence en temps réel à travers l'audio, la vision et le texte. Une autre mise à jour inclut des outils de réglage fin pour les développeurs qui leur permettent d'améliorer les réponses de l'IA générées à partir d'entrées d'images et de texte. Le réglage fin basé sur l'image permet à l'IA de mieux comprendre les images, conduisant à une recherche visuelle améliorée et à une détection d'objets. Le processus inclut des retours d'humains qui fournissent des exemples de bonnes et mauvaises réponses pour l'entraînement. En plus des mises à jour de la parole et de la vision, OpenAI a introduit la « distillation de modèle » et la « mise en cache d'indices », qui permettent à des modèles plus petits d'apprendre de plus grands et de réduire les coûts et le temps de développement en réutilisant le texte traité. OpenAI s'attend à ce que les revenus augmentent à 11,6 milliards de dollars l'année prochaine, contre 3,7 milliards de dollars prévus en 2024, selon Reuters.
Avertissement : le contenu de cet article reflète uniquement le point de vue de l'auteur et ne représente en aucun cas la plateforme. Cet article n'est pas destiné à servir de référence pour prendre des décisions d'investissement.