Microsoft a dévoilé Phi-4, la dernière itération de sa série Phi de modèles d'intelligence artificielle (IA) générative. L'architecture rationalisée intègre les avancées en matière de résolution de problèmes matic .
Selon les rapports, le nouveau modèle, doté de 14 milliards de paramètres, vise à rivaliser avec d'autres modèles d'IA compacts tels que GPT-4o Mini, Gemini 2.0 Flash et Claude 3.5 Haiku.
Selon le blog , Phi-4 est disponible avec un accès limité via la plateforme Azure AI Foundry de Microsoft et est limité à des fins de recherche dans le cadre d'un accord de licence de recherche Microsoft.
Phi-4 : Performances améliorées en raisonnement matic
Microsoft a positionné Phi-4 comme un leader dans la résolution de problèmes matic , citant des gains de performances substantiels par rapport à ses prédécesseurs et à des modèles comparables. La société est dent dans les capacités du modèle d'IA après que Phi-4 aurait obtenu les meilleures notes dans plusieurs tests de référence standardisés.
Source : Microsoft
Dans le test GPQA, il a obtenu un score de 56,1, surpassant les 40,9 de GPT-4o et les 49,1 de Llama-3. Sur le benchmark MATH, Phi-4 a atteint 80,4, ce qui reflète ses capacités avancées à résoudre des problèmes matic complexes. Il a également excellé dans les tests de codage, obtenant un score de 82,6 sur HumanEval.
De plus, Phi-4 a démontré ses prouesses dans des scénarios du monde réel, notamment en obtenant des scores élevés aux problèmes des compétitions de matic américaines de la matic al Association of America (AMC-10/12). Ces résultats indiquent des applications potentielles dans la recherche scientifique, l’ingénierie et la modélisation financière, domaines où la précision matic et le raisonnement sont essentiels.
Voir aussi OpenAI devient sombre après que la mise à jour Apple combine Siri et ChatGPT
Source : Microsoft
Alors que des modèles plus grands comme le GPT-4o d'OpenAI et le Gemini Ultra de Google fonctionnent avec des centaines de milliards, voire des milliards de paramètres, Phi-4 démontre que des architectures plus petites et rationalisées peuvent atteindre des performances supérieures dans des tâches spécialisées.
Microsoft attribue les progrès de Phi-4 à l'intégration de données synthétiques de haute qualité aux côtés d'ensembles de données de contenu généré par l'homme, ainsi qu'aux améliorations non divulguées apportées au cours de la post-formation. Ces efforts reflètent une tendance plus large dans le secteur de l'IA , où les équipes de recherche se concentrent de plus en plus sur les innovations en matière d'utilisation des données synthétiques et d'optimisation post-formation.
Alexandr Wang, PDG de Scale AI, a récemment souligné ce changement, faisant remarquer que l'industrie s'est heurtée à un « mur de données de pré-formation », ajoutant que les entreprises se précipiteront désormais vers le développement de modèles d'IA plus efficaces.
IA responsable et fonctionnalités de sécurité
Microsoft continue de mettre l'accent sur le développement responsable des solutions d'IA, en intégrant des mesures de sécurité robustes dans Phi-4 et ses prédécesseurs. Grâce à Azure AI Foundry, les utilisateurs ont accès à des outils conçus pour évaluer et atténuer les risques tout au long du cycle de vie du développement de l'IA.
Voir aussi Google lance Gemini 2.0 et prétend que c'est un modèle pour « tout »
Ces outils incluent des protections rapides, qui protègent contre les entrées inappropriées ou nuisibles, une détection de matériaux protégés pour dent le contenu sensible dans les sorties et une détection de mise à la terre pour garantir que les sorties sont factuellement exactes et pertinentes.
fonctionnalités sont intégrées à la boîte à outils Content Safety d'Azure AI, permettant aux développeurs d'appliquer des filtres et de surveiller les applications en termes de qualité, de sécurité et d'intégrité des données. Les alertes en temps réel fournissent des interventions opportunes pour résoudre des problèmes tels que les invites contradictoires et les écarts de contenu.
Azure AI Foundry prend en outre en charge les évaluations de modèles itératifs avec des métriques intégrées et personnalisées, offrant ainsi aux développeurs la flexibilité d'affiner leurs applications d'IA pour des performances optimales.
Un système étape par étape pour lancer votre carrière Web3 et décrocher des emplois cryptographiques bien rémunérés en 90 jours.