Elle s’appelle Positron AI et compte déjà une puce d’inférence commercialisée. Après trois ans d’existence, la start-up lève ...
Elastic a rendu disponibles deux rerankers Jina sur Elastic Inference Service , un service d'inférence en tant que service accéléré par GPU, qui facilite l'exécution rapide d'inférences de ...
NVIDIA a lancé quatre plates-formes d'inférence optimisées pour un ensemble varié d'applications d'IA générative qui émergent rapidement, aidant les développeurs à créer rapidement des applications ...
Quand il est question d’IA générative et de grands modèles de langage, difficile de ne pas évoquer Nvidia. Le concepteur fabless d’accélérateurs de calcul est devenu la coqueluche des marchés ...
Swami Sivasubramanian, VP AI et Ddta d'AWS, annonce l'arrivée de nouvelles fonctionnalités pour entraîner et inférer plus facilement les modèles d'IA générative tout en réduisant (encore) les coûts.
Evoquer l'intelligence artificielle revient souvent à porter l'attention sur l'entraînement d'énormes modèles de deep learning, mobilisant des milliers de GPU pendant plusieurs semaines. Pourtant, la ...
À l’occasion du Red Hat Summit 2025, l’éditeur open source met en avant son Red Hat AI Inference Server, de nouveaux modèles validés par des tiers, et l’intégration des API Llama Stack (Meta) et MCP ...
En douze ans d’existence, Clarifai a bâti une plateforme consacrée à la préparation de données, à l’entraînement et à l’inférence de modèles d’IA. Plus particulièrement, l’entreprise a rapidement été ...
La plupart des modèles d'IA étant entraînés et déployés, les GPUs sont-ils encore au goût du jour pour faire face à la prochaine évolution de l'intelligence artificielle: l'inférence. Il ne fait aucun ...
Le fabricant d'ordinateurs d'IA affirme que son service d'inférence est beaucoup plus rapide et qu'il rend possible de nouveaux types d'IA « agentique ». Le marché des prédictions issues de ...
Après un échec constaté dans les discussion avec Broadcom, c’est finalement Samsung qui pourrait être chargé de produire les ...