Inference De Modele - Search News

Inférence IA : 5 leviers pour optimiser les coûts, sécuriser les déploiements et stimuler l'innovation

Evoquer l'intelligence artificielle revient souvent à porter l'attention sur l'entraînement d'énormes modèles de deep learning, mobilisant des milliers de GPU pendant plusieurs semaines. Pourtant, la ...

InformatiqueNews.fr

FunctionGemma, le SLM de Google pour mieux automatiser en local

FunctionGemma traduit vos demandes en appels API déterministes, pour des agents IA sobres, rapides et confinés dans votre SI interne.

journaldunet.com

De l'inférence à l'entrainement, AWS muscle ses outils dédiés à l'IA générative à re:Invent 2024

Swami Sivasubramanian, VP AI et Ddta d'AWS, annonce l'arrivée de nouvelles fonctionnalités pour entraîner et inférer plus facilement les modèles d'IA générative tout en réduisant (encore) les coûts.

ZDNet

La startup Cerebras lance le service d'inférence le plus rapide au monde - avec un petit quelque chose en plus

Le fabricant d'ordinateurs d'IA affirme que son service d'inférence est beaucoup plus rapide et qu'il rend possible de nouveaux types d'IA « agentique ». Le marché des prédictions issues de ...

Zonebourse

La bibliothèque Open-Source NVIDIA Dynamo accélère et fait évoluer les modèles de raisonnement de l'IA

NVIDIA dévoile NVIDIADynamo, un logiciel d'inférence open-source pour accélérer et mettre à l'échelle les modèles de raisonnement de l'IA dans les usines d'IA au coût le plus bas et avec la plus ...

LeMagIT

L’inférence distribuée, l’avenir de Red Hat AI

« Les clients se trouvent à différentes étapes de leur parcours d’adoption de l’IA générative », déclare Tushar Katarki, directeur produit, plateformes de modèles de fondation chez Red Hat. « Ils ...

LeMagIT

IA générative : pourquoi l’inférence sur CPU prend de l’ampleur

Quand il est question d’IA générative et de grands modèles de langage, difficile de ne pas évoquer Nvidia. Le concepteur fabless d’accélérateurs de calcul est devenu la coqueluche des marchés ...

journaldunet.com

Quelle configuration choisir, de l'entraînement à l'inférence des LLM

L'infrastructure à mettre en place diffère grandement selon les cas d'usage. Tour d'horizon des configurations répondant à chacun. De l'entraînement à l'inférence en passant par le RAG, les ...

ZDNet

Andrew Feldman (PDG Cerebras) sur Mistral AI et DeepSeek : "chaque fois que l'informatique devient moins chère, le marché grandit"

Andrew Feldman, cofondateur et PDG de l'entreprise Cerebras Systems, pionnier des ordinateurs d'IA, est "écrasé" par les demandes sur le LLM R1 de DeepSeek. "Nous réfléchissons à la manière de ...

Le Monde Informatique

Inférence IA : 5 leviers pour optimiser les coûts, sécuriser les déploiements et stimuler l'innovation

En réalité, le paysage est plus complexe : il faut souvent arbitrer différentes offres de cloud spécialisé en IA, des solutions de cloud souverain, des infrastructures hybrides, etc. Le deuxième ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results