Show HN: ART – a new open-source RL framework for training agents

Train GRPO-powered RL agents with minimal code changes and maximal performance! Agent Reinforcement Trainer (ART) ART is an open-source reinforcement training library for improving LLM performance in agentic workflows. ART utilizes the powerful GRPO reinforcement learning algorithm to train models from their own experiences. Unlike most RL libraries, ART allows you to execute agent runs in your existing codebase while offloading all the complexity of the RL training loop to the ART backend. Read about the training loop. Then try out one of the notebooks below! 📒 Notebooks 🔁 Training Loop Overview ART's functionality is divided into a client and a server. The OpenAI-compatible client is responsible for interfacing between ART and your codebase. Using the client, you can pass messages and get completions from your LLM as it improves. The server runs independently on any machine with a GPU. It abstracts away the complexity of the inference and training portions of the RL loop while allowing for some custom configuration. An outline of the training loop is shown below: Inference Your code uses the ART client to perform an agentic workflow (usually executing several rollouts in parallel to gather data faster). Completion requests are routed to the ART server, which runs the model's latest LoRA in vLLM. As the agent executes, each system , user , and assistant message is stored in a Trajectory. When a rollout finishes, your code assigns a reward to its Trajectory, indicating the performance of the LLM. Training When each rollout has finished, Trajectories are grouped and sent to the server. Inference is blocked while training executes. The server trains your model using GRPO, initializing from the latest checkpoint (or an empty LoRA on the first iteration). The server saves the newly trained LoRA to a local directory and loads it into vLLM. Inference is unblocked and the loop resumes at step 1. This training loop runs until a specified number of inference and training iterations have completed. 🧩 Supported Models ART should work with most vLLM/HuggingFace-transformers compatible causal language models, or at least the ones supported by Unsloth. Gemma 3 does not appear to be supported for the time being. If any other model isn't working for you, please let us know on Discord or open an issue on GitHub! 🤝 Contributing ART is in active development, and contributions are most welcome! Please see the CONTRIBUTING.md file for more information. 📖 Citation @misc { hilton2025art , author = { Brad Hilton and Kyle Corbitt and David Corbitt and Saumya Gandhi and Angky William and Bohdan Kovalenskyi and Andie Jones } , title = { ART: Agent Reinforcement Trainer } , year = { 2025 } , publisher = { GitHub } , journal = { GitHub repository } , howpublished = { \url{https://github.com/openpipe/art} } } ⚖️ License This repository's source code is available under the Apache-2.0 License. 🙏 Credits ART stands on the shoulders of giants. While we owe many of the ideas and early experiments that led to ART's development to the open source RL community at large, we're especially grateful to the authors of the following projects: Finally, thank you to our partners who've helped us test ART in the wild! We're excited to see what you all build with it.

Github.com

2025-04-30

Elena Petrova

Related News

World

Nvidia alerte les parlementaires américains sur la montée en puissance de l'IA de Huawei

Le PDG de Nvidia, Jensen Huang, a fait part de ses inquiétudes quant aux progrès de Huawei Technologies Co. dans le domaine de l'intelligence artificielle lors d'échanges avec des membres du...

Zonebourse.com

few moment ago

World

Nvidia a fait part de ses inquiétudes aux parlementaires américains concernant les capacités croissantes de Huawei en matière d'IA

Le PDG de Nvidia, Jensen Huang, a discuté avec des parlementaires américains des préoccupations liées aux capacités croissantes de Huawei Technologies Co. en matière d'intelligence artificielle,...

Zonebourse.com

few moment ago

World

Qui sont les trois autres candidats à la reprise du chantier naval quimpérois Ufast ?

INFO LE TÉLÉGRAMME. Trois autres candidats ont surgi pour la reprise du chantier naval quimpérois Ufast, placé en redressement judiciaire depuis mars 2024. Qui sont-ils, comment et pourquoi veulent-ils reprendre : les arguments sont parfois surprenants.

Le Télégramme

few moment ago

World

Moët Hennessy, filiale de LVMH, va supprimer 10 % de ses effectifs, selon le Financial Times

Moët Hennessy, la division vins et spiritueux du groupe LVMH, va réduire ses effectifs de plus de 10 %, soit environ 1 200 employés, a rapporté jeudi le Financial Times, citant un message vidéo...

Zonebourse.com

few moment ago

World

1er mai: 50.000 policiers et plus de 400 arrestations à Istanbul

Plus de 400 personnes participant aux célébrations du 1er mai ont été arrêtées jeudi à Istanbul, ont annoncé les autorités turques qui ont déployé plus de 50.000 policiers et paralysé une partie de la ville pour empêcher tout rassemblement sur l'emblématique place Taksim.

Actu Orange

few moment ago

World

L'Italie va exiger l'approbation des parents avant les cours d'éducation sexuelle

Le gouvernement italien veut exiger une approbation écrite des parents avant les cours d'éducation sexuelle. Les écoles devront aussi détailler en début d'année scolaire le matériel didactique utilisé, le déroulement et l'objectif de ces cours. Ils n'étaient jusqu'ici pas obligatoires à l'école.

RTS.ch

few moment ago

World

Des millions de multicuiseurs rappelés pour des brûlures graves

SharkNinja rappelle plus de deux millions de multicuiseurs vendus aux États-Unis et au Canada, après que des consommateurs ont signalé plus de 100 brûlures dues à un risque de projection d’aliments chauds.

Le Soleil - Groupe Capitales Médias

few moment ago

World

Une femme et un homme blessés dans un accident de la route à Besse-sur-Issole

Pour une raison inconnue, un accident de la route s’est produit au nord du village de Besse-sur-Issole ce jeudi 1er mai. Autour de 18 heures, une voiture et un deux-roues sont entrés en collision sur la route de Cabasson, près de la RD 13. On dénombre deux victimes dans l’accident, une femme et un

Var-Matin

few moment ago

World

Genève: les bords du Rhône affichent déjà un petit air d’été

Les températures quasi estivales de ce jeudi ont incité les Genevois à fréquenter les lieux de baignade. Les pontons, situés sur le Rhône, affichaient presque complet.

Tribune de Genève

few moment ago

World

OM : L'ultimatum qui va faire du bruit...

Entre l'OM et la Ligue des champions, c'est une disette de bientôt trois ans qu'on note. Beaucoup trop aux yeux de Valentin Rongier. Le milieu de terrain de l'Olympique de Marseille a pris rendez-vous avec la C1 pour la saison prochaine en lançant un appel…

Le 10 Sport

few moment ago

World

Etats-Unis : « J’aimerais être pape », Trump fait de l’humour (et un peu de politique aussi) avant le conclave

«Jaimerais être pape. Ce serait mon premier choix », a lancé Donald Trump devant la presse. A la suite du décès du pape François, survenu la semaine dernière à lâge de 88 ans, le président des Etats-… [+1216 chars]

20 Minutes

few moment ago

World

A seulement 14 %, la cote de confiance de Bayrou est la plus basse pour un Premier ministre depuis… 1981

Cest la dégringolade ! Jamais un Premier ministre navait atteint un seuil de confiance aussi bas dans lopinion depuis 1981. Selon le dernier baromètre politique Verian pour Le Figaro Magazine, publié… [+1460 chars]

20 Minutes

few moment ago

World

Nombre de manifestants, agressions contre des membres du PS, interpellations à Nantes… Ce qu’il faut retenir du 1er-Mai en France

Ce jeudi, des dizaines de milliers de manifestants sont descendues dans la rue partout en France pour le 1er-Mai, avec quelques tensions notamment à Paris, où des militants et élus socialistes ont été pris à partie, et à Nantes, où 15 personnes ont été interpellées.

Le Télégramme

few moment ago

World

Virginia Giuffre, accusatrice de Jeffrey Epstein, meurt par suicide selon sa famille

Virginia Giuffre, l'une des accusatrices les plus en vue du défunt délinquant sexuel Jeffrey Epstein, est décédée par suicide, a annoncé sa famille vendredi. Giuffre, âgée de 41 ans, est... -Le 01 mai 2025 à 18:46 - Zonebourse

Zonebourse.com

few moment ago

World

De Brest à Sochaux, ces cyclistes récoltent des maillots de foot pour des orphelins des sapeurs-pompiers

À vélo, trois amis traversent la France d’ouest en est, de Brest à Sochaux, pour récolter des maillots de football qu’ils offriront aux orphelins des pompiers. Ils sont arrivés à Guingamp, mercredi 30 avril au soir.

Le Télégramme

few moment ago

World

Serbie: étudiants et syndicats unis dans la contestation, une première dans le pays

Des milliers de personnes ont manifesté jeudi en Serbie, à Belgrade et à Novi Sad (nord), à l'appel des étudiants et des syndicats, une première dans le pays, six mois après un accident mortel dans une gare qui a déclenché un immense mouvement de contestation contre la corruption.

Actu Orange

few moment ago

World

À Bourseul, sa voiture finit sa course contre un arbre : un homme hospitalisé en urgence absolue

Un homme seul dans son véhicule a eu un accident sur la RD792, à Bourseul, près de Plancoët, dans les Côtes-d’Armor, ce jeudi 1er mai. Il a été hospitalisé en urgence absolue à Dinan.

Le Télégramme

few moment ago

World

En direct, guerre en Ukraine : les Etats-Unis négocient une " solution durable " au conflit entre la Russie et Kiev, assure J. D. Vance

Dans un entretien avec Fox News, le vice-président américain a déclaré que les cent premiers jours de l’administration Trump ont été consacrés à apporter des changements « très rapidement », mais que les cent prochains jours exigeront que le Congrès et les partenaires internationaux « prennent leurs responsabilités ».

Le Monde

few moment ago

Theme

Select Language

Show HN: ART – a new open-source RL framework for training agents