Des chercheurs de Stanford présentent DSPy : un cadre d’intelligence artificielle (IA) pour résoudre des tâches avancées avec des modèles de langage (LMs) et des modèles de recherche (RMs).

Mohammad Arshad | MarktechPost

Diverses tâches complexes peuvent être facilement résolues à l’aide de modèles de langage et de modèles de recherche. Les modèles de langage, comme GPT-3, sont conçus pour générer du texte semblable à celui écrit par un être humain en fonction de l’entrée qu’ils reçoivent. D’autre part, les modèles de recherche sont utilisés pour extraire des informations pertinentes d’une base de données ou d’une collection de documents. La définition claire de la tâche que vous souhaitez résoudre détermine si elle nécessite la génération de nouveau texte ou l’extraction de données à partir de sources existantes.

Avec GPT-3 ou des modèles similaires, il faut fournir un exemple décrivant la tâche et laisser le modèle générer du texte en fonction de celui-ci. Cela nécessite d’expérimenter avec la formulation et la structure de l’exemple pour obtenir la sortie souhaitée. Cela implique de combiner le texte généré par les modèles de langage avec les informations extraites des bases de données. Cela peut inclure la génération de résumés ou d’informations basées sur les données extraites.

Des chercheurs de Stanford ont développé un cadre pour résoudre des tâches avancées avec des modèles de langage (LMs) et des modèles de recherche (RMs) qu’ils appellent DSPy. DSPy comprend diverses techniques pour guider et affiner les LMs, améliorant ainsi leur capacité de raisonnement et leur capacité d’augmentation de la recherche. DSPy repose sur une syntaxe pythonique pour fournir des modules composables et déclaratifs permettant d’instruire les LMs.

DSPy dispose également d’un compilateur automatique qui forme le LM à exécuter les étapes déclaratives de votre programme. Ce compilateur peut affiner les performances à partir de données minimales sans étiquettes intermédiaires manuelles. Il utilise un espace systématique de pièces modulaires et entraînables au lieu de la manipulation de chaînes de caractères.

DSPy utilise deux concepts simples appelés « Signatures » et « Teleprompters » pour compiler n’importe quel programme que vous écrivez. Une signature est une spécification déclarative du comportement entrée/sortie d’un module DSPy. En revanche, les téléprompteurs sont des optimiseurs puissants (inclus dans DSPy) capables d’apprendre à amorcer et de sélectionner des instructions efficaces pour les modules de n’importe quel programme.

La signature se compose d’une description minimale de la sous-tâche et d’une ou plusieurs questions d’entrée qui seront posées au LM. Elle explique également la réponse attendue à ces questions de la part du LM. Les téléprompteurs sont des éléments automatisés qui fournissent des instructions à distance. Les chercheurs indiquent que, par rapport à d’autres méthodes, DSPy nécessite très peu d’étiquetage. Il générera automatiquement les étiquettes intermédiaires nécessaires pour soutenir le pipeline de l’utilisateur, qui comprend plusieurs étapes complexes.

Étant donné que le cadre DSPy diffère considérablement des autres bibliothèques, il est assez facile de justifier quand l’utiliser en fonction de notre cas d’utilisation. Les chercheurs affirment que ce cadre unifié est très utile pour les chercheurs en traitement automatique du langage naturel (NLP) et en intelligence artificielle (IA), ainsi que pour toute personne explorant de nouveaux pipelines ou de nouvelles tâches pour résoudre des problèmes avancés et complexes. Pour le rendre accessible à tous, ils ont publié un manuel d’installation. Ils annoncent également la sortie future de divers tutoriels d’introduction et de démonstrations avec des références.

Consultez le lien GitHub pour accéder au projet. Tous les mérites de cette recherche reviennent aux chercheurs impliqués dans ce projet.

Source : MarktechPost

Des chercheurs de Stanford présentent DSPy

Des chercheurs de Stanford présentent DSPy : un cadre d’intelligence artificielle (IA) pour résoudre des tâches avancées avec des modèles de langage (LMs) et des modèles de recherche (RMs).

Poster le commentaire Annuler la réponse

Articles récents

Commentaires récents