From 91f871a39afe465a9fe74f974a8a48ed3c64a4d3 Mon Sep 17 00:00:00 2001 From: geoffreyaldebert Date: Mon, 23 Jun 2025 18:32:45 +0200 Subject: [PATCH 1/2] feat: add widget to search into rag datasets --- components/RagWidgetBanner.vue | 119 ++++++++++++++++++++++ nuxt.config.ts | 1 + pages/datasets/[did].vue | 5 +- server/routes/nuxt-api/rag-search.post.ts | 27 +++++ 4 files changed, 151 insertions(+), 1 deletion(-) create mode 100644 components/RagWidgetBanner.vue create mode 100644 server/routes/nuxt-api/rag-search.post.ts diff --git a/components/RagWidgetBanner.vue b/components/RagWidgetBanner.vue new file mode 100644 index 000000000..ab0bb44ba --- /dev/null +++ b/components/RagWidgetBanner.vue @@ -0,0 +1,119 @@ + + + diff --git a/nuxt.config.ts b/nuxt.config.ts index 71b4b990c..e229a44e4 100644 --- a/nuxt.config.ts +++ b/nuxt.config.ts @@ -43,6 +43,7 @@ export default defineNuxtConfig({ runtimeConfig: { crispIdentifier: '', crispKey: '', + albertApiKey: '', crispWebsiteId: '', pagesGhRepoName: 'datagouv/datagouvfr-pages', pagesGhRepoBranch: 'master', diff --git a/pages/datasets/[did].vue b/pages/datasets/[did].vue index da2947396..172e86ffa 100644 --- a/pages/datasets/[did].vue +++ b/pages/datasets/[did].vue @@ -208,7 +208,10 @@ v-if="dataset" :dataset /> - + BETACe jeu de données a été traité par un système RAG afin de permettre une interaction basée sur l’analyse sémantique. Vous pouvez le tester ci-dessous !

+

Pour tester ce module sur un ensemble plus large de données, rendez-vous sur le moteur de recherche en version beta.

{{ infosRag.title }}

+
+ + + {{ $t('Home') }} + + + +

+ Moteur de recherche basé sur une intelligence artificielle souveraine +

+ +

Nouveau ! La plateforme data.gouv.fr expérimente un nouveau mode de recherche ! Basé sur une question en langage naturel, vous pouvez chercher des informations contenues à l'intérieur de jeux de données ayant été au préalable vectorisés.

+ + +
+ + +
+ +
+

Jeux de données vectorisés disponibles :

+
+ +
+
+ +
+ Erreur : {{ error }} +
+ +
+ Nous limitons pour le moment le retour à dix résultats maximum. +
+ +
+ + +
+
+

+

Des données vectorisées ? Kesako ?

+

La vectorisation de données est une étape clé en science des données. Vectoriser des données signifie transformer des informations (souvent du texte, des images ou des catégories) en nombres que les algorithmes peuvent comprendre et traiter.

+

Pourquoi vectoriser ?

+

Les ordinateurs ne comprennent pas les mots, les images ou les concepts comme nous. Ils ne comprennent que des nombres. La vectorisation permet donc de convertir des données complexes en vecteurs numériques (des listes de nombres) que les algorithmes peuvent analyser, comparer ou classer.

+

A quoi ça sert ?

+

Ici par exemple, nous pouvons chercher à l'intérieur de base de données publiées sur data.gouv.fr. La vectorisation des données permet d'interroger en langage naturel simplement ces données, le moteur de recherche nous retourne alors les éléments des bases de données interrogées qui lui semble le plus pertinent.

+

Qu'est-ce qu'il y a sous le capot ?

+

Nous nous basons sur les outils de l'équipe Albert de la DINUM. Ces outils sont servies de façon souveraine, sécurisée, le tout dans une démarche open source et portée par l'administration.

+
+ + +