Depuis le 5 septembre 2018, Google Dataset Search vient compléter la liste des autres moteurs de recherche spécialisés conçus par Google. Après Google News, Google Books ou encore Google Images, Google Dataset Search simplifie l’accès aux données ouvertes du web. Il vient de sortir de son programme bêta, c’est-à-dire de sa deuxième phase de test. Lumière sur le fonctionnement de ce nouveau moteur de recherche spécialisé.

Qu’est-ce que Google Dataset Search ?

Un ensemble de milliards de données

Il existe aujourd’hui des millions d’ « Open Data », de données ouvertes mise en ligne sur le web. Il s’agit de données accessibles par tout un chacun, que tout le monde peut exploiter et partager. Leur utilisation peut par conséquent se révéler intéressante pour certains publics. Les gouvernements, les scientifiques, voire les particuliers, peuvent en effet avoir besoin d’accéder à des données sur des thématiques particulières. Le nouveau moteur de recherche gratuit Google Dataset Search offre désormais la possibilité de rechercher plus facilement les Open Data.

Avant l’arrivée de Google Dataset Search, il était difficile de localiser précisément un ensemble de données ouvertes. Hormis par bouche-à-oreille, la recherche ne se révélait que rarement fructueuse. Cette situation était pour le moins problématique, notamment dans le cadre de recherches réalisées par des scientifiques,  lorsque ceux-ci avaient besoin d’accéder à des données ne relevant pas de leur domaine d’exercice. Avec Google Dataset Search, les recherches et l’exportation de données ouvertes peuvent désormais s’effectuer sur des thématiques ciblées. Ceci est rendu possible grâce à un algorithme dédié et à un classement méticuleux  des données. Ces dernières sont en effet structurées par un balisage schema.org et un vocabulaire normé.

Comment structurer ses données pour Google Dataset Search ?

Afin que le fonctionnement de Google Dataset Search soit optimal, les fournisseurs de données sont tenus de :

  • compléter leur sitemap, c’est-à-dire le fichier qui permet à Google d’explorer facilement votre site web, en précisant les relations entre les différentes pages et fichiers ;
  • utiliser des propriétés précises :
    • name : propriété obligatoire servant à nommer l’ensemble de données ;
    • description : propriété qui permet de décrire l’ensemble. Elle est également obligatoire ;
    • d’autres propriétés (facultatives, mais recommandées) : alternateName, citation, keywords, license, spatialCoverage, temporalCoverage, etc

Afin de vérifier que les ensembles de données sont correctement décrits, il est possible pour l’éditeur du site de contrôler la validité du balisage dans Google Search Console.

Comment effectuer une recherche sur Google Dataset Search ?

Du côté de l’internaute, celui-ci effectue sa recherche par mot-clé. Google a néanmoins amélioré la précédente version de Google Dataset Search et a ajouté de nouvelles fonctionnalités. Si l’on tape par exemple « coronavirus covid-19 » dans l’onglet de recherche, plus de cent ensembles de données sont proposés. Il est ensuite possible de les trier par :

  • date de mise à jour (depuis un mois, un an ou trois ans) ;
  • format de téléchargement (tableau, archive, image, document, texte) ;
  • droit d’usage (usage commercial ou non) ;
  • thèmes (sciences humaines, sciences sociales, agriculture, géoscience, ingénierie, informatique, etc.) ;
  • gratuité ou non ;
  • la géolocalisation : si les données sont rattachées à une thématique géographique, Google permet l’accès à la carte de localisation.

Les données proviennent essentiellement des gouvernements, des sciences ou de la presse.

Note de l’agence : Google Dataset Search devrait rencontrer un grand succès. Ceci reste néanmoins subordonné à la rigueur de classement des propriétaires des ensembles de données. Il est important, en tant que partageur de données, de bien utiliser le standard schema.org Dataset. Du côté des utilisateurs du moteur de recherche, l’exploration est relativement aisée.

Si vous souhaitez avoir des informations sur nos prestations, contactez-nous au 01 58 89 27 36 ou via le formulaire de contact.