Partage de données zero-copy (virtualisation)
La virtualisation vous permet de rendre une ressource exploratoire dans votre marketplace sans avoir à copier les enregistrements sous-jacents dans Huwise. Les enregistrements restent stockés dans le système source, et les actions effectuées pour les explorer sont réalisées sur la source.
Ceci est utile lorsque vous souhaitez exposer des données dans Huwise tout en évitant les duplications sur la plateforme.
Cette fonctionnalité est une option disponible pour les clients Advanced et Ultimate. Elle est actuellement disponible pour les sources Snowflake et Databricks. Contactez votre responsable de réussite client pour plus d'informations.
Comment fonctionnent les actifs zero-copy
Un jeu de données zero-copy, ou virtualisé, est un actif dans Huwise dont les enregistrements restent stockés dans le système source. Comme les requêtes d’exploration sont envoyées directement au système source, les jeux de données zero-copy restent alignés sur les données source sans nécessiter de duplication.
Comme les autres jeux de données, les jeux de données zero-copy disposent de pages d’actifs dédiées dans le marketplace où les utilisateurs peuvent explorer à la fois les données et le schéma. Et comme tout autre actif, les actifs zero-copy incluent des métadonnées et permettent de configurer qui peut y accéder.
Veuillez noter que les jeux de données virtualisés (zero-copy) offrent le même niveau de sécurité que les jeux de données non virtualisés. Des techniques standard de sécurisation et de validation sont appliquées aux requêtes exécutées en temps réel.
Les jeux de données zero-copy prennent actuellement en charge :
Recherche en texte intégral
Filtrage
Triage des colonnes
Comptage des résultats
Pagination
Récupération du schéma
Certaines fonctionnalités disponibles sur les jeux de données dupliquées ne sont pas actuellement disponibles sur les jeux de données zero-copy, bien que l’expérience évolue. Pour le moment, les jeux de données zero-copy ne prennent pas en charge Explore by Query, les insights IA, l’exportation, la console API, les vues personnalisées ou les pages Studio.
Comment créer des jeux de données zero-copy
Les jeux de données zero-copy, ou jeux de données virtualisés, sont créés en masse via des harvesters :
Dans votre back office, allez à Catalogue > Moissonneurs et cliquez sur Créer un moissonneur
Sélectionnez le moissonneur concerné et saisissez un nom
Configurez la connexion et les paramètres requis pour la source
Passez en revue les options disponibles et la configuration des métadonnées
Cliquez sur Aperçu pour vérifier le résultat
Cliquez sur Démarrer le moissonneur
Passez en revue les actifs créés et cliquez sur Publiez pour rendre disponibles les actifs
N'oubliez pas, comme pour les autres harvesters, les actifs créés ne sont pas automatiquement publiés. Cela vous permet de les examiner avant de les rendre disponibles sur le marketplace.
Configurer des harvesters spécifiques
Les harvesters Snowflake et Databricks vous permettent de importer en masse des actifs et les virtualiser.
N'oubliez pas que, bien que les harvesters créent plusieurs actifs sans copie, les Snowflake et Databricks connecteurs copient des actifs importés individuels.
La configuration de ces harvesters est similaire à celle utilisée pour configurer leurs connecteurs correspondants.
Harvester Snowflake
Voir ici pour plus de détails sur la configuration des différents paramètres.
Harvester Databricks
Voir ici pour plus de détails sur la configuration des différents paramètres.


