BigQuery est un service web RESTful intégré à Google Cloud Plateform qui permet l'analyse des données en collaboration avec l'espace de stockage Google. C'est un logiciel en tant que service (Software as a service : SaaS) qui peut être utilisé en complément de MapReduce.
| Développé par | |
|---|---|
| Dépôt | github.com/GoogleCloudPlatform/bigquery-utils |
| État du projet | En activité |
| Langues | Anglais |
| Type |
Cloud computing Interface de programmation Logiciel en tant que service |
| Site web | cloud.google.com/bigquery |
BigQuery est également un entrepôt de données de Google, en mode Saas, modifiable dans le langage de requête SQL legacy ou en standard. Celui-si contient des jeux de données (datasets) qui contiennent des tables ou des vues.
Histoire
modifierBigQuery débute en version alpha en mai 2010. Il est rendu disponible en novembre 2011, lors de la conférence Google Atmosphère[1].
En 2014, MapR présente le projet Apache Drill, qui vise à résoudre des problèmes similaires[2].
En avril 2016, les utilisateurs européens du service ont subi une interruption de 12 heures[3].
Depuis mai 2016, les Feuilles de calcul Google peuvent utiliser BigQuery[4].
Conception
modifierBigQuery fournit un accès externe à la technologie Dremel[5],[6], un système évolutif, interactif ad hoc sur le système de requête pour l'analyse de la lecture seule de données imbriquées. Pour utiliser des données dans BigQuery, celles-ci doivent d'abord être téléchargées sur le stockage de Google et ensuite importées à l'aide de l'API HTTP. Il exige que toutes les demandes soient authentifiées via un mécanisme d'authentification OAuth[réf. nécessaire].
Fonctionnalités
modifier- Entrepôt de données sans serveur[7].
- Analyse en temps réel.
- Haute disponibilité automatique.
- Langage SQL standard.
- Requêtes fédérées et entreposage de données logique.
- Séparation du stockage et des calculs.
- Sauvegarde automatique et restauration facile.
- Fonctions et types de données géospatiaux.
- Service de transfert de données.
- Intégration à un écosystème de big data.
- Évolutivité à l'échelle du pétaoctet.
- Modèles tarifaires flexibles.
- Chiffrement des données et sécurité.
- Localité des données.
- Base pour l'IA.
- Base pour la veille stratégique.
- Ingestion flexible des données.
- Gouvernance des données.
- Interaction automatisée.
- Surveillance et journalisation complètes avec Stackdriver.
- Maîtrise des coûts
Caractéristiques
modifier- La gestion des données - créer et supprimer des tables sur la base d'un schéma codé JSON, importer des données codées au format CSV ou JSON à partir de l'espace de stockage Google.
- Requête - les requêtes sont exprimées dans la norme du langage SQL[8] et les résultats sont retournés en JSON avec une réponse de taille maximale de 128 Mo, ou de taille illimitée, lorsque le critère "grands résultats" est activé[9].
- Intégration - BigQuery peut être utilisé à partir de Google Apps Script, les feuilles de calcul Google, ou n'importe quel langage qui peut travailler avec son API REST ou les bibliothèques client[10].
- Contrôle d'accès - il est possible de partager l'accès aux jeux de données avec une personne, un groupe, ou le monde.
- Le service est gratuit jusqu'à 1 To de données analysées par mois et 10 Go de données stockées[7].
Références
modifier- (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « BigQuery » (voir la liste des auteurs).
- ↑ Iain Thomson, « Google opens BigQuery for cloud analytics: Dangles free trial to lure doubters », 14 novembre 2011 (consulté le 26 août 2016)
- ↑ Neil McAllister, « Is your data boring? MapR wants you to bore it back with Apache Drill: New release adds support for Google-y SQL-on-Hadoop tech », 16 septembre 2014 (consulté le 26 août 2016)
- ↑ Simon Sharwood, « Google Euro-cloud glitch », 7 avril 2016 (consulté le 26 août 2016)
- ↑ Jordan Novet, « Google BigQuery now lets you analyze data from Google Sheets », 6 mai 2016 (consulté le 26 août 2016)
- ↑ Sergey Melnik, Andrey Gubarev, Jing Jing Long, Geoffrey Romer, Shiva Shivakumar, Matt Tolton et Theo Vassilakis, « Dremel: Interactive Analysis of Web-Scale Datasets », Proc. of the 36th International Conference on Very Large Data Bases (VLDB), 2010
- ↑ Kazunori Sato, « An Inside Look at Google BigQuery », Google, 2012 (consulté le 26 août 2016)
- « google cloud platform », sur cloud.google.com
- ↑ « SQL Reference » (consulté le 26 juin 2017)
- ↑ « Quota Policy » (consulté le 26 juin 2017)
- ↑ « BigQuery Client Libraries » (consulté le 26 juin 2017)
Liens externes
modifier