Preparare i dati con Gemini

Questo documento descrive come generare e gestire suggerimenti di codice SQL per la preparazione dei dati in BigQuery.

Per ulteriori informazioni, consulta Introduzione alla preparazione dei dati di BigQuery.

Prima di iniziare

Aprire l'editor di preparazione dei dati in BigQuery

Puoi aprire l'editor di preparazione dei dati in BigQuery creando una nuova preparazione dei dati, una da una tabella esistente o aprendo una preparazione dei dati esistente. Per saperne di più su cosa accade quando crei una preparazione dei dati, consulta Punti di contatto per la preparazione dei dati.

Nella pagina BigQuery, puoi accedere all'editor di preparazione dei dati in modi diversi:

Crea nuovo

Per creare una nuova preparazione dei dati in BigQuery, segui questi passaggi:

  1. Nella console, vai alla pagina BigQuery. Google Cloud
    Vai a BigQuery
  2. Vai all'elenco Crea nuovo e fai clic su Preparazione dei dati. L'editor di preparazione dei dati viene visualizzato in una nuova scheda di preparazione dei dati senza titolo.
  3. Nella barra di ricerca dell'editor, inserisci il nome della tabella o le parole chiave e seleziona una tabella. Si apre l'editor di preparazione dei dati per la tabella, che mostra un'anteprima dei dati nella scheda Dati e un primo insieme di suggerimenti di preparazione dei dati di Gemini.

    Nel riquadro Explorer viene visualizzata una risorsa Preparazione dei dati, dove potrai accedere a questa preparazione in futuro.
  4. (Facoltativo) Per semplificare la visualizzazione, attiva la modalità a schermo intero facendo clic su schermo intero Schermo intero.

Crea nuovo dalla tabella

Per creare una nuova preparazione dei dati da una tabella esistente:

  1. Nella Google Cloud console, vai alla pagina BigQuery.
    Vai a BigQuery
  2. Nel riquadro Explorer, tieni il puntatore del mouse sopra una tabella.
  3. Fai clic su more_vert Menu > Query in > Preparazione dei dati. Si apre l'editor di preparazione dei dati per la tabella, che mostra un'anteprima dei dati nella scheda Dati e un insieme iniziale di suggerimenti di preparazione dei dati di Gemini.

    Nel riquadro Explorer viene visualizzata una risorsa Preparazione dei dati, dove potrai accedere a questa preparazione in futuro.
  4. (Facoltativo) Per semplificare la visualizzazione, attiva la modalità a schermo intero facendo clic su schermo intero Schermo intero.

Apri esistente

Per aprire l'editor di una preparazione dei dati esistente:

  1. Nella Google Cloud console, vai alla pagina BigQuery.
    Vai a BigQuery
  2. Nel riquadro Explorer, fai clic sul nome del progetto e su Preparazione dei dati.
  3. Seleziona la preparazione dei dati esistente. Viene visualizzata la visualizzazione del grafico della pipeline di preparazione dei dati.
  4. Seleziona uno dei nodi del grafico. Si apre l'editor di preparazione dei dati per la tabella, che mostra un'anteprima dei dati nella scheda Dati e un primo insieme di suggerimenti di preparazione dei dati di Gemini.
  5. (Facoltativo) Per semplificare la visualizzazione, attiva la modalità a schermo intero facendo clic su schermo intero Schermo intero.

Aggiungere i passaggi di preparazione dei dati

Prepara i dati in più passaggi. Puoi visualizzare l'anteprima o applicare i passaggi suggeriti da Gemini. Puoi anche migliorare i suggerimenti o applicare i tuoi passaggi.

Applicare e migliorare i suggerimenti di Gemini

Quando apri l'editor di preparazione dei dati per la tabella, Gemini esamina i dati e lo schema della tabella caricata e genera suggerimenti per filtri e trasformazioni. I suggerimenti vengono visualizzati nelle schede dell'elenco Passaggi.

L'immagine seguente mostra dove puoi applicare e migliorare i passaggi suggeriti da Gemini:

Visualizzazione dei dati nell'editor di preparazione dei dati che mostra le opzioni per visualizzare l'anteprima, modificare o applicare i suggerimenti di Gemini.

Per applicare un suggerimento di Gemini come passaggio di preparazione dei dati, svolgi quanto segue:

  1. Nella visualizzazione dei dati, fai clic sul nome di una colonna o su una cella specifica. Gemini genera suggerimenti per filtrare e trasformare i dati.
  2. (Facoltativo) Per migliorare i suggerimenti, modifica i valori di una o tre celle nella tabella per mostrare come devono essere i valori in una colonna. Ad esempio, inserisci una data nel formato che vuoi applicare a tutte le date. Gemini genera nuovi suggerimenti in base alle tue modifiche.

    L'immagine seguente mostra come modificare i valori per migliorare i passaggi suggeriti da Gemini:

    Migliora i suggerimenti modificando i valori nelle celle per mostrare come devono essere i valori nella colonna.

  3. Seleziona una scheda di suggerimento.

    1. (Facoltativo) Per visualizzare l'anteprima del risultato della scheda del suggerimento, fai clic su Anteprima.
    2. (Facoltativo) Per modificare la scheda del suggerimento utilizzando il linguaggio naturale, fai clic su Modifica.
  4. Fai clic su Applica.

Aggiungere passaggi con linguaggio naturale o espressioni SQL

Se i suggerimenti esistenti non soddisfano le tue esigenze, aggiungi un passaggio. Scegli le colonne o un tipo di passaggio, quindi descrivi ciò che vuoi utilizzando il linguaggio naturale.

Aggiungi una trasformazione

  1. Nella visualizzazione dei dati o dello schema, scegli l'opzione Trasforma. Puoi anche scegliere le colonne o aggiungere esempi per aiutare Gemini a comprendere la trasformazione dei dati.
  2. Nel campo Descrizione, inserisci un prompt, ad esempio Convert the state column to uppercase.
  3. Fai clic su Invia Invia.

    Gemini genera un'espressione SQL e una nuova descrizione in base al tuo prompt.

  4. Nell'elenco Colonna target, seleziona o inserisci il nome di una colonna.

  5. (Facoltativo) Per aggiornare l'espressione SQL, rivedi il prompt e fai clic su send Invia oppure inserisci manualmente un'espressione SQL.

  6. (Facoltativo) Fai clic su Anteprima ed esamina il passaggio.

  7. Fai clic su Applica.

Filtra le righe

Per aggiungere un filtro che rimuove le righe:

  1. Nella visualizzazione dei dati o dello schema, scegli l'opzione Filtra. Puoi anche scegliere le colonne per aiutare Gemini a comprendere il filtro dei dati.
  2. Nel campo Descrizione, inserisci un prompt, ad esempio Column ID should not be NULL.
  3. Fai clic su Genera. Gemini genera un'espressione SQL e una nuova descrizione in base al tuo prompt.
  4. (Facoltativo) Per aggiornare l'espressione SQL, rivedi il prompt e fai clic su invia Invia oppure inserisci un'espressione SQL manualmente.
  5. (Facoltativo) Fai clic su Anteprima ed esamina il passaggio.
  6. Fai clic su Applica.

Formato dell'espressione di filtro

Le espressioni SQL per i filtri mantengono le righe che corrispondono alla condizione specificata. Questo è equivalente a un'istruzione SELECT … WHERE SQL_EXPRESSION.

Ad esempio, per conservare i record in cui la colonna year è maggiore o uguale a 2000, la condizione è year >= 2000.

Le espressioni devono rispettare la sintassi SQL di BigQuery per la clausola WHERE.

Configura la tabella degli errori e aggiungi una regola di convalida

Puoi aggiungere un filtro che crea una regola di convalida, che invia gli errori a una tabella degli errori o causa l'interruzione dell'esecuzione della preparazione dei dati.

Configurare la tabella degli errori

Per configurare la tabella degli errori:

  1. Nell'editor di preparazione dei dati, vai alla barra degli strumenti e fai clic su Altro > Tabella degli errori.
  2. Fai clic su Attiva tabella degli errori.
  3. Definisci la posizione della tabella.
  4. (Facoltativo) Definisci una durata massima per la conservazione degli errori.
  5. Fai clic su Salva.

Aggiungere una regola di convalida

Per aggiungere una regola di convalida:

  1. Nella visualizzazione dei dati o dello schema, fai clic sull'opzione Filtro. Puoi anche scegliere le colonne per aiutare Gemini a comprendere il filtro dei dati.
  2. Inserisci una descrizione per il passaggio.
  3. Inserisci un'espressione SQL sotto forma di clausola WHERE.
  4. (Facoltativo) Se vuoi che l'espressione SQL agisca come regola di convalida, seleziona la casella di controllo Le righe di convalida con errori vengono inviate alla tabella degli errori. Puoi anche cambiare un filtro in una convalida nella barra degli strumenti di preparazione dei dati facendo clic su Altro > Tabella degli errori.
  5. (Facoltativo) Fai clic su Anteprima ed esamina il passaggio.
  6. Fai clic su Applica.

Eliminare una colonna

Per eliminare una o più colonne da una preparazione dei dati:

  1. Nella visualizzazione dei dati o dello schema, seleziona le colonne da eliminare.
  2. Fai clic su Declina. Viene aggiunto un nuovo passaggio applicato per le colonne eliminate.

Aggiungere un'operazione di join con Gemini

Per aggiungere un passaggio di operazione di join tra due origini nella preparazione dei dati:

  1. Nella visualizzazione dei dati di un nodo nella preparazione dei dati, vai all'elenco Suggerimenti e fai clic sull'opzione Unisci.
  2. Nella finestra di dialogo Aggiungi join, fai clic su Sfoglia e seleziona l'altra tabella coinvolta nell'operazione di join (indicata come lato destro del join).
  3. (Facoltativo) Seleziona il tipo di operazione di join da eseguire, ad esempio join interno.
  4. Esamina le informazioni chiave di join generate da Gemini nei seguenti campi:

    • Descrizione del join: la descrizione in linguaggio naturale dell'espressione SQL per l'operazione di join. Quando modifichi questa descrizione e fai clic su Invia Invia, Gemini suggerisce nuove condizioni di join SQL.
    • Condizioni di join: le espressioni SQL all'interno della clausola ON per l'operazione di join. Puoi utilizzare i qualificatori L e R per fare riferimento rispettivamente alle tabelle di origine sinistra e destra. Ad esempio, per unire la colonna customer_id della tabella a sinistra alla colonna customer_id della tabella a destra, inserisci L.customerId = R.customerId. Questi qualificatori non sono sensibili alle maiuscole.

  5. (Facoltativo) Per perfezionare i suggerimenti di Gemini, modifica il campo Descrizione dell'unione e poi fai clic su Invia Invia.

  6. (Facoltativo) Per visualizzare l'anteprima delle impostazioni dell'operazione di join della preparazione dei dati, fai clic su Anteprima.

  7. Fai clic su Applica.

    Viene creato il passaggio dell'operazione di unione. La tabella di origine selezionata (lato destro della congiunzione) e l'operazione di congiunzione vengono riportate nell'elenco dei passaggi applicati e nei nodi nella visualizzazione del grafico della preparazione dei dati.

Aggiungere o modificare una tabella di destinazione

Per aggiungere o modificare una tabella di destinazione per l'output della preparazione dei dati:

  1. Nella visualizzazione dei dati o dello schema, scegli l'opzione Destinazione.
  2. Seleziona il progetto in cui è archiviata la tabella di destinazione.
  3. Seleziona uno dei set di dati o caricane uno nuovo.
  4. Inserisci una tabella di destinazione. Se la tabella non esiste, la preparazione dei dati ne crea una nuova alla prima esecuzione. Per ulteriori informazioni, vedi Modalità di scrittura.
  5. Seleziona il set di dati di destinazione.
  6. Fai clic su Salva.

Visualizzare il campione e lo schema dei dati per un passaggio applicato

Per visualizzare i dettagli del campione e dello schema in un determinato passaggio della preparazione dei dati:

  1. Nell'editor di preparazione dei dati, vai all'elenco Passaggi e fai clic su Passaggi applicati.
  2. Seleziona un passaggio. Vengono visualizzate le schede Dati e Schema, che mostrano il campione di dati e lo schema a partire da questo passaggio specifico.

Modificare un passaggio applicato

Per modificare un passaggio applicato:

  1. Nell'editor di preparazione dei dati, vai all'elenco Passaggi e fai clic su Passaggi applicati.
  2. Seleziona un passaggio.
  3. Accanto al passaggio, fai clic su more_vert Menu > Modifica.
  4. Nella finestra di dialogo Modifica il passaggio applicato, puoi:
    • Modifica la descrizione del passaggio.
    • Ricevi suggerimenti da Gemini modificando la descrizione e facendo clic su Invia Invia.
    • Modifica l'espressione SQL.
  5. Nel campo Colonna di destinazione, seleziona una colonna.
  6. (Facoltativo) Fai clic su Anteprima ed esamina il passaggio.
  7. Fai clic su Applica.

Eliminare un passaggio applicato

Per eliminare un passaggio applicato:

  1. Nell'editor di preparazione dei dati, vai all'elenco Passaggi e fai clic su Passaggi applicati.
  2. Seleziona un passaggio.
  3. Fai clic su more_vert Menu > Elimina.

Esegui la preparazione dei dati

Dopo aver aggiunto i passaggi di preparazione dei dati, configurato la destinazione e corretto eventuali errori di convalida, puoi eseguire prove su un campione di dati o implementare i passaggi e pianificare le esecuzioni di preparazione dei dati. Per ulteriori informazioni, consulta Pianificare le preparazioni dei dati.

Aggiorna i campioni di preparazione dei dati

I dati nel campione non vengono aggiornati automaticamente. Se i dati nelle tabelle di origine per la preparazione dei dati sono cambiati, ma le modifiche non vengono applicate al campione di dati della preparazione, fai clic su Altro > Aggiorna campione.

Passaggi successivi