Comprendere Copilot per l'Ingegneria dei Dati e la Data Science
Copilot per la Data Engineering e la Data Science in Microsoft Fabric è un assistente basato sull'intelligenza artificiale che supporta attività comuni in questi ambiti. Fornisce suggerimenti di codice contestualizzati e risposte in linguaggio naturale per le attività in domini di data engineering e data science. È disponibile direttamente in un notebook, consentendo di interagire con i dati e il codice.
Concetti chiave
I concetti fondamentali seguenti descrivono il funzionamento di Copilot per data engineering e data science.
La generazione di codice assistito dall'intelligenza artificiale consente di descrivere i requisiti di integrazione dei dati in linguaggio naturale, ad esempio "Caricare i dati di vendita da CSV e filtrare per l'ultimo trimestre". Copilot genera quindi il codice e i passaggi necessari, riducendo il tempo impiegato per la ricerca della sintassi o la risoluzione degli errori. Ciò è particolarmente utile per gli utenti che hanno difficoltà a ricordare comandi Pandas o Spark complessi.
Con la spiegazione del codice, Copilot può chiarire cosa fa un blocco di codice, semplificando la comprensione di query complesse o script non familiari. Ad esempio, se si verifica una trasformazione dei dati in più passaggi e non si è certi del funzionamento, Copilot fornisce un riepilogo in linguaggio normale, aiutandoti a imparare ed evitare errori.
La visualizzazione consente di creare grafici e diagrammi dai dati. Se non si è certi di come tracciare le tendenze o confrontare le categorie, chiedere a Copilot di visualizzare il set di dati. Questa funzionalità consente agli utenti che trovano difficile selezionare la visualizzazione corretta o scrivere codice di tracciato, rendendo più intuitiva l'esplorazione dei dati. Il completamento del codice in linea offre suggerimenti in tempo reale mentre digiti in una cella del notebook, senza aprire il riquadro della chat. L'aggiunta di un commento sopra il codice consente di guidare la direzione del suggerimento. Questo complementa l'assistente basato su chat per la creazione di codice continuo più fluida.
Data science
Per i data scientist che lavorano sull'apprendimento automatico, Copilot consente di creare ed eseguire il training di modelli. Se non si ha familiarità con l'apprendimento automatico o non si è certi di come iniziare, chiedere a Copilot di generare codice per attività come la suddivisione dei dati, il training di un modello di regressione e la valutazione dei risultati. Ciò riduce la barriera all'ingresso e consente di concentrarsi sui problemi aziendali anziché sui dettagli tecnici.
Usando queste funzionalità, è possibile superare le sfide comuni, ad esempio la mancanza di esperienza di codifica, la difficoltà a comprendere la logica complessa e l'incertezza sulle procedure consigliate. Copilot consente di lavorare in modo più intelligente, imparare più velocemente e fornire informazioni dettagliate in modo più efficiente.
Ecco un esempio di come interagire con Copilot nel notebook:
Questo argomento verrà esaminato in modo più dettagliato in un modulo successivo.
Vantaggi
Usando Copilot per ingegneria dei dati e data science, è possibile eseguire attività comuni, ridurre alcuni errori e concentrarsi sulla derivazione di informazioni dettagliate e sulla creazione di modelli dai dati. Ecco alcune aree in cui può essere utile:
- Efficienza: automatizza le attività ripetitive.
- Accessibilità: supporta gli utenti abilitando le interazioni in linguaggio naturale.
- Accuratezza: fornisce suggerimenti basati sul contesto allineati alla struttura dei dati.
- Collaborazione: può essere utile per la documentazione e la condivisione degli output.