Η έκδοση Simple ML και οι επιπτώσεις της στα μεγάλα δεδομένα για τους χρήστες των Φύλλων

Η έκδοση Simple ML και οι επιπτώσεις της στα μεγάλα δεδομένα για τους χρήστες των Φύλλων

Dezember 17, 2022 0 Von admin

Το Simple ML της Google κυκλοφόρησε σε έκδοση beta για χρήστες Φύλλων. Τι θα μπορούσε να σημαίνει αυτό για τα μεγάλα σύνολα δεδομένων σας;

Ανοίγει το υπολογιστικό φύλλο των Υπολογιστικών φύλλων Google που παρουσιάζει πώς να χρησιμοποιήσετε τη νέα επέκταση Simple ML
Εικόνα: Google Workspace

Την περασμένη εβδομάδα, η Google ανακοίνωσε και κυκλοφόρησε μια beta έκδοση του Simple ML for Sheets, ενός πρόσθετου που παρήχθη από το TensorFlow Decision Forests για Φύλλα Google. Αυτή η έκδοση είναι μία από τις πρώτες του είδους της, προσφέροντας πολλές απλές και μερικές σύνθετες λειτουργίες μηχανικής εκμάθησης απευθείας στους χρήστες των Φύλλων Google.

ΔΕΙΤΕ: Κιτ πρόσληψης: Μηχανικός μηχανικής εκμάθησης (TechRepublic Premium)

Αν και το Simple ML έχει διαφημιστεί ως η λύση μηχανικής εκμάθησης για άτομα που δεν έχουν προηγούμενη γνώση μηχανικής μάθησης, οι Προηγμένες εργασίες που προσφέρει υπόσχονται αξία σε επιστήμονες δεδομένων, ειδικούς μηχανικής μάθησης και σε οποιονδήποτε άλλο εργάζεται με μεγαλύτερα σύνολα δεδομένων. Διαβάστε παρακάτω για να μάθετε περισσότερα σχετικά με αυτήν την έκδοση και πώς μπορεί να διαμορφώσει στο μέλλον έργα δεδομένων και μηχανικής εκμάθησης που βασίζονται σε υπολογιστικά φύλλα.

Πηδάω σε:

Γρήγορα στοιχεία για την έκδοση Simple ML

Το Simple ML for Sheets είναι προς το παρόν διαθέσιμο σε έκδοση beta. Το πρόσθετο των Φύλλων Google δημιουργήθηκε από μια ομάδα προγραμματιστών του TensorFlow για να κάνει τη μηχανική εκμάθηση προσβάσιμη στους χρήστες των Υπολογιστικών φύλλων, ακόμα κι αν δεν έχουν προηγούμενες γνώσεις μηχανικής εκμάθησης. Αυτό επιτυγχάνεται κυρίως μέσω προεκπαιδευμένων μοντέλων ML και άλλων χαρακτηριστικών χωρίς κώδικα.

ΔΕΙΤΕ: Έρευνα: Η αυξημένη χρήση πλατφορμών χαμηλού κώδικα/χωρίς κώδικα δεν αποτελεί απειλή για τους προγραμματιστές (TechRepublic Premium)

Αυτό το πρόσθετο μηχανικής εκμάθησης έχει σχεδιαστεί για να υποστηρίζει δύο κύριες εργασίες ML: την πρόβλεψη τιμών που λείπουν και τον εντοπισμό μη φυσιολογικών τιμών. Ωστόσο, το Simple ML for Sheets μπορεί επίσης να χρησιμοποιηθεί για πιο προηγμένες περιπτώσεις χρήσης, όπως εκπαίδευση, αξιολόγηση και ανάλυση μοντέλων ML. Ιδιαίτερα για επιστήμονες δεδομένων και πιο προχωρημένους χρήστες που θέλουν να εκτελέσουν το Simple ML για να κάνουν προβλέψεις, πιθανότατα θα χρειαστεί να χρησιμοποιηθούν οι προηγμένες εργασίες του Simple ML.

Τα πιο συναρπαστικά χαρακτηριστικά του Simple ML περιλαμβάνουν:

  • Εργασίες αρχαρίων για αυτοματοποιημένη και απλή λειτουργικότητα ML
  • Προηγμένες εργασίες για εκπαίδευση και διαχείριση μοντέλων ML
  • Εκπαίδευση μοντέλων μέσω WebAssembly στο πρόγραμμα περιήγησης
  • Υποστήριξη για τη δημιουργία πρωτοτύπων σε πίνακες δεδομένων
  • Εξαγωγή μοντέλου για υπηρεσία TensorFlow, Colab και TensorFlow
  • Συμβατότητα C++, Go και JavaScript
  • Καμία κοινή χρήση δεδομένων με τρίτους
  • Τα μοντέλα αποθηκεύτηκαν στο Google Drive για εύκολη πρόσβαση και κοινή χρήση

Πώς λειτουργεί το Simple ML;

Μόλις εγκατασταθεί το Simple ML for Sheets στη βιβλιοθήκη πρόσθετων, μπορεί να χρησιμοποιηθεί για την πρόβλεψη τιμών που λείπουν και τον εντοπισμό μη φυσιολογικών τιμών σε ένα σύνολο δεδομένων. Οι χρήστες θα ξεκινήσουν ανοίγοντας τα δεδομένα τους στα Φύλλα Google και επιλέγοντας ποια από αυτές τις δύο εργασίες ταιριάζει καλύτερα στο έργο τους.

Αφού κάνουν την επιλογή τους, οι χρήστες θα πρέπει να εκτελέσουν αυτήν την εργασία. μπορούν να αναμένουν ότι θα έχουν τις στατιστικές προβλέψεις του Simple ML σε λίγα δευτερόλεπτα.

Για την πρόβλεψη τιμών που λείπουν, το Simple ML εκπαιδεύει ένα μοντέλο στις τιμές που δεν λείπουν που παρέχονται σε ένα σύνολο δεδομένων. Για τον εντοπισμό μη φυσιολογικών τιμών, το Simple ML εκπαιδεύει ένα σύνολο μοντέλων με διασταυρούμενη επικύρωση για την πρόβλεψη των τιμών που υπάρχουν αυτήν τη στιγμή. Στη συνέχεια, με βάση τον τρόπο με τον οποίο διαφέρουν τα πραγματικά δεδομένα και τα προβλεπόμενα δεδομένα, το Simple ML θα εντοπίσει μη φυσιολογικά μέρη του συνόλου δεδομένων και θα παρέχει μια βαθμολογία πιθανότητας ανωμαλίας μεταξύ 0% και 100%.

ΔΕΙΤΕ: Μηχανική εκμάθηση: Ένα φύλλο εξαπάτησης (TechRepublic)

Από εκεί, οι χρήστες μπορούν να ελέγξουν το μοντέλο που δημιουργείται από ML και να το χρησιμοποιήσουν ως οδηγό για τυχόν αλλαγές που πρέπει να κάνουν στο σύνολο δεδομένων τους.

Τα μοντέλα αποθηκεύονται αρχικά σε έναν φάκελο του Google Drive που ονομάζεται simple_ml_for_sheets. Για να λειτουργήσει σωστά το Simple ML, οι χρήστες θα πρέπει να ενημερώσουν τις ρυθμίσεις τους, επομένως το Simple ML έχει τα ακόλουθα δικαιώματα:

  • Δείτε, επεξεργαστείτε, δημιουργήστε και διαγράψτε όλα τα αρχεία του Google Drive
  • Δείτε, επεξεργαστείτε, δημιουργήστε και διαγράψτε όλα τα υπολογιστικά φύλλα των Φύλλων Google
  • Εμφάνιση και εκτέλεση προτροπών και πλευρικών γραμμών περιεχομένου ιστού τρίτων εντός των εφαρμογών Google

Συμβουλές και κόλπα για τη χρήση του Simple ML

Αν και το Simple ML είναι γρήγορο και αρκετά ακριβές, εξακολουθεί να είναι σημαντικό για τους χρήστες να κατανοούν πώς να ρυθμίζουν τα δεδομένα τους και να διαβάζουν το μοντέλο που δημιουργήθηκε πρόσφατα για επιτυχία.

Πρώτον, οι χρήστες πρέπει να κατανοήσουν ότι η προγνωστική ανάλυση ML είναι δυνατή μόνο εάν παρέχεται ένα αρκετά μεγάλο σύνολο δεδομένων για εκπαίδευση μοντέλων. Τουλάχιστον 20 γραμμές δεδομένων πρέπει να υπάρχουν για ένα αξιόλογο μοντέλο, αλλά 100+ γραμμές δεδομένων είναι προτιμότερο και είναι πιο πιθανό να δημιουργήσουν ένα ακριβές μοντέλο.

Επίσης, γενικά, είναι σημαντικό να θυμάστε ότι τα προγνωστικά δεδομένα που δημιουργούνται από μοντέλα Simple ML είναι ακριβώς αυτό — προγνωστικά. Ενώ μπορεί να πλησιάσει τις πραγματικές τιμές δεδομένων που λείπουν, είναι σημαντικό για ομάδες επαγγελματιών της επιστήμης δεδομένων να επανεξετάσουν το μοντέλο πριν καλύψουν τα κενά.

Πώς να εγκαταστήσετε το Simple ML

Για να εγκαταστήσουν το Simple ML for Sheets, οι χρήστες θα πρέπει να επισκεφτούν την καρτέλα Extensions, να τοποθετήσουν το δείκτη του ποντικιού πάνω από τις επιλογές Add-ons και να κάνουν κλικ στο Get add-ons. Από εκεί και πέρα, είναι μια αρκετά απλή διαδικασία να αναζητήσετε και να εγκαταστήσετε το Simple ML.

Χρήση Simple ML για έργα που βασίζονται σε μεγάλα δεδομένα

Παρόλο που το Simple ML είναι πραγματικά απλό και επικεντρώνεται σε ένα πελατολόγιο λιγότερο έμπειρο στο ML, οι ειδικοί σε μεγάλα δεδομένα και μηχανική εκμάθηση μπορούν να χρησιμοποιήσουν αυτό το εργαλείο για να διαχειριστούν και να αντλήσουν περαιτέρω πληροφορίες από τα σύνολα δεδομένων και τα υπάρχοντα μοντέλα τους. Το εργαλείο είναι αρκετά ευέλικτο για τη διαχείριση πολύ μεγάλων συνόλων δεδομένων, επιτρέποντας στους χρήστες να εκτελούν μοντέλα για εκατομμύρια γραμμές δεδομένων χωρίς ερωτήματα SQL. Είναι επίσης ένα πλεονεκτικό πρόσθετο για τους χρήστες του Google BigQuery, επειδή το Simple ML είναι σε θέση να αναλύει δεδομένα σε περιπτώσεις αυτής της αποθήκης δεδομένων cloud.

ΔΕΙΤΕ: Οδηγός αποθήκης δεδομένων Cloud και λίστα ελέγχου (TechRepublic Premium)

Πώς ακριβώς μπορεί να αξιοποιηθεί το Simple ML για πιο σύνθετα έργα μεγάλων δεδομένων; Εν συντομία, εδώ είναι μερικές από τις επιλογές Advanced Task που προσφέρει το Simple ML για αυτό το είδος χρήστη:

  • Εκπαιδεύστε ένα μοντέλο: Με αυτήν την εργασία, οι χρήστες μπορούν να εκπαιδεύσουν τα δικά τους μοντέλα μηχανικής εκμάθησης με τιμές δεδομένων εκπαίδευσης που παρέχουν σε μορφή πίνακα.
  • Κανω προβλεψεις: Αυτή η εργασία προβλέπει τιμές στηλών σε κάθε σειρά, αντί να λείπουν απλώς τιμές, με βάση ένα ήδη εκπαιδευμένο μοντέλο.
  • Αξιολογήστε ένα μοντέλο: Αυτή η εργασία μετρά την ποιότητα του εκπαιδευμένου μοντέλου με βάση τις ετικέτες και τις μετρήσεις που χρησιμοποιήθηκαν για την εκπαίδευση του μοντέλου. Εάν πρόκειται για μοντέλο με κατηγορηματική σήμανση, αυτή η εργασία θα μετρήσει κυρίως την ακρίβεια. Εάν βασίζεται σε ένα μοντέλο με αριθμητική σήμανση, οι μετρήσεις παλινδρόμησης όπως το RMSE θα είναι το επίκεντρο.
  • Κατανοήστε ένα μοντέλο: Με αυτήν την εργασία, οι χρήστες μπορούν να μάθουν όλα τα είδη στοιχείων για ένα προηγούμενο μοντέλο. Το παράθυρο κατανόησης μοντέλου προσφέρει πληροφορίες σχετικά με την ημερομηνία εκπαίδευσης, τις στήλες προορισμού και πηγής, την ποιότητα, τα στατιστικά στοιχεία στηλών, τις σημαντικές δυνατότητες εισαγωγής και τις προβλέψεις.
  • Εξαγωγή μοντέλου: Με την εργασία εξαγωγής, οι χρήστες μπορούν να εξάγουν ένα μοντέλο που θα χρησιμοποιηθεί στην υπηρεσία TensorFlow, Colab ή/και Tensorflow. Ωστόσο, τα μοντέλα μπορούν να εκτελεστούν απευθείας για χρήστες C++, Go και JavaScript.

Κάνοντας το Simple ML να λειτουργεί για σύνθετες περιπτώσεις χρήσης

Για τις απλές λειτουργίες για τις οποίες έχει σχεδιαστεί κυρίως το Simple ML, οι χρήστες δεν θα πρέπει να αντιμετωπίζουν προβλήματα με την επεξεργασία δεδομένων και τη γρήγορη δημιουργία μοντέλων. Ωστόσο, όπως συμβαίνει με πολλά εργαλεία ως κλίμακα εισόδου, θα μπορούσαν να προκύψουν νέα προβλήματα με μεγαλύτερα σύνολα δεδομένων.

Για παράδειγμα, τα εξαιρετικά μεγάλα σύνολα δεδομένων μπορεί να απαιτούν πολλά λεπτά αντί για δευτερόλεπτα για να εκπαιδευτεί ένα μοντέλο ή να δημιουργηθούν προβλέψεις. Ο χρόνος επεξεργασίας μπορεί να είναι ακόμη μεγαλύτερος για σύνολα δεδομένων που περιέχουν κείμενο ή άλλα μη δομημένα δεδομένα.

Τούτου λεχθέντος, το Simple ML είναι ακόμα σε beta και οι βελτιστοποιήσεις γίνονται τακτικά. Η ομάδα Simple ML είναι ανοιχτή σε νέους χρήστες δοκιμών καθώς και σε προτάσεις αλγορίθμων, επομένως τώρα είναι η ώρα για τους επιστήμονες δεδομένων να μάθουν πώς λειτουργεί αυτό το εργαλείο και πώς θα μπορούσε να ενσωματωθεί στις επιχειρηματικές λειτουργίες.

Διαβάστε παρακάτω: Κορυφαία εργαλεία μοντελοποίησης δεδομένων (TechRepublic)