Η νέα τάση στα social media είναι τα AI avatars. Κανείς όμως δεν μιλάει για το πρόβλημα
Καθημερινά παράγονται και δημοσιεύονται εκατομμύρια ψηφιακά avatars παγκοσμίως, μέσω του Lensa και άλλων εφαρμογών. Ωστόσο, το επαναστατικό εργαλείο κρύβει θολά σημεία.
- 14 ΔΕΚ 2022
Ένα πραγματικό εξωπραγματικό εφέ παράγεται όταν συνειδητοποιείς πως έφτασε η εποχή που μπορείς να ταΐσεις ένα πρόγραμμα με λεκτικές περιγραφές, όπως «σύννεφα σε αλπικό τοπίο με πολλά δέντρα», και εκείνο να αποφέρει μια πρωτότυπη εικόνα με τα χαρακτηριστικά που ζήτησες.
Το επίτευγμα αυτό ανήκει στην τεχνολογία Generative AI, η οποία –σύμφωνα με την εξειδικευμένη στην τεχνολογία αιχμής εταιρία Gartner– αποτελεί την τάση τεχνητής νοημοσύνης που κυριάρχησε στα social media μέσα στο 2022, ενώ μέχρι το 2025 αναμένεται να αφορά το 10% των παραγόμενων δεδομένων.
Ποια είναι η ένδειξη για την κλιμάκωση που έρχεται καλπάζοντας; Τα «μαγικά άβαταρ» που ξεπετάγονται σαν μανιτάρια τις τελευταίες εβδομάδες στο feed των πιο επιδραστικών μέσων κοινωνικής δικτύωσης αυτή τη στιγμή, του Instagram και του TikTok. Διότι, το να μετατρέψεις κείμενο σε generic εικόνα δεν είναι τόσο ελκυστικό όσο το να παραλάβεις στα χέρια σου μια σειρά από selfies του εαυτού σου, λες και βγήκαν από άλλες ιστορικές εποχές, από πίνακες μεγάλων ζωγράφων ή χέρια ταλαντούχων illustrators.
Αλλά ουσιαστικά πίσω από τα δύο παραδείγματα παραγωγής περιεχομένου που αναφέραμε κρύβεται το ίδιο εργαλείο: πρόκειται για AI μοντέλο, το οποίο έχει τη δυνατότητα να χρησιμοποιεί διαφόρων τύπων αρχεία (πχ ηχητικά αρχεία, κείμενα και φωτογραφίες) για να παράξει νέο πλαστό περιεχόμενο. Δίνει, δηλαδή, τη δυνατότητα στο λογισμικό να εντοπίσει μοτίβα ανάμεσα σε άπειρα δεδομένα, δημιουργώντας νέο, παρόμοιο υλικό κατά παραγγελία.
Κάπως έτσι, μεγάλοι influencers μεταμορφώθηκαν σε ήρωες φαντασίας, αστροναύτες και αμαζόνες, τη στιγμή που οι ανησυχίες όλο και φουσκώνουν γύρω από το ανοιχτά διαθέσιμο εργαλείο και την τεχνολογία που, κατά το MIT, αποτελεί «μια από τις πιο πολλά υποσχόμενες εξελίξεις της περασμένης δεκαετίας στον κόσμο της τεχνητής νοημοσύνης».
Πώς μπορώ να χρησιμοποιήσω τα νέα AI εργαλεία
Πλέον, το εργαλείο παραγωγής «καθ’ ομοίωσιν» περιεχομένου περιλαμβάνεται στις δυνατότητες που προσφέρει το TikTok, βλέποντας το κύμα που αρχίζει να σηκώνεται.
Αλλά το ποιοτικότερο αποτέλεσμα εξασφαλίζουν οι δύο generators που έχουν κυριαρχήσει στην αγορά του ίντερνετ: πρώτο είναι το Lensa με πάνω από 12,6 εκατομμύρια εγκαταστάσεις το πρώτο δεκαήμερο του Δεκεμβρίου (+600% σε σχέση με τα στοιχεία του Νοεμβρίου) και έπειτα το δωρεάν για χρήση AI Time Machine, από το οποίο έχουν παραχθεί πάνω από 44 εκατομμύρια εικόνες στο διάστημα του τελευταίου μήνα.
Όσον αφορά το Lensa, η διαδικασία έχει ως εξής: ενώ είναι δωρεάν το download και παρέχεται επταήμερο free trial, η εφαρμογή ζητά 40 δολάρια/έτος για την εγγραφή νέου χρήστη, όπως και ένα επιπλέον μικρό ποσό (3.99 δολάρια) για τη χρήση του εργαλείου AI generator.
Έπειτα, χρειάζεται από τον νέο χρήστη μια σειρά από 10-20 selfies σε ποικιλία φόντων, γωνίας και εκφράσεων, ώστε να προκύψει το «βέλτιστο αποτέλεσμα». Και σε χρόνο-ρεκόρ, το «μηχάνημα» απλώνει 50 avatars (και παραπάνω, ανάλογα με το πακέτο της εγγραφής) σε 10 κατηγορίες, από anime και φαντασία μέχρι pop και πριγκιπικό εφέ.
Κάτι ανάλογο υλοποιεί το AI Time Machine, στοχευμένα στις ιστορικές περιόδους, έτσι που η μορφή σου μεταμορφώνεται σε καουμπόι στην άγρια Δύση, αρχαιοελληνικό πολεμιστή, Αιγύπτιο Φαραώ και κυρία της βικτωριανής εποχής.
Απαιτούνται και πάλι selfies απ’ τον χρήστη, σύμφωνα με τις αναγραφόμενες προδιαγραφές (ολόσωμες, πάνω μέρος, ανφάς κοκ), ενώ το βασικό προσόν του εργαλείου είναι ότι προς το παρόν παραμένει ελεύθερα διαθέσιμο στη σελίδα MyHeritage, με ανώτατο όριο παραγόμενων avatars ανά χρήστη.
Και ποιο είναι το πρόβλημα, τελικά
Ουσιαστικά, δεν πρόκειται για τεχνολογία που ανακαλύφθηκε τώρα, αλλά που διαδόθηκε τώρα: ενώ η παραγωγή νέου περιεχομένου βάσει κειμενικών και οπτικών μοτίβων ήταν τεχνολογική κατάκτηση του 2018, παρέμενε εγκλωβισμένη σε ένα μικρό αριθμό υψηλά ιστάμενων εταιριών, και αυτό που συνέβη το έτος 2022 και συγκεκριμένα τον Αύγουστο ήταν ότι η ίδια τεχνολογία μετατράπηκε σε open source, μέσω του προϊόντος Stable Diffusion που διατέθηκε στην αγορά. Αυτό είναι το επίμαχο «νευρικό σύστημα» που διατρέχει το Lensa κι ανάλογες εφαρμογές.
«Η αλήθεια είναι ότι πρόκειται σαν εξωγήινη τεχνολογία για τα δεδομένα μας, που παρέχει υπερδυνάμεις», δήλωσε επικεφαλής τεχνολογικής εταιρίας στο The Verge, «πρώτη φορά βλέπουμε παιδιά τριών ετών μέχρι και άτομα τρίτης ηλικίας να είναι σε θέση να δημιουργήσουν υλικό σε συνεργασία με μηχάνημα τεχνητής νοημοσύνης».
Το πρόβλημα είναι ότι μέσα στον ενθουσιασμό της καινούργιας AI ανακάλυψης, ελάχιστοι ασχολήθηκαν με τα ψιλά γράμματα της ιστορίας: Από τι αποτελείται τελικά εκείνος ο όγκος δεδομένων που τάισε τα λογισμικά;
Όπως είχε εξηγήσει το έγκριτο τεχνολογικό Μέσο της Αμερικής, αυτά τα εργαλεία τεχνητής νοημοσύνης μιμούνται έργα τέχνης, για τα οποία ούτε έχουν πάρει δικαιώματα, ούτε πρόκειται να αποδώσουν ποτέ το οικονομικό μέρισμα που αναλογεί στους δημιουργούς τους. Διότι, προφανώς, μέσα στον ωκεανό των δεδομένων που έχουν επεξεργαστεί για να εντοπίσουν μοτίβα και στυλ, περιλαμβάνονται επαγγελματικές υπογραφές ζωγράφων, φωτογράφων και illustrators.
Αλλά η πιο άμεση ανησυχία έχει να κάνει με τη μετέπειτα χρήση των προσωπικών δεδομένων: στις κλιμακούμενες αντιδράσεις από πλευράς του κόσμου για το εάν χρησιμοποιούνται οι selfies τους «για να εκπαιδευτεί περαιτέρω ο αλγόριθμος», η εταιρία διευκρίνισε στο Wired ότι επεξεργάζεται την ανανέωση της προσωπικής πολιτική της, θέλοντας να διευκρινίσει ότι «το Lensa εκπαιδεύεται να αναγνωρίζει το πρόσωπο του κάθε χρήστη ξεχωριστά – αυτό σημαίνει ότι κατασκευάζεται ψηφιακά διαφορετικό μοντέλο κάθε φορά, ενώ οι φωτογραφίες του χρήστη διαγράφονται από τους servers μόλις παραχθούν τα avatars».