Big Tech: Συμφωνίες για απόκτηση βίντεο, φωτογραφιών κ.ά. προκειμένου να εκπαιδεύσουν τα μοντέλα AΙ τους

Το πρακτορείο φωτογραφείων shutterstock / Φωτογραφία shutterstock

Το 2023 ήταν χωρίς αμφιβολία η χρονιά που η τεχνητή νοημοσύνη έκανε το μεγάλο «μπαμ». Πλέον οι εταιρείες που δραστηριοποιούνται στον χώρο δίνουν μάχη για το ποια θα έχει την πιο γρήγορη εξέλιξη. Χαρακτηριστικά παραδείγματα είναι η OpenAI, με την υποστήριξη της Microsoft, και η Google, ενώ άλλες μεγάλες εταιρείες όπως η Apple ετοιμάζουν τη δική τους κίνηση.

Τα γλωσσικά μοντέλα είναι σαν ένα σφουγγάρι που είναι έτοιμο να απορροφήσει εκατομμύρια πληροφορίες. Ακριβώς όπως ένας άνθρωπος, τα εργαλεία της τεχνητής νοημοσύνης πρέπει να εκπαιδευτούν προκειμένου να φτάσουν στο σημείο να παράγουν ένα ικανοποιητικό αποτέλεσμα που θα κάνει τους χρήστες να τα επιλέξουν έναντι του ανταγωνισμού.

Μέχρι ένα σημείο, εταιρείες όπως η Google, η Meta και η OpenAI χρησιμοποίησαν όγκους δεδομένων που συλλέχθηκαν δωρεάν από το διαδίκτυο για να εκπαιδεύσουν τα μοντέλα τους όπως το Gemini και το ChatGPT που μπορούν να μιμηθούν την ανθρώπινη παραγωγικότητα.

Πώς δημιουργήθηκε μια αγορά δισεκατομμυρίων

Οι εταιρείες που δραστηριοποιούνται αναφέρουν ότι δεν θα μπορούσαν να έχουν αναπτύξει τη συγκεκριμένη τεχνολογία αν έπρεπε να πληρώσουν για όλο τον όγκο των δεδομένων που έχουν χρησιμοποιήσει. Αυτό προκάλεσε ένα κύμα αγωγών για πνευματικά δικαιώματα, ενώ έχει αναγκάσει εκδότες να προσθέσουν έναν κώδικα στα sites του προκειμένου τα γλωσσικά μοντέλα να μη μπορούν να αποσπάσουν πληροφορίες.

Έχοντας πλέον γιγαντωθεί, οι εταιρείες τεχνητής νοημοσύνης προχωρούν σε συμφωνίες με άλλες εταιρείες που μπορούν να τους παρέχουν δεδομένα. Κάπως έτσι δημιουργήθηκε μια νέα αγορά πώλησης και ενοικίασης δεδομένων για να ικανοποιηθεί η ζήτηση.

Λίγο μετά την έναρξη του ChatGPT στα τέλη του 2022, εταιρείες όπως η Meta, η Google, η Amazon και η Apple σύναψαν συμφωνίες με το πρακτορείο εικόνων Shutterstock για τη χρήση εκατοντάδων εκατομμυρίων εικόνων, βίντεο και μουσικών αρχείων από τη βιβλιοθήκη του για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης, σύμφωνα με το πρακτορείο Reuters.

Το ρεπορτάζ αναφέρει ότι οι συμφωνίες με τις big tech κυμαίνονταν αρχικά από 25 έως 50 εκατομμύρια δολάρια η κάθε μια αν και οι περισσότερες επεκτάθηκαν αργότερα, σύμφωνα με όσα δήλωσε ο οικονομικής διευθυντής της Shutterstock, Jarrod Yahes. Αυτή η κίνηση ώθησε και μικρότερες εταιρείες να κλείσουν δικές τους συμφωνίες προκαλώντας μια νέα «έξαρση δραστηριότητας».

Συμφωνίες και με άλλα πρακτορεία

Η Freepik, ένας άμεσος ανταγωνιστής του Shutterstock, δήλωσε στο Reuters ότι έχει συνάψει συμφωνίες με δυο μεγάλες εταιρείες τεχνολογίας. Μπορεί να μην τις κατονόμασε αλλά έκανε γνωστό ότι τους παραχώρησε άδεια χρήσης του μεγαλύτερου μέρους του αρχείου της, που αποτελείται από 200 εκατομμύρια εικόνες, για 2 έως 4 σεντς ανά φωτογραφία.

Από την πλευρά του ο CEO της Freepik αποκάλυψε ότι υπάρχουν άλλες πέντε ανάλογες συμφωνίες στα σκαριά, αλλά δεν θέλησε να κατονομάσει τους επίδοξους αγοραστές.

Οι εταιρείες τεχνητής νοημοσύνης έχουν τόση μεγάλη ανάγκη αυτά τα δεδομένα που δεν έχουν διστάσει να χτυπήσουν την πόρτα και σε ορισμένες πλατφόρμες που έχουν χάσει την αίγλη του παρελθόντος. Για παράδειγμα η Photobucket, που στις αρχές του 2000 ήταν η κορυφαία εταιρεία με φωτογραφίες, έχει ήδη κάνει κάποιες συμφωνίες για την παραχώρηση μιας βιβλιοθήκης με 13 δισεκατομμύρια εικόνες. Σύμφωνα με τον CEO της εταιρείας οι τιμές για τις φωτογραφίες κυμαίνονται από 5 σεντς μέχρι 1 δολάριο, ενώ για τα βίντεο η τιμή ξεπερνάει το 1 δολάριο ανά αρχείο.

Θυμίζουμε ότι η OpenAI έχει συνάψει συμφωνίες και με ειδησεογραφικά πρακτορεία όπως το Associated Press, την Axel Springer και το Reuters προκειμένου να έχει πρόσβαση σε περιεχόμενο που θα βοηθήσει στην εκπαίδευση του γλωσσικού της μοντέλου.

Η ζήτηση δημιούργησε και δεύτερη αγορά

Όλα τα παραπάνω είχαν ως αποτέλεσμα τη δημιουργία μιας νέας «βιομηχανίας». Συγκεκριμένα έχουν δημιουργηθεί εταιρείες που χρησιμοποιούν πραγματικούς ανθρώπους για δημιουργία περιεχομένου επί πληρωμή. Αυτό μπορεί να είναι podcast ή κάποια βίντεο μικρής διάρκειας τα οποία πωλούνται στη συνέχεια στις εταιρείες τεχνητής νοημοσύνης.

Μια τέτοια εταιρεία είναι η Defined.ai, με έδρα το Σιάτλ, που έχει ενεργές συμφωνίες με την Google, τη Meta, την Apple, την Amazon, και την Microsoft, σύμφωνα με όσα δήλωσε στο Reuters η CEO, Daniela Braga. Οι τιμές ποικίλλουν ανάλογα τον αγοραστή και τον τύπο περιεχομένου, αλλά η Braga τόνισε ότι οι εταιρείες είναι πρόθυμες να πληρώσουν 1 έως 2 δολάρια ανά εικόνα, 2 έως 4 δολάρια ανά βίντεο μικρής διάρκειας και 100 έως 300 δολάρια ανά ώρα για βίντεο μεγάλης διάρκειας.

Η Defined.ai μοιράζεται τα κέρδη της με τους δημιουργούς περιεχομένου, σύμφωνα με την Braga η οποία πρόσθεσε ότι τα δεδομένα που πουλάει είναι «ηθικά παραγόμενα» καθώς έχει λάβει τη συγκατάθεση των ανθρώπων που πρωταγωνιστούν.

Ένα θέμα που θα μας απασχολήσει στο άμεσο μέλλον

Η χρήση δεδομένων που έχει παραχωρηθεί με τη συγκατάθεση των χρηστών θα μπορούσε να επιλύσει ορισμένα νομικά και ηθικά ζητήματα. Ωστόσο η αναβίωση αρχείων από πλατφόρμες όπως το Photobucket, εγείρει άλλα ζητήματα, ιδίως όσον αφορά την ιδιωτικότητα των χρηστών.

Ο CEO της Photobucket λέει ότι η εταιρεία του δεν θα έχει κανένα νομικό ζήτημα, επικαλούμενος μια ενημέρωση των όρχων χρήσης της πλατφόρμας τον Οκτώβριο. Αυτή η αλλαγή παρέχει στην εταιρεία το «απεριόριστο δικαίωμα» να πουλήσει οποιοδήποτε περιεχόμενο έχει ανέβει στην πλατφόρμα της για την εκπαίδευση συστημάτων τεχνητής νοημοσύνης.

Από την πλευρά της, η Braga της Defined.ai, υποστήριξε ότι η εταιρεία της αποφεύγει να αγοράσει δεδομένα από πλατφόρμες όπως η Photobucket και προτιμά δημιουργεί περιεχόμενο με τη σύμφωνη γνώμη των ανθρώπων που συνεργάζεται. «Θα το έβρισκα επικίνδυνο. Αν υπάρχει κάποιο μοντέλο τεχνητής νοημοσύνης που δημιουργεί κάτι που μοιάζει με φωτογραφία ενός ανθρώπου που δεν συμφώνησε με αυτό, είναι μεγάλο πρόβλημα», τόνισε.

Με πληροφορίες από το Bloomberg

ΣΧΕΤΙΚΑ