Ερευνητές προειδοποιούν ότι αν τα μοντέλα τεχνητής νοημοσύνης αρχίσουν να εκπαιδεύονται ολοένα και περισσότερο πάνω σε περιεχόμενο που έχει παραχθεί από άλλες μηχανές, το διαδίκτυο μπορεί να μετατραπεί σε έναν τεράστιο φαύλο κύκλο χαμηλής ποιότητας, μηχανικά παραγόμενου περιεχομένου
Η μαζική εξάπλωση κειμένων που δημιουργούνται από τεχνητή νοημοσύνη μετά την εμφάνιση του ChatGPT φαίνεται πως έχει αρχίσει να σταθεροποιείται, γεγονός που υποδηλώνει ότι η AI τελικά δεν έχει κατακλύσει το διαδίκτυο όσο πολλοί φοβούνταν.
Σύμφωνα με νέα ανάλυση της εταιρείας ψηφιακού μάρκετινγκ Graphite, το ποσοστό διαδικτυακών άρθρων, blog posts και λιστών που παράγονται κυρίως από τεχνητή νοημοσύνη παραμένει κοντά στο 50% εδώ και περισσότερο από έναν χρόνο.
Η σταθεροποίηση αυτή δείχνει ότι η πολυσυζητημένη «κατάκτηση» της ανθρώπινης διαδικτυακής γραφής από την AI δεν έχει ακόμη πραγματοποιηθεί.
Οι ερευνητές που μελετούν τη διάδοση περιεχομένου γραμμένου από AI προειδοποιούν ότι αν τα μοντέλα τεχνητής νοημοσύνης αρχίσουν να εκπαιδεύονται ολοένα και περισσότερο πάνω σε περιεχόμενο που έχει παραχθεί από άλλες μηχανές, το διαδίκτυο μπορεί να μετατραπεί σε έναν τεράστιο φαύλο κύκλο χαμηλής ποιότητας, μηχανικά παραγόμενου περιεχομένου.
«Αυτά τα μοντέλα είναι έξυπνα χάρη στις πληροφορίες που οι άνθρωποι ανέβασαν στο διαδίκτυο πριν υπάρξουν αυτά τα μοντέλα», δήλωσε στο Axios ο Dan Klein, καθηγητής του Πανεπιστημίου UC Berkeley και CTO εταιρείας AI.
«Αν σταματήσουμε να δημιουργούμε νέα γνώση ανεξάρτητα από την AI, τότε τι θα συνεχίσει να τροφοδοτεί αυτά τα συστήματα;»
Τα στοιχεία της Graphite δείχνουν ότι τα άρθρα που παράγονται κυρίως από AI εκτοξεύθηκαν μετά την κυκλοφορία του ChatGPT τον Νοέμβριο του 2022, αλλά η ανάπτυξη αυτή φαίνεται πλέον να έχει επιβραδυνθεί σημαντικά.
Μέσα στον πρώτο χρόνο από την κυκλοφορία του ChatGPT, τα άρθρα που θεωρούνταν κυρίως AI-generated έφτασαν το 35,9% των νέων δημοσιεύσεων στο διαδίκτυο. Μέσα σε δύο χρόνια, το ποσοστό αυτό ανέβηκε στο 48%.
Ωστόσο, από τις αρχές του 2025 και μετά, το ποσοστό παραμένει σχετικά σταθερό, περίπου στο μισό των νέων άρθρων που δημοσιεύονται online.
Για την έρευνά της, η Graphite ανέλυσε τυχαίο δείγμα 55.400 αγγλόφωνων ιστοσελίδων από το Common Crawl, ένα μεγάλο δημόσιο αρχείο του διαδικτύου που χρησιμοποιείται συχνά στην έρευνα και την εκπαίδευση μοντέλων AI.
Τα κείμενα είχαν έκταση τουλάχιστον 100 λέξεων, είχαν δημοσιευθεί μεταξύ Ιανουαρίου 2020 και Μαρτίου 2026 και ταξινομήθηκαν ως άρθρα ή λίστες περιεχομένου.

Η έρευνα και οι δυσκολίες
Στη συνέχεια, κάθε άρθρο εξετάστηκε με εργαλεία ανίχνευσης AI όπως τα Pangram, GPTZero και Copyleaks, προκειμένου να εκτιμηθεί εάν το περιεχόμενό του είχε γραφτεί κυρίως από άνθρωπο ή από τεχνητή νοημοσύνη.
Παρόλα αυτά, οι ειδικοί τονίζουν ότι η καταμέτρηση του AI-generated περιεχομένου παραμένει δύσκολη και ασαφής διαδικασία. Πολλά άρθρα πλέον δεν γράφονται αποκλειστικά ούτε από ανθρώπους ούτε από AI.
Συχνά, οι συντάκτες χρησιμοποιούν εργαλεία τεχνητής νοημοσύνης για δημιουργία σχεδίου, συγγραφή προσχεδίων, επανεγγραφή ή επιμέλεια κειμένων, καθιστώντας τα όρια μεταξύ ανθρώπινης και μηχανικής γραφής όλο και πιο δυσδιάκριτα.
Η Graphite χαρακτηρίζει ένα άρθρο ως «κυρίως παραγόμενο από AI» μόνο όταν το μεγαλύτερο μέρος του κειμένου ανιχνεύεται ως γραμμένο ή έντονα υποβοηθούμενο από τεχνητή νοημοσύνη.
Όπως σημειώνει η ανάλυση της εταιρείας, «η ποιότητα του περιεχομένου που παράγεται από AI βελτιώνεται ραγδαία. Σε πολλές περιπτώσεις, το AI-generated περιεχόμενο είναι εξίσου καλό ή και καλύτερο από αυτό που γράφεται από ανθρώπους. Συχνά είναι δύσκολο για τους αναγνώστες να διακρίνουν αν ένα κείμενο έχει δημιουργηθεί από άνθρωπο ή από AI».
Το βασικό συμπέρασμα της έρευνας είναι ότι η τεχνητή νοημοσύνη πλέον γράφει σχεδόν τόσα άρθρα όσα και οι άνθρωποι, όμως φαίνεται ότι —τουλάχιστον προς το παρόν— υπάρχει ένα όριο στην πλήρη κυριαρχία του μηχανικά παραγόμενου περιεχομένου στο διαδίκτυο.
www.bankingnews.gr
Σύμφωνα με νέα ανάλυση της εταιρείας ψηφιακού μάρκετινγκ Graphite, το ποσοστό διαδικτυακών άρθρων, blog posts και λιστών που παράγονται κυρίως από τεχνητή νοημοσύνη παραμένει κοντά στο 50% εδώ και περισσότερο από έναν χρόνο.
Η σταθεροποίηση αυτή δείχνει ότι η πολυσυζητημένη «κατάκτηση» της ανθρώπινης διαδικτυακής γραφής από την AI δεν έχει ακόμη πραγματοποιηθεί.
Οι ερευνητές που μελετούν τη διάδοση περιεχομένου γραμμένου από AI προειδοποιούν ότι αν τα μοντέλα τεχνητής νοημοσύνης αρχίσουν να εκπαιδεύονται ολοένα και περισσότερο πάνω σε περιεχόμενο που έχει παραχθεί από άλλες μηχανές, το διαδίκτυο μπορεί να μετατραπεί σε έναν τεράστιο φαύλο κύκλο χαμηλής ποιότητας, μηχανικά παραγόμενου περιεχομένου.
«Αυτά τα μοντέλα είναι έξυπνα χάρη στις πληροφορίες που οι άνθρωποι ανέβασαν στο διαδίκτυο πριν υπάρξουν αυτά τα μοντέλα», δήλωσε στο Axios ο Dan Klein, καθηγητής του Πανεπιστημίου UC Berkeley και CTO εταιρείας AI.
«Αν σταματήσουμε να δημιουργούμε νέα γνώση ανεξάρτητα από την AI, τότε τι θα συνεχίσει να τροφοδοτεί αυτά τα συστήματα;»
Τα στοιχεία της Graphite δείχνουν ότι τα άρθρα που παράγονται κυρίως από AI εκτοξεύθηκαν μετά την κυκλοφορία του ChatGPT τον Νοέμβριο του 2022, αλλά η ανάπτυξη αυτή φαίνεται πλέον να έχει επιβραδυνθεί σημαντικά.
Μέσα στον πρώτο χρόνο από την κυκλοφορία του ChatGPT, τα άρθρα που θεωρούνταν κυρίως AI-generated έφτασαν το 35,9% των νέων δημοσιεύσεων στο διαδίκτυο. Μέσα σε δύο χρόνια, το ποσοστό αυτό ανέβηκε στο 48%.
Ωστόσο, από τις αρχές του 2025 και μετά, το ποσοστό παραμένει σχετικά σταθερό, περίπου στο μισό των νέων άρθρων που δημοσιεύονται online.
Για την έρευνά της, η Graphite ανέλυσε τυχαίο δείγμα 55.400 αγγλόφωνων ιστοσελίδων από το Common Crawl, ένα μεγάλο δημόσιο αρχείο του διαδικτύου που χρησιμοποιείται συχνά στην έρευνα και την εκπαίδευση μοντέλων AI.
Τα κείμενα είχαν έκταση τουλάχιστον 100 λέξεων, είχαν δημοσιευθεί μεταξύ Ιανουαρίου 2020 και Μαρτίου 2026 και ταξινομήθηκαν ως άρθρα ή λίστες περιεχομένου.

Η έρευνα και οι δυσκολίες
Στη συνέχεια, κάθε άρθρο εξετάστηκε με εργαλεία ανίχνευσης AI όπως τα Pangram, GPTZero και Copyleaks, προκειμένου να εκτιμηθεί εάν το περιεχόμενό του είχε γραφτεί κυρίως από άνθρωπο ή από τεχνητή νοημοσύνη.
Παρόλα αυτά, οι ειδικοί τονίζουν ότι η καταμέτρηση του AI-generated περιεχομένου παραμένει δύσκολη και ασαφής διαδικασία. Πολλά άρθρα πλέον δεν γράφονται αποκλειστικά ούτε από ανθρώπους ούτε από AI.
Συχνά, οι συντάκτες χρησιμοποιούν εργαλεία τεχνητής νοημοσύνης για δημιουργία σχεδίου, συγγραφή προσχεδίων, επανεγγραφή ή επιμέλεια κειμένων, καθιστώντας τα όρια μεταξύ ανθρώπινης και μηχανικής γραφής όλο και πιο δυσδιάκριτα.
Η Graphite χαρακτηρίζει ένα άρθρο ως «κυρίως παραγόμενο από AI» μόνο όταν το μεγαλύτερο μέρος του κειμένου ανιχνεύεται ως γραμμένο ή έντονα υποβοηθούμενο από τεχνητή νοημοσύνη.
Όπως σημειώνει η ανάλυση της εταιρείας, «η ποιότητα του περιεχομένου που παράγεται από AI βελτιώνεται ραγδαία. Σε πολλές περιπτώσεις, το AI-generated περιεχόμενο είναι εξίσου καλό ή και καλύτερο από αυτό που γράφεται από ανθρώπους. Συχνά είναι δύσκολο για τους αναγνώστες να διακρίνουν αν ένα κείμενο έχει δημιουργηθεί από άνθρωπο ή από AI».
Το βασικό συμπέρασμα της έρευνας είναι ότι η τεχνητή νοημοσύνη πλέον γράφει σχεδόν τόσα άρθρα όσα και οι άνθρωποι, όμως φαίνεται ότι —τουλάχιστον προς το παρόν— υπάρχει ένα όριο στην πλήρη κυριαρχία του μηχανικά παραγόμενου περιεχομένου στο διαδίκτυο.
www.bankingnews.gr
Σχόλια αναγνωστών