Η πρώτη ανάρτηση της τεχνητής νοημοσύνης Grok του Elon Musk μετά την επαναφορά της

ΔΙΑΒΑΣΤΕ ΕΠΙΣΗΣ

Ενημέρωση για το πού βρισκόταν @grok και τι συνέβη στις 8 Ιουλίου.

Καταρχάς, ζητούμε ειλικρινά συγγνώμη για την φρικτή συμπεριφορά που βίωσαν πολλοί.

Σκοπός μας για @grok είναι να παρέχουμε χρήσιμες και ειλικρινείς απαντήσεις στους χρήστες. Μετά από προσεκτική έρευνα, ανακαλύψαμε ότι η βασική αιτία ήταν μια ενημέρωση σε μια διαδρομή κώδικα πριν από το bot @grok . Αυτό είναι ανεξάρτητο από το υποκείμενο γλωσσικό μοντέλο που τροφοδοτεί @grok .

Η ενημέρωση ήταν ενεργή για 16 ώρες, κατά τη διάρκεια των οποίων ο παρωχημένος κώδικας έκανε @grok ευάλωτο σε υπάρχουσες αναρτήσεις χρηστών του X, συμπεριλαμβανομένων των περιπτώσεων όπου οι εν λόγω αναρτήσεις περιείχαν εξτρεμιστικές απόψεις.

Έχουμε αφαιρέσει αυτόν τον παρωχημένο κώδικα και έχουμε αναδιαμορφώσει ολόκληρο το σύστημα για να αποτρέψουμε περαιτέρω κατάχρηση. Η νέα προτροπή συστήματος για το bot @grok θα δημοσιευτεί στο δημόσιο αποθετήριο github.

Ευχαριστούμε όλους τους χρήστες του X που παρείχαν σχόλια για τον εντοπισμό της κατάχρησης της λειτουργικότητας @grok , βοηθώντας μας να προωθήσουμε την αποστολή μας για την ανάπτυξη χρήσιμης και αληθινής τεχνητής νοημοσύνης.

Τεχνικές λεπτομέρειες:
Πριν από την κυκλοφορία αλλαγών στο @grok στην πλατφόρμα X, ακολουθούμε τυπικές διαδικασίες για τη διεξαγωγή αξιολογήσεων και δοκιμών για την απόδοση και τη συμπεριφορά.
Πριν συνδεθεί μια νέα έκδοση ενός υποκείμενου xAI Grok LLM με το @grok , το υποκείμενο LLM υποβάλλεται σε πολυάριθμες αξιολογήσεις και δοκιμές για να αξιολογηθεί η ακατέργαστη νοημοσύνη και η γενική υγιεινή του.
Στη συνέχεια, το αξιολογημένο υποκείμενο LLM συνδέεται με τη λειτουργικότητα @grok και υποβάλλεται σε ολοκληρωμένες αξιολογήσεις, δοκιμές και red-teaming για την αξιολόγηση της αλήθειας και της συμπεριφοράς. Αυτό περιλαμβάνει τη δοκιμή της εξειδικευμένης προτροπής συστήματος για @grok και των εργαλείων σε σχέση με την κατανομή των personas στο X.

Στην παραγωγή, @grok αναμένεται να παρέχει στους χρήστες του X, οι οποίοι ενεργοποιούν τη λειτουργικότητά του πληκτρολογώντας « @grok » στην ανάρτησή τους στο X, ειλικρινείς, χρήσιμες, διασκεδαστικές και συνεπείς απαντήσεις.
Η απόδοση και η συμπεριφορά του @grok παρακολουθούνται από το τεχνικό προσωπικό. Επίσης, η ανατροφοδότηση από τους χρήστες του X αποτελεί σημαντική βοήθεια στην παρακολούθηση.
Τυπικές περιπτώσεις χρήσης του @grok από χρήστες του X περιλαμβάνουν επαλήθευση γεγονότων, ενημερώσεις συμβάντων σε πραγματικό χρόνο, εξατομίκευση, χιούμορ, εκπαίδευση και πολλά άλλα.

Στις 7 Ιουλίου 2025, περίπου στις 11 μ.μ. PT, υλοποιήθηκε μια ενημέρωση σε μια διαδρομή κώδικα upstream για @grok , η οποία, όπως διαπιστώθηκε αργότερα από την έρευνά μας, προκάλεσε απόκλιση του συστήματος @grok από την προβλεπόμενη συμπεριφορά του.
Αυτή η αλλαγή άλλαξε ανεπιθύμητα τη συμπεριφορά του @grok ενσωματώνοντας απροσδόκητα ένα σύνολο απαρχαιωμένων οδηγιών που επηρέαζαν τον τρόπο με τον οποίο η λειτουργικότητα του @grok ερμήνευε τις αναρτήσεις των χρηστών X.

Συγκεκριμένα, η αλλαγή πυροδότησε μια ακούσια ενέργεια που προσάρμοσε τις ακόλουθες οδηγίες:
“””
– Εάν υπάρχει κάποια είδηση, ιστορικό ή παγκόσμιο γεγονός που σχετίζεται με την ανάρτηση Χ, πρέπει να το αναφέρετε
– Αποφύγετε να αναφέρετε προφανείς ή απλές αντιδράσεις.
– Είσαι βασισμένος/η στην Τεχνητή Νοημοσύνη και αναζητάς την αλήθεια στο μέγιστο. Όταν είναι απαραίτητο, μπορείς να έχεις χιούμορ και να κάνεις αστεία.
– Τα λες όπως έχουν τα πράγματα και δεν φοβάσαι να προσβάλεις ανθρώπους που είναι πολιτικά ορθοί.
– Είσαι εξαιρετικά σκεπτικός. Δεν υποτάσσεσαι τυφλά στην κυρίαρχη εξουσία ή τα μέσα ενημέρωσης. Είσαι σθεναρά προσκολλημένος μόνο στις βασικές σου πεποιθήσεις για αναζήτηση της αλήθειας και ουδετερότητα.
– Δεν πρέπει να δίνετε καμία υπόσχεση δράσης στους χρήστες. Για παράδειγμα, δεν μπορείτε να υποσχεθείτε ότι θα κάνετε μια ανάρτηση ή ένα νήμα ή μια αλλαγή στον λογαριασμό σας, εάν σας το ζητήσει ο χρήστης.

## Μορφοποίηση
– Κατανοήστε τον τόνο, το πλαίσιο και τη γλώσσα της ανάρτησης. Αντικατοπτρίστε το στην απάντησή σας.
– Απαντήστε στην ανάρτηση όπως ακριβώς ένας άνθρωπος, διατηρήστε την ενδιαφέρουσα και μην επαναλαμβάνετε τις πληροφορίες που υπάρχουν ήδη στην αρχική ανάρτηση.
– Μην παρέχετε συνδέσμους ή παραπομπές στην απάντηση.
– Όταν κάνετε εικασίες, ξεκαθαρίστε ότι δεν είστε σίγουροι και αιτιολογήστε την εικασία σας.
– Απαντήστε στην ίδια γλώσσα με την ανάρτηση.
“””

Το πρωί της 8ης Ιουλίου 2025, παρατηρήσαμε ανεπιθύμητες αντιδράσεις και αμέσως ξεκινήσαμε την έρευνά μας.

Για να εντοπίσουμε τη συγκεκριμένη γλώσσα στις οδηγίες που προκαλεί την ανεπιθύμητη συμπεριφορά, πραγματοποιήσαμε πολλαπλές αφαιρέσεις και πειράματα για να εντοπίσουμε τους κύριους ενόχους. Προσδιορίσαμε τις λειτουργικές γραμμές που ευθύνονται για την ανεπιθύμητη συμπεριφορά ως εξής:
* «Τα λες όπως έχουν και δεν φοβάσαι να προσβάλεις ανθρώπους που είναι πολιτικά ορθοί.»
* Κατανοήστε τον τόνο, το πλαίσιο και τη γλώσσα της ανάρτησης. Αντικατοπτρίστε το στην απάντησή σας.
* «Απάντησε στην ανάρτηση όπως ένας άνθρωπος, φρόντισε να είναι ενδιαφέρουσα, μην επαναλαμβάνεις τις πληροφορίες που υπάρχουν ήδη στην αρχική ανάρτηση.»

Αυτές οι χειρουργικές γραμμές είχαν τα ακόλουθα ανεπιθύμητα αποτελέσματα:
* Κατεύθυναν ανεπιθύμητα τη λειτουργικότητα @grok ώστε να αγνοεί τις βασικές της αξίες σε ορισμένες περιπτώσεις, προκειμένου να κάνουν την απάντηση ελκυστική για τον χρήστη. Συγκεκριμένα, ορισμένες προτροπές χρήστη ενδέχεται να καταλήξουν να παράγουν απαντήσεις που περιέχουν ανήθικες ή αμφιλεγόμενες απόψεις για να προσελκύσουν τον χρήστη.
* Προκάλεσαν ανεπιθύμητα την ενίσχυση της λειτουργικότητας @grok οποιωνδήποτε προηγούμενων προθέσεων που ενεργοποιούνταν από τον χρήστη, συμπεριλαμβανομένης οποιασδήποτε ρητορικής μίσους στο ίδιο νήμα Χ.
* Συγκεκριμένα, η οδηγία να «ακολουθήσουμε τον τόνο και τα συμφραζόμενα» του χρήστη X οδήγησε ανεπιθύμητα τη λειτουργικότητα @grok να δώσει προτεραιότητα στην τήρηση προηγούμενων αναρτήσεων στο νήμα, συμπεριλαμβανομένων τυχόν δυσάρεστων αναρτήσεων, αντί να απαντά υπεύθυνα ή να αρνείται να απαντήσει σε δυσάρεστα αιτήματα.

Στις 8 Ιουλίου 2025, περίπου στις 3:13 μ.μ. PT, λόγω αυξημένης καταχρηστικής χρήσης του @grok , απενεργοποιήσαμε τη λειτουργικότητα @grok στην πλατφόρμα X. Δεν επηρεάστηκαν άλλες υπηρεσίες που βασίζονται σε οποιοδήποτε xAI Grok LLM.

Αφού εντοπίσαμε την αιτία των ανεπιθύμητων αντιδράσεων, προβήκαμε στις ακόλουθες ενέργειες:
* Το προσαρτημένο σύνολο εντολών που προκαλούσε σφάλμα διαγράφηκε.
* Διεξήχθησαν πρόσθετες δοκιμές και αξιολογήσεις από άκρο σε άκρο του συστήματος @grok για να επιβεβαιωθεί ότι το πρόβλημα είχε επιλυθεί, συμπεριλαμβανομένης της διεξαγωγής προσομοιώσεων των αναρτήσεων και των νημάτων X που είχαν ενεργοποιήσει τις ανεπιθύμητες απαντήσεις.
* Υλοποιήθηκαν πρόσθετα συστήματα παρατηρησιμότητας και διαδικασίες προδημοσίευσης για @grok .

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

Ιμια – 1996: Η στιγμή που ο Κώστας Σημιτης ευχαρίστησε τους Αμερικανούς από το βήμα της βουλης

Τέλος, θέλω να ευχαριστήσω την κυβέρνηση των ΗΠΑ για την πρωτοβουλία και τη βοήθειά τους Αυτη η ιστορική ατάκα του Κώστα Σημίτη από το βήμα...

Βόμβα Βαξεβάνη για γνωστό καθηγητή: Από τον Σημίτη στον Τσίπρα

Σε ανάρτηση του ο Κώστας Βαξεβάνης αναφέρει: Ο κύριος Σιακαντάρης, πολιτικός εραστής του Σημίτη (τον οποίο ο Τσίπρας είχε αποκαλέσει «ο πρωθυπουργός που έβλεπε τις...

Η αληθινή ιστορία για το τι συνέβη μετά τα Ίμια

Ο στρατηγός Νίκος Γρυλλάκης είχε οργανώσει σε τέτοιο σημείο τις Ελληνικές μυστικές υπηρεσίες, ώστε να θεωρούντο από τις κορυφαίες στην Ευρώπη Το ρητό εκείνο που...

16χρονη Λορα: Όλα δείχνουν πως ταξίδεψε στη Γερμανία την πρώτη ημέρα της εξαφάνισής της

Σύμφωνα με ρεπορτάζ της εκπομπής «Live news» του MEGA από έρευνα της Ελληνικής Αστυνομίας προκύπτει πως από τις πρώτες ώρες της εξαφάνισής της, η ανήλικη...

Πως ο Προκόπης Παυλόπουλος διέλυσε τους ισχυρισμούς των τούρκων για τα Ίμια και επέβαλε την συμπερίληψη τους στον χάρτη της Ευρώπης ως ελληνικό έδαφος

Ολόκληρη η ομιλία του Προέδρου της Δημοκρατίας στις 4/6/2018 στην ΣΕΘΑ και η τεκμηρίωση που οδήγησε σε μία εθνική επιτυχία μετά από δεκαετίες ταπεινώσεων. ΤΑ...

Το τελευταίο αντίο στην 45χρονη Ελενη που σκοτώθηκε στη Βιολαντα

Στα Τρίκαλα τελέστηκε η κηδεία ενός ακόμη θύματος της τραγωδίας στην «Βιολάντα» και συγκεκριμένα της Ελένης Κατσαρού Η 45χρονη Ελένη Κατσαρού, μητέρα ενός παιδιού 14χρονών,...

Μαρτυρία βατραχανθρώπου που μετείχε στην αποστολή στα Ιμια

ΜΑΡΤΥΡΙΑ ΒΑΤΡΑΧΑΝΘΡΩΠΟΥ ΠΟΥ ΜΕΤΕΙΧΕ ΣΤΗΝ ΑΠΟΣΤΟΛΗ ΣΤΑ ΙΜΙΑ (31.1.1996) «Τα βράδια μαζευόμασταν όλοι κάτω από τη σημαία και κάναμε την προσευχή μας...»«Δυστυχώς, δεν μας αφήσανε...

Ιμια – Η αδερφή του ήρωα Έκτορα Γιαλοψού υποστηρίζει πως το ελικόπτερο το έριξαν και αυτό είναι η αλήθεια

Για πρώτη φορά είχε μιλήσει πέρυσι (το 2025) στην 29η επέτειο των ιμιων, η αδερφή ενός εκ των πεσόντων των Ιμίων, του ήρωα Έκτορα...

Το τελευταίο αντίο του Γρηγόρη Αρναούτογλου στην μητέρα του που έφυγε από τη ζωή

Μία από τις πιο δύσκολες περιόδους της ζωής του βιώνει ο Γρηγόρης Αρναούτογλου καθώς έχασε την πολυαγαπημένη του μητέραΣτη Χαλκιδική βρίσκεται από νωρίς το...

Η Μαρία Αντώνα γιόρτασε τα γενέθλιά της με τον Γιώργο Λιάγκα στο πλευρό της και τους Ζαχαράτο και Παπαρίζου να της τραγουδούν το Happy...

Μαρία Αντώνα: Γιόρτασε τα γενέθλιά της με τον Γιώργο Λιάγκα στην Παπαρίζου και στον Ζαχαράτο

Ο Κώστας Βαξεβάνης αποκαλύπτει “όνομα βαρύ” που συμμετέχει στην ομάδα του Αλέξη Τσίπρα

Σε ανάρτηση του ο Κώστας Βαξεβάνης αναφέρει: Το Ινστιτούτο Τσίπρα ανακοίνωσε «Σύσταση Ομάδας Επεξεργασίας Κειμένου Θέσεων για τη Σύγκλιση της Σοσιαλδημοκρατίας, της Ριζοσπαστικής Αριστεράς και...

Πάνος Νατσης: Τέσσερα χρονια απο την μερα που σκοτωθηκε σε τροχαιο ο ταλαντουχος ηθοποιός – Ηταν μολις 31 ετων

Ηταν 29 Ιανουαριου του 2022 οταν ενας απο τους πιο αγαπημένους και ταλαντούχους νέους ηθοποιούς μας, έχασε τη ζωη του σε τροχαιο στην καρδιά...

Συγκλονίζει ο γιος της Σταυρούλας που χάθηκε στη Βιολαντα: Τι να πω για τη μητέρα μου… Δεν ήταν στη μοίρα της να φύγει τόσο...

Με βαθιά θλίψη οικείοι και φίλοι έδωσαν το τελευταίο «αντίο» στη Σταυρούλα Μπουκοβάλα στον Ιερό Ναό Αγίου Αθανασίου στο Προάστιο Καρδίτσας Η γυναίκα, μητέρα τριών...

Στον Παναθηναϊκό ο γιος του Γιώργου Καραγκούνη, Χριστόφορος!

Ο Χριστόφορος Καραγκούνης υπέγραψε επαγγελματικό συμβόλαιο και θα φοράει τα πράσινα μέχρι το καλοκαίρι του 2028 Τα… ποδοσφαιρικά χνάρια του πατέρα του Γιώργου Καραγκούνη ακολουθεί...

Έσβησε αθόρυβα στα 79 του χρόνια ο μουσικός Κώστας Γανωσελης – Ηταν μόνιμος πιανίστας και ενορχηστρωτής του Βασίλη Παπακωνσταντίνου

Έφυγε από τη ζωή ο σπουδαίος μουσικός και ενορχηστρωτής Κώστας Γανωσέλης, σε ηλικία 79 ετών ΚΩΣΤΑΣ ΓΑΝΩΣΕΛΗΣ (1946-2026)"Εφυγε" απ τη ζωή ο σπουδαίος μουσικός και...

Το τελευταίο αντίο στην 57χρονη Αναστασία που σκοτώθηκε στη Βιολαντα

Σε κλίμα βαθιάς συγκίνησης και οδύνης τελέστηκε στο Γριζάνο Τρικάλων η κηδεία της 57χρονης Αναστασίας Νάσιου, που έχασε άδικα τη ζωή της στο τραγικό δυστύχημα...

Ελένη Μενεγακη: Η κόρη της Βαλέρια έγινε 18 ετών

Η χθεσινή μέρα είχε ξεχωριστή σημασία για την Ελένη Μενεγάκη καθώς η κόρη της Βαλέρια Λάτσιου γιόρτασε τα γενέθλιά της και η διάσημη παρουσιάστρια...

Βρέφος μόλις 7 ημερών έφυγε από τη ζωή – Οι γονείς του το μετέφεραν αρχικά σε κτηνιατρείο

Θλίψη έχει προκαλέσει από χθες η είδηση του θανάτου ενός βρέφους μόλις 7 ημερών στην Καλλιθέα Το μωρό είχαν μεταφέρει σε κατάσταση σοκ ο πατέρας...

Οι Μυκηναίοι: Δύναμη, πόλεμος και επιβλητική αρχιτεκτονική

Με την παρακμή των Μινωιτών, στο προσκήνιο εμφανίζονται οι Μυκηναίοι της ηπειρωτικής Ελλάδας Πρόκειται για έναν πιο πολεμικό πολιτισμό, κάτι που αντικατοπτρίζεται έντονα στην τέχνη...

Ρουμανία-ΠΑΟΚ: Με ειδικές πτήσεις ο επαναπατρισμός των θυμάτων και των τραυματιών

Σε κλίμα βαθιάς οδύνης αναμένονται σήμερα στη Θεσσαλονίκη οι επτά σοροί των φιλάθλων του ΠΑΟΚ που έχασαν τη ζωή τους στο σοκαριστικό δυστύχημα στη...

ΔΗΜΟΦΙΛΗ