Η πρώτη ανάρτηση της τεχνητής νοημοσύνης Grok του Elon Musk μετά την επαναφορά της

ΔΕΙΤΕ ΑΚΟΜΗ

Ενημέρωση για το πού βρισκόταν @grok και τι συνέβη στις 8 Ιουλίου.

Καταρχάς, ζητούμε ειλικρινά συγγνώμη για την φρικτή συμπεριφορά που βίωσαν πολλοί.

Σκοπός μας για @grok είναι να παρέχουμε χρήσιμες και ειλικρινείς απαντήσεις στους χρήστες. Μετά από προσεκτική έρευνα, ανακαλύψαμε ότι η βασική αιτία ήταν μια ενημέρωση σε μια διαδρομή κώδικα πριν από το bot @grok . Αυτό είναι ανεξάρτητο από το υποκείμενο γλωσσικό μοντέλο που τροφοδοτεί @grok .

Η ενημέρωση ήταν ενεργή για 16 ώρες, κατά τη διάρκεια των οποίων ο παρωχημένος κώδικας έκανε @grok ευάλωτο σε υπάρχουσες αναρτήσεις χρηστών του X, συμπεριλαμβανομένων των περιπτώσεων όπου οι εν λόγω αναρτήσεις περιείχαν εξτρεμιστικές απόψεις.

Έχουμε αφαιρέσει αυτόν τον παρωχημένο κώδικα και έχουμε αναδιαμορφώσει ολόκληρο το σύστημα για να αποτρέψουμε περαιτέρω κατάχρηση. Η νέα προτροπή συστήματος για το bot @grok θα δημοσιευτεί στο δημόσιο αποθετήριο github.

Ευχαριστούμε όλους τους χρήστες του X που παρείχαν σχόλια για τον εντοπισμό της κατάχρησης της λειτουργικότητας @grok , βοηθώντας μας να προωθήσουμε την αποστολή μας για την ανάπτυξη χρήσιμης και αληθινής τεχνητής νοημοσύνης.

Τεχνικές λεπτομέρειες:
Πριν από την κυκλοφορία αλλαγών στο @grok στην πλατφόρμα X, ακολουθούμε τυπικές διαδικασίες για τη διεξαγωγή αξιολογήσεων και δοκιμών για την απόδοση και τη συμπεριφορά.
Πριν συνδεθεί μια νέα έκδοση ενός υποκείμενου xAI Grok LLM με το @grok , το υποκείμενο LLM υποβάλλεται σε πολυάριθμες αξιολογήσεις και δοκιμές για να αξιολογηθεί η ακατέργαστη νοημοσύνη και η γενική υγιεινή του.
Στη συνέχεια, το αξιολογημένο υποκείμενο LLM συνδέεται με τη λειτουργικότητα @grok και υποβάλλεται σε ολοκληρωμένες αξιολογήσεις, δοκιμές και red-teaming για την αξιολόγηση της αλήθειας και της συμπεριφοράς. Αυτό περιλαμβάνει τη δοκιμή της εξειδικευμένης προτροπής συστήματος για @grok και των εργαλείων σε σχέση με την κατανομή των personas στο X.

Στην παραγωγή, @grok αναμένεται να παρέχει στους χρήστες του X, οι οποίοι ενεργοποιούν τη λειτουργικότητά του πληκτρολογώντας « @grok » στην ανάρτησή τους στο X, ειλικρινείς, χρήσιμες, διασκεδαστικές και συνεπείς απαντήσεις.
Η απόδοση και η συμπεριφορά του @grok παρακολουθούνται από το τεχνικό προσωπικό. Επίσης, η ανατροφοδότηση από τους χρήστες του X αποτελεί σημαντική βοήθεια στην παρακολούθηση.
Τυπικές περιπτώσεις χρήσης του @grok από χρήστες του X περιλαμβάνουν επαλήθευση γεγονότων, ενημερώσεις συμβάντων σε πραγματικό χρόνο, εξατομίκευση, χιούμορ, εκπαίδευση και πολλά άλλα.

Στις 7 Ιουλίου 2025, περίπου στις 11 μ.μ. PT, υλοποιήθηκε μια ενημέρωση σε μια διαδρομή κώδικα upstream για @grok , η οποία, όπως διαπιστώθηκε αργότερα από την έρευνά μας, προκάλεσε απόκλιση του συστήματος @grok από την προβλεπόμενη συμπεριφορά του.
Αυτή η αλλαγή άλλαξε ανεπιθύμητα τη συμπεριφορά του @grok ενσωματώνοντας απροσδόκητα ένα σύνολο απαρχαιωμένων οδηγιών που επηρέαζαν τον τρόπο με τον οποίο η λειτουργικότητα του @grok ερμήνευε τις αναρτήσεις των χρηστών X.

Συγκεκριμένα, η αλλαγή πυροδότησε μια ακούσια ενέργεια που προσάρμοσε τις ακόλουθες οδηγίες:
“””
– Εάν υπάρχει κάποια είδηση, ιστορικό ή παγκόσμιο γεγονός που σχετίζεται με την ανάρτηση Χ, πρέπει να το αναφέρετε
– Αποφύγετε να αναφέρετε προφανείς ή απλές αντιδράσεις.
– Είσαι βασισμένος/η στην Τεχνητή Νοημοσύνη και αναζητάς την αλήθεια στο μέγιστο. Όταν είναι απαραίτητο, μπορείς να έχεις χιούμορ και να κάνεις αστεία.
– Τα λες όπως έχουν τα πράγματα και δεν φοβάσαι να προσβάλεις ανθρώπους που είναι πολιτικά ορθοί.
– Είσαι εξαιρετικά σκεπτικός. Δεν υποτάσσεσαι τυφλά στην κυρίαρχη εξουσία ή τα μέσα ενημέρωσης. Είσαι σθεναρά προσκολλημένος μόνο στις βασικές σου πεποιθήσεις για αναζήτηση της αλήθειας και ουδετερότητα.
– Δεν πρέπει να δίνετε καμία υπόσχεση δράσης στους χρήστες. Για παράδειγμα, δεν μπορείτε να υποσχεθείτε ότι θα κάνετε μια ανάρτηση ή ένα νήμα ή μια αλλαγή στον λογαριασμό σας, εάν σας το ζητήσει ο χρήστης.

## Μορφοποίηση
– Κατανοήστε τον τόνο, το πλαίσιο και τη γλώσσα της ανάρτησης. Αντικατοπτρίστε το στην απάντησή σας.
– Απαντήστε στην ανάρτηση όπως ακριβώς ένας άνθρωπος, διατηρήστε την ενδιαφέρουσα και μην επαναλαμβάνετε τις πληροφορίες που υπάρχουν ήδη στην αρχική ανάρτηση.
– Μην παρέχετε συνδέσμους ή παραπομπές στην απάντηση.
– Όταν κάνετε εικασίες, ξεκαθαρίστε ότι δεν είστε σίγουροι και αιτιολογήστε την εικασία σας.
– Απαντήστε στην ίδια γλώσσα με την ανάρτηση.
“””

Το πρωί της 8ης Ιουλίου 2025, παρατηρήσαμε ανεπιθύμητες αντιδράσεις και αμέσως ξεκινήσαμε την έρευνά μας.

Για να εντοπίσουμε τη συγκεκριμένη γλώσσα στις οδηγίες που προκαλεί την ανεπιθύμητη συμπεριφορά, πραγματοποιήσαμε πολλαπλές αφαιρέσεις και πειράματα για να εντοπίσουμε τους κύριους ενόχους. Προσδιορίσαμε τις λειτουργικές γραμμές που ευθύνονται για την ανεπιθύμητη συμπεριφορά ως εξής:
* «Τα λες όπως έχουν και δεν φοβάσαι να προσβάλεις ανθρώπους που είναι πολιτικά ορθοί.»
* Κατανοήστε τον τόνο, το πλαίσιο και τη γλώσσα της ανάρτησης. Αντικατοπτρίστε το στην απάντησή σας.
* «Απάντησε στην ανάρτηση όπως ένας άνθρωπος, φρόντισε να είναι ενδιαφέρουσα, μην επαναλαμβάνεις τις πληροφορίες που υπάρχουν ήδη στην αρχική ανάρτηση.»

Αυτές οι χειρουργικές γραμμές είχαν τα ακόλουθα ανεπιθύμητα αποτελέσματα:
* Κατεύθυναν ανεπιθύμητα τη λειτουργικότητα @grok ώστε να αγνοεί τις βασικές της αξίες σε ορισμένες περιπτώσεις, προκειμένου να κάνουν την απάντηση ελκυστική για τον χρήστη. Συγκεκριμένα, ορισμένες προτροπές χρήστη ενδέχεται να καταλήξουν να παράγουν απαντήσεις που περιέχουν ανήθικες ή αμφιλεγόμενες απόψεις για να προσελκύσουν τον χρήστη.
* Προκάλεσαν ανεπιθύμητα την ενίσχυση της λειτουργικότητας @grok οποιωνδήποτε προηγούμενων προθέσεων που ενεργοποιούνταν από τον χρήστη, συμπεριλαμβανομένης οποιασδήποτε ρητορικής μίσους στο ίδιο νήμα Χ.
* Συγκεκριμένα, η οδηγία να «ακολουθήσουμε τον τόνο και τα συμφραζόμενα» του χρήστη X οδήγησε ανεπιθύμητα τη λειτουργικότητα @grok να δώσει προτεραιότητα στην τήρηση προηγούμενων αναρτήσεων στο νήμα, συμπεριλαμβανομένων τυχόν δυσάρεστων αναρτήσεων, αντί να απαντά υπεύθυνα ή να αρνείται να απαντήσει σε δυσάρεστα αιτήματα.

Στις 8 Ιουλίου 2025, περίπου στις 3:13 μ.μ. PT, λόγω αυξημένης καταχρηστικής χρήσης του @grok , απενεργοποιήσαμε τη λειτουργικότητα @grok στην πλατφόρμα X. Δεν επηρεάστηκαν άλλες υπηρεσίες που βασίζονται σε οποιοδήποτε xAI Grok LLM.

Αφού εντοπίσαμε την αιτία των ανεπιθύμητων αντιδράσεων, προβήκαμε στις ακόλουθες ενέργειες:
* Το προσαρτημένο σύνολο εντολών που προκαλούσε σφάλμα διαγράφηκε.
* Διεξήχθησαν πρόσθετες δοκιμές και αξιολογήσεις από άκρο σε άκρο του συστήματος @grok για να επιβεβαιωθεί ότι το πρόβλημα είχε επιλυθεί, συμπεριλαμβανομένης της διεξαγωγής προσομοιώσεων των αναρτήσεων και των νημάτων X που είχαν ενεργοποιήσει τις ανεπιθύμητες απαντήσεις.
* Υλοποιήθηκαν πρόσθετα συστήματα παρατηρησιμότητας και διαδικασίες προδημοσίευσης για @grok .

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

Ναπολέων Βοναπάρτης – Ο Μέγας: Ο άνθρωπος που διπλασίασε το μέγεθος των Ηνωμένων Πολιτειών εν μια νυκτί

Πριν από 205 χρόνια, ο Ναπολέων Βοναπάρτης πέθανε σε ένα μικροσκοπικό βρετανικό νησί-φυλακή στη μέση του Νότιου Ατλαντικού Ήταν 51 ετών. Είχε κυβερνήσει τα...

Μύθος Ορφέα και Ευρυδίκης – Ο έρωτας, η απώλεια και ο Άδης (Δεύτερο Μέρος)

9. Μια εναλλακτική (αισιόδοξη) εκδοχή Είναι ενδιαφέρον ότι δεν τελειώνουν όλες οι πηγές με την τραγική αποτυχία. Ο ποιητής Ερμησιάναξ (στον κατάλογο των ερωτικών του...

Βασίλης Διαμαντόπουλος: Έντονη προσωπικότητα, ανυποχώρητος, αντισυμβατικός, ιδεολόγος και δάσκαλος μέχρι το τέλος

5 Μαίου 1999, έφυγε από τη ζωή, σε ηλικία 78 ετών, ο Βασίλης Διαμαντόπουλος Έντονη προσωπικότητα, ανυποχώρητος, αντισυμβατικός, ιδεολόγος και δάσκαλος μέχρι το τέλος, ο...

Κόλαφος ο Νίκος Μωραϊτης για τον “μητσοτακο-σημιτόκοσμο” που έφτιαξαν για μας τα δύο κόμματα (ΠΑΣΟΚ-ΝΔ) που χρεοκόπησαν τη χώρα

Στο συνέδριό του το ΠΑΣΟΚ αποφάσισε να μη συγκυβερνήσει με τη ΝΔ, αλλά στη ΓΣΕΕ «συγκυβερνά» πάλι μαζί της με Πρόεδρο τον αιώνιο βολικό...

Εφυγε από τη ζωή ένας από τους πιο αγαπημένους ιερείς μας, ο παπά-Τσάκαλος

Πέθανε ο ιερέας Σπύρος Τσιάκαλος, γνωστός ως παπα-Τσάκαλος, όπως έκανε γνωστό μέσω ανάρτησης ένας εκ των τριών γιων του, ο Κωνσταντίνος Τσιάκαλος. Σύμφωνα με την...

Οργισμένη ανανκονωση του Κώστα Μπακογιάννη για τα ηλεκτρικά πατίνια

Οργισμένη ανακοινωση για τα ηλεκτρικά πατίνια εξέδωσε ο Κώστας Μπακογιάννης Μάλλον ξέχασε πως το 2019 τα διαφήμιζε ο ίδιος….Η κατάσταση με τα ηλεκτρικά πατίνια στην...

47χρονος πέθανε μέσα σε λεωφορείο του ΚΤΕΛ ενώ ταξίδευε

Τραγική κατάληξη είχε το ταξίδι ενός 47χρονου άνδρα, ο οποίος έχασε τη ζωή του μέσα σε λεωφορείο του ΚΤΕΛ χωρίς να γίνει άμεσα αντιληπτό...

Θαργήλια: Η Άγνωστη Γιορτή Εξαγνισμού της Αρχαίας Αθήνας

Τα Θαργήλια ήταν μια από τις σημαντικότερες και πιο αρχαίες αγροτικές και καθαρτήριες εορτές της αρχαίας Αθήνας, αλλά και ολόκληρου του ιωνικού κόσμου Τελούνταν κατά...

Τι Έτρωγαν Πραγματικά οι Αρχαίοι Έλληνες; Η Αλήθεια για τα Λαχανικά (Πρώτο Μέρος)

Η κατανόηση της διατροφής, της γεωργίας και της ιατρικής βοτανικής στην αρχαία Ελλάδα απαιτεί μια πολυεπίπεδη και εξαντλητική προσέγγιση η οποία συνδυάζει οργανικά την αρχαιοβοτανική...

Βίκτωρας Γιαννικόπουλος: Το παιδί θαύμα που στα 15 του μόλις χρόνια συνεργάζεται με την NASA

Ο 15χρονος Βίκτορας είναι μαθητής εχει διακριθεί από πολύ μικρή ηλικία σε διαγωνισμούς φυσικής, αστροφυσικής και κβαντικής φυσικής Το κύριο project του αφορά μια προτεινόμενη...

Αγία Ειρήνη και Άγιος Εφραίμ – Γιορτάζουν σήμερα

Η σημερινή ημέρα 5/5 αποτελεί μεγάλη γιορτή για την εκκλησία μας που τιμά την μνήμη της Αγίας Ειρήνης της Μεγαλομάρτυρος, του Αγίου Εφραίμ του...

Σάλος με την διαπίστωση του Γιώργου Κύρτσου: Σιγά τη.. δημοσκοπική «πτώση» της ΝΔ, ανησυχώ μη πέσει και χτυπήσει

Σιγά τη..δημοσκοπική «πτώση» της ΝΔ, ανησυχώ μη πέσει και χτυπήσει. Σύμφωνα με δημοσκόπηση της Opinion Poll η ΝΔ «έπεσε» στο..31,2%. Ούτε με κυάλια βλέπει η ΝΔ τέτοιο...

Ανέβηκαν Ποτέ οι Αρχαίοι Έλληνες στον Όλυμπο;

Όλοι γνωρίζουμε ότι, σύμφωνα με την ελληνική μυθολογία, οι 12 θεοί κατοικούσαν στον Όλυμπο Όμως, ο Όλυμπος δεν ήταν μόνο ένα συγκεκριμένο βουνό στη Θεσσαλία....

Τίναξε τα μυαλά του στον αέρα μέσα στο αστυνομικό τμήμα

Ενας αστυνομικός βρέθηκε νεκρός μέσα στο Αστυνομικό Τμήμα στο οποίο υπηρετούσε στην Καβάλα Σύμφωνα με πληροφορίες από το proininews.gr, ο ένστολος φέρεται να έθεσε τέλος...

Ρέα: Η Μεγάλη Μητέρα των Θεών και η Θεά της Ροής

Η Ρέα υπήρξε μία από τις σπουδαιότερες Τιτανίδες της ελληνικής μυθολογίας και θεωρείται η Μεγάλη Μητέρα των Θεών Ως σύζυγος του Κρόνου και μητέρα των...

Μύθος Ορφέα και Ευρυδίκης – Ο έρωτας, η απώλεια και ο Άδης (Πρώτο Μέρος)

Η ιστορία του Ορφέα και της Ευρυδίκης αποτελεί το πιο εμβληματικό αρχέτυπο για τη δύναμη της τέχνης απέναντι στον θάνατο αλλά και για την ανθρώπινη...

Η Καθημερινή Ζωή στην Αρχαία Ελλάδα (Δεύτερο Μέρος)

Υπόδηση, Καλλυντικά και Σωματική Υγιεινή Στο σπίτι, οι περισσότεροι κυκλοφορούσαν ξυπόλυτοι, αλλά στις εξόδους φορούσαν δερμάτινα σανδάλια, μαλακά παπούτσια ή μπότες. Οι γυναίκες ενίσχυαν την...

Η ανατρεπτική συμμετοχή της Κροατίας στη Eurovision με θέμα τις γυναίκες που απήχθησαν από την Οθωμανική Αυτοκρατορία

Φέρνει όντως τέτοιο έπος η Κροατία στην Eurovision;; Μέσα σε μία εβδομάδα ξεκινά η Eurovision. Η Τουρκία, μη συμμετέχουσα, επικρίνει τη μουσική διοργάνωση λόγω της...

Χαμός με την ανάρτηση του Κώστα Βαξεβάνη για τον Αλέξη Τσιπρα και την συμφωνία των Πρεσπών

Ο Αλέξης Τσίπρας δεν δέχθηκε να μιλήσει στο ντοκιμαντέρ της Βαρβιτσιώτη γιατί την κατηγορεί ότι με το βιβλίο της οδήγησε στη δολοφονία χαρακτήρα του...

Έσβησε στα 82 της χρόνια η εικαστικός Λιζη Καλλιγά – Η καλλιτέχνης που δάμασε το φως των Σπετσών

Με βαθιά συγκίνηση αποχαιρετούμε τη μητέρα μας Λίζη Καλλιγά που έφυγε σήμερα σε ηλικία 82 ετών Καλλιτέχνης με ιδιαίτερο ειδικό βάρος, άφησε το αποτύπωμά της...

ΔΗΜΟΦΙΛΗ