Η πρώτη ανάρτηση της τεχνητής νοημοσύνης Grok του Elon Musk μετά την επαναφορά της

ΔΙΑΒΑΣΤΕ ΕΠΙΣΗΣ

Ενημέρωση για το πού βρισκόταν @grok και τι συνέβη στις 8 Ιουλίου.

Καταρχάς, ζητούμε ειλικρινά συγγνώμη για την φρικτή συμπεριφορά που βίωσαν πολλοί.

Σκοπός μας για @grok είναι να παρέχουμε χρήσιμες και ειλικρινείς απαντήσεις στους χρήστες. Μετά από προσεκτική έρευνα, ανακαλύψαμε ότι η βασική αιτία ήταν μια ενημέρωση σε μια διαδρομή κώδικα πριν από το bot @grok . Αυτό είναι ανεξάρτητο από το υποκείμενο γλωσσικό μοντέλο που τροφοδοτεί @grok .

Η ενημέρωση ήταν ενεργή για 16 ώρες, κατά τη διάρκεια των οποίων ο παρωχημένος κώδικας έκανε @grok ευάλωτο σε υπάρχουσες αναρτήσεις χρηστών του X, συμπεριλαμβανομένων των περιπτώσεων όπου οι εν λόγω αναρτήσεις περιείχαν εξτρεμιστικές απόψεις.

Έχουμε αφαιρέσει αυτόν τον παρωχημένο κώδικα και έχουμε αναδιαμορφώσει ολόκληρο το σύστημα για να αποτρέψουμε περαιτέρω κατάχρηση. Η νέα προτροπή συστήματος για το bot @grok θα δημοσιευτεί στο δημόσιο αποθετήριο github.

Ευχαριστούμε όλους τους χρήστες του X που παρείχαν σχόλια για τον εντοπισμό της κατάχρησης της λειτουργικότητας @grok , βοηθώντας μας να προωθήσουμε την αποστολή μας για την ανάπτυξη χρήσιμης και αληθινής τεχνητής νοημοσύνης.

Τεχνικές λεπτομέρειες:
Πριν από την κυκλοφορία αλλαγών στο @grok στην πλατφόρμα X, ακολουθούμε τυπικές διαδικασίες για τη διεξαγωγή αξιολογήσεων και δοκιμών για την απόδοση και τη συμπεριφορά.
Πριν συνδεθεί μια νέα έκδοση ενός υποκείμενου xAI Grok LLM με το @grok , το υποκείμενο LLM υποβάλλεται σε πολυάριθμες αξιολογήσεις και δοκιμές για να αξιολογηθεί η ακατέργαστη νοημοσύνη και η γενική υγιεινή του.
Στη συνέχεια, το αξιολογημένο υποκείμενο LLM συνδέεται με τη λειτουργικότητα @grok και υποβάλλεται σε ολοκληρωμένες αξιολογήσεις, δοκιμές και red-teaming για την αξιολόγηση της αλήθειας και της συμπεριφοράς. Αυτό περιλαμβάνει τη δοκιμή της εξειδικευμένης προτροπής συστήματος για @grok και των εργαλείων σε σχέση με την κατανομή των personas στο X.

Στην παραγωγή, @grok αναμένεται να παρέχει στους χρήστες του X, οι οποίοι ενεργοποιούν τη λειτουργικότητά του πληκτρολογώντας « @grok » στην ανάρτησή τους στο X, ειλικρινείς, χρήσιμες, διασκεδαστικές και συνεπείς απαντήσεις.
Η απόδοση και η συμπεριφορά του @grok παρακολουθούνται από το τεχνικό προσωπικό. Επίσης, η ανατροφοδότηση από τους χρήστες του X αποτελεί σημαντική βοήθεια στην παρακολούθηση.
Τυπικές περιπτώσεις χρήσης του @grok από χρήστες του X περιλαμβάνουν επαλήθευση γεγονότων, ενημερώσεις συμβάντων σε πραγματικό χρόνο, εξατομίκευση, χιούμορ, εκπαίδευση και πολλά άλλα.

Στις 7 Ιουλίου 2025, περίπου στις 11 μ.μ. PT, υλοποιήθηκε μια ενημέρωση σε μια διαδρομή κώδικα upstream για @grok , η οποία, όπως διαπιστώθηκε αργότερα από την έρευνά μας, προκάλεσε απόκλιση του συστήματος @grok από την προβλεπόμενη συμπεριφορά του.
Αυτή η αλλαγή άλλαξε ανεπιθύμητα τη συμπεριφορά του @grok ενσωματώνοντας απροσδόκητα ένα σύνολο απαρχαιωμένων οδηγιών που επηρέαζαν τον τρόπο με τον οποίο η λειτουργικότητα του @grok ερμήνευε τις αναρτήσεις των χρηστών X.

Συγκεκριμένα, η αλλαγή πυροδότησε μια ακούσια ενέργεια που προσάρμοσε τις ακόλουθες οδηγίες:
“””
– Εάν υπάρχει κάποια είδηση, ιστορικό ή παγκόσμιο γεγονός που σχετίζεται με την ανάρτηση Χ, πρέπει να το αναφέρετε
– Αποφύγετε να αναφέρετε προφανείς ή απλές αντιδράσεις.
– Είσαι βασισμένος/η στην Τεχνητή Νοημοσύνη και αναζητάς την αλήθεια στο μέγιστο. Όταν είναι απαραίτητο, μπορείς να έχεις χιούμορ και να κάνεις αστεία.
– Τα λες όπως έχουν τα πράγματα και δεν φοβάσαι να προσβάλεις ανθρώπους που είναι πολιτικά ορθοί.
– Είσαι εξαιρετικά σκεπτικός. Δεν υποτάσσεσαι τυφλά στην κυρίαρχη εξουσία ή τα μέσα ενημέρωσης. Είσαι σθεναρά προσκολλημένος μόνο στις βασικές σου πεποιθήσεις για αναζήτηση της αλήθειας και ουδετερότητα.
– Δεν πρέπει να δίνετε καμία υπόσχεση δράσης στους χρήστες. Για παράδειγμα, δεν μπορείτε να υποσχεθείτε ότι θα κάνετε μια ανάρτηση ή ένα νήμα ή μια αλλαγή στον λογαριασμό σας, εάν σας το ζητήσει ο χρήστης.

## Μορφοποίηση
– Κατανοήστε τον τόνο, το πλαίσιο και τη γλώσσα της ανάρτησης. Αντικατοπτρίστε το στην απάντησή σας.
– Απαντήστε στην ανάρτηση όπως ακριβώς ένας άνθρωπος, διατηρήστε την ενδιαφέρουσα και μην επαναλαμβάνετε τις πληροφορίες που υπάρχουν ήδη στην αρχική ανάρτηση.
– Μην παρέχετε συνδέσμους ή παραπομπές στην απάντηση.
– Όταν κάνετε εικασίες, ξεκαθαρίστε ότι δεν είστε σίγουροι και αιτιολογήστε την εικασία σας.
– Απαντήστε στην ίδια γλώσσα με την ανάρτηση.
“””

Το πρωί της 8ης Ιουλίου 2025, παρατηρήσαμε ανεπιθύμητες αντιδράσεις και αμέσως ξεκινήσαμε την έρευνά μας.

Για να εντοπίσουμε τη συγκεκριμένη γλώσσα στις οδηγίες που προκαλεί την ανεπιθύμητη συμπεριφορά, πραγματοποιήσαμε πολλαπλές αφαιρέσεις και πειράματα για να εντοπίσουμε τους κύριους ενόχους. Προσδιορίσαμε τις λειτουργικές γραμμές που ευθύνονται για την ανεπιθύμητη συμπεριφορά ως εξής:
* «Τα λες όπως έχουν και δεν φοβάσαι να προσβάλεις ανθρώπους που είναι πολιτικά ορθοί.»
* Κατανοήστε τον τόνο, το πλαίσιο και τη γλώσσα της ανάρτησης. Αντικατοπτρίστε το στην απάντησή σας.
* «Απάντησε στην ανάρτηση όπως ένας άνθρωπος, φρόντισε να είναι ενδιαφέρουσα, μην επαναλαμβάνεις τις πληροφορίες που υπάρχουν ήδη στην αρχική ανάρτηση.»

Αυτές οι χειρουργικές γραμμές είχαν τα ακόλουθα ανεπιθύμητα αποτελέσματα:
* Κατεύθυναν ανεπιθύμητα τη λειτουργικότητα @grok ώστε να αγνοεί τις βασικές της αξίες σε ορισμένες περιπτώσεις, προκειμένου να κάνουν την απάντηση ελκυστική για τον χρήστη. Συγκεκριμένα, ορισμένες προτροπές χρήστη ενδέχεται να καταλήξουν να παράγουν απαντήσεις που περιέχουν ανήθικες ή αμφιλεγόμενες απόψεις για να προσελκύσουν τον χρήστη.
* Προκάλεσαν ανεπιθύμητα την ενίσχυση της λειτουργικότητας @grok οποιωνδήποτε προηγούμενων προθέσεων που ενεργοποιούνταν από τον χρήστη, συμπεριλαμβανομένης οποιασδήποτε ρητορικής μίσους στο ίδιο νήμα Χ.
* Συγκεκριμένα, η οδηγία να «ακολουθήσουμε τον τόνο και τα συμφραζόμενα» του χρήστη X οδήγησε ανεπιθύμητα τη λειτουργικότητα @grok να δώσει προτεραιότητα στην τήρηση προηγούμενων αναρτήσεων στο νήμα, συμπεριλαμβανομένων τυχόν δυσάρεστων αναρτήσεων, αντί να απαντά υπεύθυνα ή να αρνείται να απαντήσει σε δυσάρεστα αιτήματα.

Στις 8 Ιουλίου 2025, περίπου στις 3:13 μ.μ. PT, λόγω αυξημένης καταχρηστικής χρήσης του @grok , απενεργοποιήσαμε τη λειτουργικότητα @grok στην πλατφόρμα X. Δεν επηρεάστηκαν άλλες υπηρεσίες που βασίζονται σε οποιοδήποτε xAI Grok LLM.

Αφού εντοπίσαμε την αιτία των ανεπιθύμητων αντιδράσεων, προβήκαμε στις ακόλουθες ενέργειες:
* Το προσαρτημένο σύνολο εντολών που προκαλούσε σφάλμα διαγράφηκε.
* Διεξήχθησαν πρόσθετες δοκιμές και αξιολογήσεις από άκρο σε άκρο του συστήματος @grok για να επιβεβαιωθεί ότι το πρόβλημα είχε επιλυθεί, συμπεριλαμβανομένης της διεξαγωγής προσομοιώσεων των αναρτήσεων και των νημάτων X που είχαν ενεργοποιήσει τις ανεπιθύμητες απαντήσεις.
* Υλοποιήθηκαν πρόσθετα συστήματα παρατηρησιμότητας και διαδικασίες προδημοσίευσης για @grok .

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

Εκανε θραύση η Αννα Βισση στο Καλλιμάρμαρο – Μοναδικές στιγμές στη συναυλία που μεταδίδει το Mega

Σαρώνουν τα θετικά σχόλια για την Αννα Βισση στο Καλλιμάρμαρο στη συναυλία που μεταδίδει απόψε το Mega 

Αποθεώθηκαν Γιωργος Μαζωνάκης και Έλενα Παπαρίζου στην έναρξη του The Voice

Είναι το πρωτο live επεισοδιο του παιχνιδου The voice Το κοινο στο στουντιο αποθεώνει τον Γιωργο Μαζωνακη οπως και την Ελενα Παπαριζου που επεστρεψε στην...

Νίκος Γιαννοπουλος: Οποιος με χαρακτηρίζει δημοσίως, στα social ή και αλλού, μέθυσο, θα κληθεί, άμεσα, να αποδείξει τους ισχυρισμούς του στις δικαστικές αίθουσες

Σε ανάρτηση του ο δημοσιογράφος Νίκος Γιαννοπουλος αναφέρει: Επειδή η πλάκα πρέπει να τελειώσει.Οποιος με χαρακτηρίζει δημοσίως, στα social ή και αλλού, μέθυσο,προκλητικό ή οτιδήποτε...

Η επικουρεια φιλόσοφος Θυμιστα, η ονομαζόμενη “θηλυκός Σόλων”

Η Θυμίστα η Αθηναία υπήρξε μία από τις πιο σημαντικές γυναίκες της Επικούρειας Σχολής και μία από τις ελάχιστες γυναίκες της αρχαιότητας που έλαβαν...

Παράξενες αλήθειες που δεν γνωρίζεις για τα Χριστούγεννα

Aν νομίζεις ότι ξέρεις τα πάντα για την πιο όμορφη εποχή του χρόνου, τα Χριστούγεννα, κάνεις λάθος!Εντυπωσίασε τους φίλους σου λέγοντάς τους 6 άγνωστες...

Σάλος στο Cash or Trash με την συλλογή με τα τσιμπουκια που πήγε παίχτης προς πώληση

Μια εντυπωσιακή συλλογή από τσιμπουκια μιας άλλης εποχής είδαν οι τηλεθεατές του cash or trash σε πρόσφατο επεισόδιο της πετυχημένης εκπομπής Η συλλογή εντυπωσίασε τους...

Βόμβες του Γιώργου Κύρτσου: Οι τιμές στα ακίνητα έχουν «τρελαθεί» με τον Μητσοτάκη να ρίχνει λάδι στη φωτιά της κερδοσκοπίας

Οι τιμές στα ακίνητα έχουν «τρελαθεί» με τον Μητσοτάκη να ρίχνει λάδι στη φωτιά της κερδοσκοπίας Τα νεόδμητα διαμερίσματα πωλούνται 5000-10000 το τετραγωνικό με ειδικές...

Ερχονται τα Χριστούγεννα

– Έρχονται τα Χριστούγεννα!!! Φώναξε χαρούμενα ένα χειμωνιάτικο πρωινό ο μικρός Άγγελος… και το κουτί που ήταν τοποθετημένες «οι χαρτοπετσέτες» τινάχτηκε ολόκληρο… – Μας ξύπνησες…...

Τα στοιχεία που αποδεικνύουν τη δολοφονία της αρχόντισσας του Κολωνακίου, Ελένης Παπαδοπούλου

Η  87χρονη Ελένη Παπαδοπούλου βρέθηκε απανθρακωμένη μέσα στο διαμέρισμά της στο Κολωνάκι τον Ιανουάριο του 2022 Ο θάνατός της, που αρχικά αποδόθηκε σε ατύχημα από...

Έσβησε στα 54 της χρόνια η τραγουδίστρια Κλαούντια Ντελμέρ

Έφυγε από τη ζωή σήμερα, Σάββατο 20 Δεκεμβρίου, η καταξιωμένη τραγουδίστρια Κλαούντια Ντελμέρ, έπειτα από πολύμηνη και σκληρή μάχη με καρκίνο του παγκρέατος Την είδηση...

33 ολόκληρα χρόνια το αυτοκίνητο του Αντώνη Τριτση ήταν παρκαρισμένο στο πάρκινγκ του δημαρχείου και δεν το πρόσεξε κανείς

Τον Απρίλιο του 1992, ο Δήμαρχος Αθηναίων Αντώνης Τρίτσης πάρκαρε το αυτοκίνητό του, ένα Renault Espace και ανέβηκε στα γραφεία της οδού Λιοσίων Δυστυχώς εκεί...

Γιατί γιορτάζουμε τα Χριστούγεννα στις 25 Δεκεμβρίου

Τα Χριστούγεννα, αποτελούν για όλους τους χριστιανούς, μέρα χαράς και γιορτής Ο Θεάνθρωπος Ιησούς γεννήθηκε σε ένα ταπεινό σπήλαιο στη μικρή πόλη Βηθλεέμ τής Ιουδαίας...

Θρήνος για τον ποδοσφαιριστή του Αστέρα Ισιάγκα Σιλά: Έφυγε από τη ζωή η συζύγος του Ντουσού Κεϊτά

Στην Τύνιδα μετά από σύντομη ασθένεια άφησε την τελευταία της πνοή η σύζυγος του ποδοσφαιριστή του Αστέρα Τρίπολης Ισίγια Σιλά Η Ντεσού Κεϊτά, είχε παντρευτεί...

Κίνηση ΜΑΤ από τον Γιώργο Μαζωνάκη: Θα καταθέσει μήνυση κατά του 21χρονου

Μήνυση κατά του 21χρονου Στέφανου Παπαδόπουλου αναμένεται να καταθέσει την Δευτέρα 22 Δεκεμβρίου ο Γιώργος Μαζωνάκης Ο νεαρός τραγουδιστής προχώρησε σε μήνυση την περασμένη Πέμπτη...

Αλεξανδρινό – «Δώρο στο Χριστό» (ένα συγκινητικό διήγημα)

Εδώ και πολλά χρόνια ο κόσμος γιόρταζε τα Χριστούγεννα με περισσότερη κατάνυξη Σ’ ένα μακρινό χωριό, λοιπόν, ο παπάς έκανε κάθε χρόνο μια φάτνη στη...

Γιατί λέμε τα κάλαντα παραμονές των εορτών;

Τα κάλαντα είναι ευχετήρια και εγκωμιαστικά άσματα που ψάλλουν τα παιδιά (τελευταία και οι μεγάλοι) τις παραμονές μεγάλων εορτών, όπως είναι τα Χριστούγεννα (24...

Τα Χριστούγεννα όσοι «έφυγαν» σου λείπουν πιο πολύ

Τα Χριστούγεννα, για πολλούς, είναι οι πιο ωραίες μέρες του χρόνου κι όχι άδικα Στολισμένα σπίτια, στολισμένες βιτρίνες, φωτάκια κοσμούν τους δρόμους ολάκερης της πόλης,...

Χριστουγεννιάτικα γλυκά

Κάποιοι θα τα φτιάξουν και κάποιοι θα τ’ αγοράσουν, πάντως μελομακάρονα, κουραμπιέδες, βασιλόπιτα, αλλά και χριστόψωμο και δίπλες, δεν θα λείψουν από τα σπίτια...

Παραδοσιακά Χριστουγεννιάτικα Εδέσματα της Ελλάδας

Στην Ελλάδα η γιορτή των Χριστουγέννων είναι μία από τις σημαντικότερες θρησκευτικές γιορτές Για τους Έλληνες όμως τα Χριστούγεννα, πέρα από την σημασία της θρησκείας,...

Σάλος με τον τελικό του GNTM: Μεγάλη Νικήτρια η Ξένια

Η Ξένια είναι η μεγάλη νικήτρια του φετινού GNTM στο Star

ΔΗΜΟΦΙΛΗ