Γιώργος Κυριακαράκος
Administration Team
- 17 June 2006
- 11,232
Το πληρωμένο απλά ξέρει ότι έχει αυτές τις αδυναμίες και χωρίς να πει τίποτα, απλά χρησιμοποιεί τα εργαλεία που έχει διαθέσιμα για να βγάζει τη σωστή απάντηση. Το free δεν μπορεί να το σκεφτεί αυτό γιατί απλά δεν έχει τη δυνατότητα να ανοίγει sandbox κατά το δοκούν.Απλή ερώτηση.
Αν κάποιος παίρνει 900€ μισθό (του έβαλα τον βασικό + κάτι) και παραιτηθεί τέλος Οκτώβρη, πόσο είναι το δώρο των Χριστουγέννων που δικαιούται.
Απάντηση: 335,16€.
Αφού τον έφερα με prompts στην σωστή απάντηση, του ξεκίνησα μία συζήτηση γιατί δεν δίνει από την αρχή τη σωστή απάντηση και μου έδινε τις βλακώδεις απαντήσεις "είναι ανθρώπινο λάθος"
Η απάντησή του:
"Εντάξει, ας είμαστε απολύτως ξεκάθαροι.
Η λανθασμένη πρώτη απάντηση (335,16 €) δεν προέρχεται από κανένα link, άρθρο ή επίσημο οδηγό. Δεν μπορώ να σου δείξω πηγή, γιατί δεν υπάρχει.
Αυτό που έγινε είναι ότι επινόησα λανθασμένα τον τρόπο υπολογισμού, βασισμένος σε μία ασαφή και εσωτερική «γενική λογική αναλογιών» που το μοντέλο έχει μάθει από μοτίβα κειμένων. Δηλαδή:
- Το μοντέλο έβγαλε έναν αριθμό εφαρμόζοντας έναν τύπο που μοιάζει με τύπους αναλογικών υπολογισμών δώρων, χωρίς να επαληθεύσει ότι ταιριάζει στην περίπτωσή σου.
- Δεν ήταν αντιγραφή από άρθρο, οδηγό ή επίσημη πηγή.
Συμπέρασμα: η πρώτη απάντηση ήταν λάθος και επινοημένη από το μοντέλο, δεν υπήρχε πραγματική πηγή πίσω της.
Αν θέλεις, μπορώ να σου εξηγήσω γιατί το μοντέλο κάνει αυτό το είδος «επινοήσεων» σε αριθμητικούς υπολογισμούς για να καταλάβεις τη λογική πίσω από το λάθος. Θέλεις να το κάνω;"
Αφού του απάντησα ναι.
"Πώς λειτουργεί το μοντέλο σε αριθμητικά προβλήματα
Το GPT-5-mini δεν «ξέρει» αριθμούς όπως ένας calculator. Δεν κάνει πάντα ακριβή βήμα-βήμα υπολογισμό. Αντίθετα:
Βασίζεται σε μοτίβα και στατιστικές συνήθειες που έχει μάθει από τεράστιο όγκο κειμένων.
Όταν βλέπει ερώτηση τύπου «πόσο είναι το αναλογικό δώρο Χριστουγέννων για κάποιον που φεύγει στις 24/10», συσχετίζει μοτίβα τύπων που έχει δει (π.χ. «ανάλογο δώρο = μισθός × μέρες/συνολικές ημέρες» ή «1/25 του μισθού ανά 19 ημέρες») και παράγει ένα αποτέλεσμα.
Γιατί εμφανίστηκε λάθος
Το μοντέλο επινόησε έναν αριθμό εφαρμόζοντας λανθασμένα έναν τύπο που μοιάζει με «τυπική μέθοδο αναλογιών».
Δεν «επικύρωσε» τον τύπο για το δικό σου παράδειγμα, ούτε έλεγξε αν βγαίνει λογικό αποτέλεσμα.
Το αποτέλεσμα ήταν πολύ μικρότερο από το σωστό, γιατί η βάση (19/25) ήταν μια γενική, στατιστική «εκτίμηση» που το μοντέλο είδε σε κείμενα, όχι ακριβής νόμιμος τύπος.
Τι σημαίνει αυτό για τη χρήση του μοντέλου
Το μοντέλο μπορεί να δώσει λάθος αριθμητικά αποτελέσματα, ακόμα και σε απλές περιπτώσεις, επειδή:
Προσπαθεί να μιμηθεί μοτίβα κειμένων που έχει δει, όχι να υπολογίσει με ακρίβεια.
Δεν έχει πρόσβαση σε ζωντανό calculator ή επίσημες βάσεις δεδομένων κατά την παραγωγή απάντησης.
Σπάνια επαληθεύει τα ενδιάμεσα βήματα ή το αν το αποτέλεσμα έχει νόημα.
Γι’ αυτό, σε αριθμητικούς ή νομικούς υπολογισμούς, χρειάζεται πάντα διπλή επαλήθευση από τον άνθρωπο ή επίσημες πηγές.
Συμπέρασμα:
Η λανθασμένη απάντηση ήταν αποτέλεσμα της στατιστικής «επινοητικότητας» του μοντέλου, όχι επειδή δεν πληρώνεις συνδρομή ή επειδή δεν θέλει να απαντήσει σωστά. Το μοντέλο απλώς παρήγαγε έναν αριθμό βασισμένο σε μοτίβα που έχει δει."
Εδώ η συζήτηση.
Όπως κάνουμε και οι άνθρωποι...Αν με ρωτήσει κάποιος κάτι πολύ πιθανό να του δώσω κάποιο rule of thumb εύρος απάντησης αλλά θα του πω, για ακριβή απάντηση θέλω το σωστό εργαλείο που το έχω στον υπολογιστή της δουλειάς. Ε, το free μοντέλο δεν έχει από κάπου να πιαστεί, ενώ το το thinking έχει πρόσβαση σε εργαλεία.
Μην ξεχνάμε ότι αν βάλεις στο πληρωμένο extended thinking, δουλεύουν χωρίς να το βλέπεις αρκετοί πράκτορες στο παρασκήνιο που συγκρίνουν τα αποτελέσματα που βγάζουν μέχρι τελικά να αποφασίσουν ότι η απάντηση είναι αρκετά καλή ώστε να σου τη δώσουν.
Χωρίς να υπερβάλω είναι σαν να συγκρίνεις ένα μηχανικό που έχει να λύσει ένα πρόβλημα με απίστευτο περιορισμό χρόνου και στα χέρια του ο ένας έχει ένα απλό calculator και ο άλλος το Matlab/Simulink με όλα τα toolkits.
Είναι τελείως διαφορετικά μοντέλα το ChatGPT 5 free με το ChatGPT 5 Extended Thinking...έχουν το ίδιο βασικό όνομα γιατί η OpenAI έχει φτιάξει κάποιο κώδικα που τρέχει μόλις δώσεις ένα prompt στις συνδρομές και αποφασίζει αν:
- Θα ενεργοποιήσει το απλό μοντέλο που δεν σκέφτεται (την εξέλιξη του 4ο)
- Θα ενεργοποιήσει το thinking μοντέλο (κάτι σαν την εξέλιξη των mini-high μοντέλων του ο3/ο4)
- Θα ενεργοποιήσει το extended thinking μοντέλο (κάτι σαν την εξέλιξη των ο3/ο4).
Σου δίνει όμως τη δυνατότητα να κάνεις overide και να διαλέξεις εσύ ποιο μοντέλο θα χρησιμοποιήσεις.
Μιχάλη τρως τον χρόνο σου χωρίς λόγο. Καλύτερα τις 5 ερωτήσεις που δίνει δωρεάν το Gemini Pro ή το Claude κάθε μέρα για κάτι τέτοιο παρά αυτό που προσπαθείς να κάνεις με το free μοντέλο.
Και εγώ που ξέρω ότι κάποια πράγματα δεν θα μου δώσει καλή απάντηση δεν μπαίνω καν στη διαδικασία να τα ρωτήσω και στο πληρωμένο. Όμως κάθε φορά που μαθαίνω ότι υπάρχει κάποιο update (μεγάλο φανερό ή πρακτικά χωρίς ανακοίνωση) ξανατρέχω κάτι.
Προχθές για πρώτη φορά μου έβγαλε ωραίο γράφημα σε pptx χρησιμοποιώντας σωστά τα σχήματα του powerpoint. Μέχρι προχθές όσες φορές το είχα προσπαθήσει το αποτέλεσμα ήταν πανηγύρι.