Γιατί ο φοιτητής είναι η υπέρτατη μηχανή βελτιστοποίησης του πως θα πάρω 5 με ελάχιστο διάβασμα. Κάνω μαθήματα και εξετάσεις σε προπτυχιακό και μεταπτυχιακό επίπεδο κάπου 20 χρόνια τώρα και μου έχει γίνει ξεκάθαρο

Στο τωρινό μεταπτυχιακό που κάνω μάθημα στις εξετάσεις τους έχω 20 ερωτήσεις σωστό/λάθος, 16 ερωτησεις πολλαπλής επιλογής, 3 θέματα να διαλέξουν τα 2 για μικρή ανάπτυξη (μαξ 3 προτάσεις) και 3 θέματα να διαλέξουν τα 2 για ανάπτυξη 1 σελίδας Α4. Με τη σημείωση ότι δεν έχω αρνητική βαθμολογία, δεν υπάρχει ούτε 1 φοιτητής που να μην έχει συμπληρώσει το πρώτο μισό ακόμη και αν οι απαντήσεις δείχνουν ότι είναι αδιάβαστος

(Μικρό Off-topic, ο μόνος τρόπος στην εποχή των LLM να εξετάσεις και να είσαι σίγουρος είναι με προφορική εξέταση, αλλά είναι χρονοβόρο, δύσκολο και γενικά το αποφεύγουν).
Κι αν και ο δεύτερος "φοιτητής" είναι το ίδιο άσχετος;
Είναι πολύ σπάνιο να είναι ακριβώς το ίδιο άσχετος με τον προηγούμενο. Και ο άσχετος για να έχει περάσει πανεπιστήμιο έχει κάποιες γνώσεις που τον ένα να μπορούν να τον βοηθήσουν στη μία ερώτηση και στην άλλη τον άλλον ή να ήταν στο αμφιθέατρο σε διαφορετικές παραδόσεις και να του έχει μείνει κάτι. Επίσης αν τους αφήσεις να επιχειρηματολογούν μεταξύ τους σχεδόν πάντα (όχι όμως πάντα) η απάντηση του γκρουπ πάει πιο κοντά στη σωστή απάντηση και στη πραγματική ζωή.
Η οποία έκδοση έχει φάει απίστευτο τρολάρισμα...
Το βασικό κύμα hate είχε να κάνει με τον κόσμο που το χρησιμοποιούσε στην προσωπική του ζωή σαν φίλο, σύντροφο, ψυχολόγο, κλπ. Και αν ψάξεις τις αναφορές κανείς δεν ζήτησε επαναφορά του ο1, ο3, ο4-mini-high...όλοι αυτής της κατηγορίας ζήταγαν το 4ο να επιστρέψει.
Και επίσης το 5 έχει καμπύλη εκμάθησης. Μου πήρε αρκετές μέρες να καταλάβω τις ιδιαιτερότητές του, πως πρέπει να το ρωτάω κλπ.
Είναι το πρώτο μοντέλο που εύκολα στήνει sandbox γράφει κώδικα σε python με πρόσβαση σε πραγματικά πολλές βιβλιοθήκες και βγάζει αποτέλεσμα πάρα πολύ καλό με δραστικά μειωμένα τα λάθη σε νούμερα και υπολογισμούς. Επίσης το deep research μπορείς να το χρησιμοποιήσεις και υβριδικά για να σου γράψει μεγάλο κείμενο (πχ άνω των 20,000 λέξεων) με τη μία, ενώ το βασικό παράθυρο περιορίζεται στις ~3000 λέξεις.
Αρκεί δε ένα Prompt σε νέα κουβέντα να ψάξει αν είναι factually correct το κείμενο που σου έδωσε σε άλλο chat για να δεις αν κάτι είναι παραίσθηση. Και πια οι παραισθήσεις έχουν μειωθεί πολύ. Αυτό που συμβαίνει συχνά είναι πχ να σου παραθέτει με πηγές νούμερα πχ του 2023 ενώ εσύ θες του 2025. Όμως όταν σου λέει και την πηγή του αριθμού δεν μπορείς να το κατηγορίσεις για λανθασμένη απάντηση. Ίσως το ChatGPT 4.5 να ήταν ένα τσακ καλύτερο σε αυτό το συγκεκριμένο task και μόνο.
Επίσης εύκολα έχει πρόσβαση σε "κλειδωμένη" επιστημονική βιβλιογραφία αν του πεις ότι έχεις μέσω πανεπιστημίου πρόσβαση πχ. σε Elsevier, IEEE, Spinger, Willey κλπ. Δεν θα σου δώσει ποτέ το άρθρο το κλειδωμένο, αλλά στις πηγές του θα συμπεριλάβει και άρθρα από εκεί που θα μπορείς εσύ να ανοίξεις μέσω της συνδρομής του ιδρύματός σου.
Σε συγκεκριμένα task που το έχουμε δοκιμάσει με συναδέλφους σε επιστημονικά κείμενα, αντιδρά πολλές φορές καλύτερα από καθηγητές πανεπιστημίου με 30 χρόνια πραγματική εμπειρία στο αντικείμενο με εκτενές συγγραφικό έργο. Θα σου δώσω και συγκεκριμένο παράδειγμα. Μια ομάδα γράφει ένα επιστημονικό άρθρο. Πολλές φορές (πριν κατατεθεί το άρθρο το διαβάζει κάποιος με πραγματικά μεγάλη εμπειρία στο αντικείμενο (και συνήθως μπαίνει ως τελευταίο όνομα στο paper). Αυτός κάνει στοχευμένα σχόλια που θα μπορούσε να τα κάνει κάποιος reviewer. Λοιπόν αυτό που κάναμε είναι να κάνουμε παράλληλα την διαδικασία και φυσικά να συζητήσουμε μετά τα αποτελέσματα. Να το πω με απλά λόγια, όλα (100%) των σχολίων του ChatGPT 5 thinking ήταν λογικά, σωστά τεκμηριωμένα και με προτάσεις που θα μπορούσαν να υιοθετηθούν για να ξεπεραστούν. Κάποια τα βρήκαμε τραβηγμένα από την οπτική ότι θα έπρεπε να έχεις διατομεακή ομάδα για να τα δει αυτά συγκεντρωτικά, αλλά η επιστήμη ξεκάθαρα πάει σε διατομεακή (multi- και inter-disciplinary) έρευνα. Επίσης ένα άλλο σχόλιο ήταν ότι αν τα κάναμε όλα αυτά, θα το στέλναμε σε journal με υψηλότερο impact factor (I.F.). Το ΑΙ εργαλείο δεν μπορεί να ξέρει ότι δεν στοχεύουμε πάντα για το 1 υπέρτατο paper, αλλά μπορεί να έχουμε στρατηγική για περισσότερα άρθρα κάποια σε journal υψηλότερου I.F. και άλλα σε χαμηλότερου με πολύ λογική τεκμηρίωση για αυτό.
Δεν ξέρω αν αυτό βαφτίζεται AGI και δεν έχει καμία σημασία. Αλλά με τέτοιες δυνατότητες έχει ήδη ξεφύγει από τη χρήση ως junior συνεργάτη αποφοίτου μεταπτυχιακού με 3 χρόνια προϋπηρεσία που το αξιοποιούμε τώρα.