Τεχνητή Νοημοσύνη (AI). Τι είναι, τι ξέρουμε, τι αλλάζει στη ζωή και στον πολιτισμό;

Η μεγαλύτερη μαυρίλα των τελευταίων χρόνων είναι η θεωρία του σκοτεινού δάσους που αναπτύσει ο Liu στο δεύτερο βιβλίο της τριλογίας του three body problem, που λέει πολύ απλά, σκότωσε όποιον κατώτερο πολιτισμό βρεις ώστε να σιγουρέψεις ότι δεν θα μπορέσει να αναπτυχθεί στο επίπεδο που θα μπορούσε αυτός να καταστρέψει εσένα...
Δεν υπάρχει νομίζω κάτι χειρότερο από αυτό. Βέβαια οι περισσότεροι συγγραφείς πιστέυουν στην ευγενή πολιτισμική ανωτερότητα.
Αναφέρεται σε θεωρία για τον γαλαξία, και είναι λίγο άσχετο. Από την άλλη, αυτό ακριβώς δεν συμβαίνει αυτή την στιγμή στην ανθρωπότητα, εδώ στην γη? Χώρες που θέλουν να καταστρέψουν άλλες για να είναι αυτές νούμερο 1? Η μόνη διαφορά στην θεωρία είναι ότι τώρα το κάνουμε για λεφτά και πρώτες ύλες, εκεί είναι προστασία από έναν άλλο πολιτισμό.
Το να συγκρίνουμε όμως ζωντανές οντότητες, με DNA (ή ότι άλλο θα έχουν) και αισθήσεις, με μηχανήματα δεν γίνεται.
Εάν και όταν ένα μηχάνημα φτάσει την ικανότητα του Bicentennial Man, στην ομότιτλη ταινία, και έχει όχι μόνο αισθήματα αλλά και πραγματικές αισθήσεις και ερεθίσματα, τότε να ξαναμιλήσουμε. Αλλιώς είναι ακριβώς όπως και ο Will στο Good Will Hunting. Ξέρει αυτά που έχει διαβάσει στα βιβλία και τα δεδομένα. Δεν έχει ζήσει όμως τίποτα. Και αυτό είναι που μας κάνει ανθρώπους, καλούς ή κακούς.
 
Η μεγαλύτερη μαυρίλα των τελευταίων χρόνων είναι η θεωρία του σκοτεινού δάσους που αναπτύσει ο Liu στο δεύτερο βιβλίο της τριλογίας του three body problem, που λέει πολύ απλά, σκότωσε όποιον κατώτερο πολιτισμό βρεις ώστε να σιγουρέψεις ότι δεν θα μπορέσει να αναπτυχθεί στο επίπεδο που θα μπορούσε αυτός να καταστρέψει εσένα...
Δεν υπάρχει νομίζω κάτι χειρότερο από αυτό. Βέβαια οι περισσότεροι συγγραφείς πιστέυουν στην ευγενή πολιτισμική ανωτερότητα.

Ανωτερότητα με τα ανθρώπινα κριτήρια. Μέχρι εκεί που φτάνει το ανθρώπινο μυαλό να ορίσει το καλό και το κακό. Ούτε καν αυτό δεν μπορούμε να ξέρουμε όμως. Ίσως το σύμπαν δεν σου χρωστάει καλό για εσένα. Ίσως το καλό για εσένα να είναι κακό για το σύμπαν.
 
Η μεγαλύτερη μαυρίλα των τελευταίων χρόνων είναι η θεωρία του σκοτεινού δάσους που αναπτύσει ο Liu στο δεύτερο βιβλίο της τριλογίας του three body problem, που λέει πολύ απλά, σκότωσε όποιον κατώτερο πολιτισμό βρεις ώστε να σιγουρέψεις ότι δεν θα μπορέσει να αναπτυχθεί στο επίπεδο που θα μπορούσε αυτός να καταστρέψει εσένα...
Δεν υπάρχει νομίζω κάτι χειρότερο από αυτό. Βέβαια οι περισσότεροι συγγραφείς πιστέυουν στην ευγενή πολιτισμική ανωτερότητα.
Πολύ κινέζικη θεώρηση των πραγμάτων.Κατ αρχήν υποθέτει ότι το όποιο εξελιγμένο είδος θα θέλει σώνει και καλά να έρθει στη Γη, θα μπορεί να αναπνέει τον αέρα μας, να περπατάει στη βαρύτητα μας κλπ. Ή ότι θα είναι τόσο κολλημένο με την κατάκτηση που θα θέλει να έρθει σώνει και καλά εδώ, ακόμη κι αν το περιβάλλον είναι αφιλόξενο γι αυτό, (π.χ. όπως οι εξωγήινοι του Σιάμαλαν στο Signs που ήθελαν να κατακτήσουν έναν πλανήτη πουαποτελείται κατά 70% απο νερό, βρέχει, έχει ατμόσφαιρα γεμάτη υδρατμούς-άσχετα που το νερό επιδρά πάνω τους όπως το θειϊκό οξύ σε εμάς. Σα να θέλαμε να κατακτήσουμε εμείς την Αφροδίτη ένα πράμα.)
Τέλος, ας μην ξεχνάμε ότι μπορεί η αφεντιά μας να έχει εξολοθρεύσει ένα σωρό είδη, αλλά παρόλα αυτά στον πλανήτη κατοικούν μερικές χιλιάδες είδη θηλαστικά, αλλά τόσα ερπετά και εκατομμύρια είδη ψάρια, έντομα κλπ.
 
Επιτυχημένα, τίποτα από αυτά.
Στη δημιουργία τεχνολογιών πρέπει να φανταστεί το τι λάθος χρήση μπορεί να κάνει ο χρήστης.
Η δημιουργία τέχνης έχει μεν κανόνες αλλά άντε να σκεφτεί να βγάλει ένα Take 5. Μουσική σε πέμπτα αντί για τέταρτα ούτε στα πιο τρελά τους όνειρα.
Να αντικαταστήσει μία νταντά ή να βγάλει έξω έναν σκύλο, ούτε για πλάκα, εκτός αν έχεις τη φιλοσοφία "ε δεν πειράζει, θα πάρουμε άλλο".
Μπορείς να φανταστείς πόσα πράγματα μπορεί να πάνε στραβά;
Στη διοίκηση ανθρώπινων πόρων τίποτα δεν είναι απλά νουμεράκια.

Προς το παρόν, μία πολύ καλή μηχανή αναζήτησης είναι και τίποτα παραπάνω.

Σχετικό Μιχάλη.
Υπάρχει μοντέλο που παίρνει χρυσό στην μαθηματική ολυμπιάδα λ.χ.

Η επαφή που έχει ο περισσότερος κόσμος είναι με τα δωρεάν μοντέλα τα οποία είναι φυσικά λιγότερων παραμέτρων και με πολύ μικρότερο thinking budget. Συν το ότι εάν δεν δώσεις σωστό prompt, πιθανότατα δεν θα πάρεις και σωστή απάντηση.
Εγώ που δεν έχω σχέση με το frontend development για παράδειγμα, πολύ εύκολα, με ένα από τα μοντέλα της Claude μπορώ να δημιουργήσω σε 2 λεπτά ένα website που θα είναι και πιο ωραίο σε σχέση με τα περισσότερα templates. Θα είναι καλύτερο από αυτό που θα έκανε μια ομάδα senior frontend; Όχι. Αλλά δεν με ενδιαφέρει, δεν θα πλήρωνα ομάδα expert για να φτιάξω ένα προσωπικό site λ.χ.

Τελευταία που χρησιμοποιώ και τον comet της perplexity, ο ai agent του είναι εντυπωσιακός -και εντυπωσιακά αργός βέβαια.
 
Σχετικό Μιχάλη.
Υπάρχει μοντέλο που παίρνει χρυσό στην μαθηματική ολυμπιάδα λ.χ.

Ναι, ok, σκέφτεται σαφώς πιο γρήγορα από έναν άνθρωπο και έχει τόση μνήμη που δεν χρειάζεται να ανατρέχει σε πράγματα που έκανε.
Σαν ένα έξυπνο κομπιουτεράκι ένα πράγμα.

Σε front-end μπορείς να φτιάξεις διάφορα.
Μόνο που θα απέχουν από τα standards επειδή απλά δεν τα γνωρίζεις για να του τα ζητήσεις 😉
 
Σαν ένα έξυπνο κομπιουτεράκι ένα πράγμα.
Υπεραπλοποιείς...Δεν διαφωνώ ότι στον δικό σου χώρο εργασίας μπορεί να ισχύει. Μπορεί επίσης να μην έχεις βρει ένα σωστό process για να ενσωματώσεις κάποιους ΑΙ agents να σου διευκολύνουν, αλλά κυρίως επιταγχύνουν τη δουλειά.
Ναι τα πλαίσια που κάνουν πχ έρευνα μόνα τους είναι στα αρχικά βήματα, αλλά και μόνο να καταφέρνει ένα πολυπρακτορικό σύστημα βασισμένο σε LLM αλλά όχι περιορισμένο εκεί, να θέτει αυτόνομα ερευνητικά ερωτήματα, να τα ψάχνει και να περνάει Peer-review σε μέτριο επιστημονικό συνέδριο είναι απίστευτα προχωρημένο.
Φυσικά αν βάλεις έναν έμπειρο ερευνητή να κατευθύνει τα πρώτα βήματα στο παραπάνω σύστημα και να επιβλέψει τη δουλειά όπως θα έκανε με υποψήφιους διδάκτορες, τότε περνάει και σε journal με υψηλό impact factor ήδη.

Επίσης αυτό που βλέπω είναι ότι αν δεν "παίξεις" μαζί του δεν μπορείς να μάθεις πως να το διαχειρίζεσαι σωστά για να πάρεις τα μέγιστα. Κάνω τον τελευταίο καιρό αρκετά side project, τα περισσότερα για πλάκα, αλλά το βασικό κέρδος είναι η κατανόηση και μεγιστοποίηση της αποδοτικότητας χρήσης του εργαλείου, και είναι απίστευτο τι μπορείς να πετύχεις με 20 δολάρια το μήνα.
 
Τελευταία που χρησιμοποιώ και τον comet της perplexity, ο ai agent του είναι εντυπωσιακός -και εντυπωσιακά αργός βέβαια.
Με την προσφορά της Cosmote αρκετοί μπήκαμε στη διαδικασία να δούμε λίγο περισσότερο το perplexity. Το χρησιμοποιούσα και πριν στην δωρεάν έκδοση αλλά για πολύ συγκεκριμένα πράγματα.
Όντως ο agent είναι καλός, αλλά ακόμη δεν ξέρω να διαλέγω αν θέλω τον agent αυτό ή αυτόν της OpenAI.

Πάντως η συνδυαστική χρήση του perplexity και του ChatGPT για deep research με έχει αφήσει άφωνο.

Edit: Αυτό που έπρεπε να είχα γράψει είναι ότι η χρήση agents προς το παρόν που κάνω δεν δίνω πρόσβαση πουθενά με προσωπικούς κωδικούς.

Ένα παράδειγμα χρήσης ήταν βρες μου το οικονομικότερο ταξίδι σε Ευρωπαϊκή πρωτεύουσα για 4 άτομα (2 ενήλικες, 2 παιδιά) με αναχώρηση πέμπτη απόγευμα, και επιστροφή κυριακή βράδύ ή παρασκευή απόγευμα και επιστροφή δευτέρα βράδυ με απευθείας πτήσεις από την Αθήνα με αεροπορικές εταιρίες της Star Alliance, με μέγιστο χρόνο πτήσης 3 ώρες σε κάποια Ευρωπαϊκή πόλη. Ψάξε για τους μήνες Οκτώβριο, Νοέμβριο και Δεκέμβριο 2025. Για διαμονή επέλεξε ξενοδοχεία ή ενοικιαζόμενα διαμερίσματα που έχουν τουλάχιστον βαθμολογία 8.5 στο booking.com και είναι κατά προτίμηση κοντά στο κέντρο της πόλης.

Ακόμη δεν μου έχει βρει κάτι πιο γρήγορα από εμένα πάντως, όμως το αφήνεις και παίρνεις ένα καλό αποτέλεσμα.
 
Last edited:
Νέο άρθρο για τις παραισθήσεις των LLM από την OpenAI.


Με απλά λόγια ο τρόπος που αξιολογούνται οι απαντήσεις κατά τη διαδικασία εκμάθησης είναι αυτή που ωθεί τα μοντέλα στις "παραισθήσεις". Αντί το μοντέλο να πει δεν το γνωρίζω, προτιμά να δώσει μια συγκεκριμένη απάντηση. Στο άρθρο μας λένε ότι το ίδιο κάνουν και οι φοιτητές πχ κανένας δεν θα αφήσει αναπάντητη μια ερώτηση multiple choice αναπάντητη γιατί δεν ξέρει, αλλά θα διαλέξει μια απάντηση γιατί υπάρχουν πιθανότητες να πέσεις μέσα και να πάρεις τους βαθμούς. Αντίστοιχα αν κάποιος γράψει ότι κάτι έγινε στις αρχές του Φθινοπώρου φαίνεται όχι τόσο καλό όσο να πει έγινε στις 30 Σεπτεμβρίου.
Κάθε πιθανή απάντηση του τύπου "δεν ξέρω" παίρνει μηδενική ανταμοιβή, και έτσι εκπαιδεύουμε τα μοντέλα να μην το λένε ποτέ και να προτιμούν μια απάντηση χάλια γιατί ίσως πέσουν μέσα. Η βασική πρόταση είναι κοινωνικο-τεχνική με το να αλλάξουν τα κριτήρια και οι βαθμολογίες των υπαρχόντων benchmarks ώστε να μην τιμωρούνται οι δηλώσεις αβεβαιότητας, κάτι που θα κατευθύνει το πεδίο προς πιο αξιόπιστα συστήματα.
 
Νέο άρθρο για τις παραισθήσεις των LLM από την OpenAI.


Με απλά λόγια ο τρόπος που αξιολογούνται οι απαντήσεις κατά τη διαδικασία εκμάθησης είναι αυτή που ωθεί τα μοντέλα στις "παραισθήσεις". Αντί το μοντέλο να πει δεν το γνωρίζω, προτιμά να δώσει μια συγκεκριμένη απάντηση. Στο άρθρο μας λένε ότι το ίδιο κάνουν και οι φοιτητές πχ κανένας δεν θα αφήσει αναπάντητη μια ερώτηση multiple choice αναπάντητη γιατί δεν ξέρει, αλλά θα διαλέξει μια απάντηση γιατί υπάρχουν πιθανότητες να πέσεις μέσα και να πάρεις τους βαθμούς. Αντίστοιχα αν κάποιος γράψει ότι κάτι έγινε στις αρχές του Φθινοπώρου φαίνεται όχι τόσο καλό όσο να πει έγινε στις 30 Σεπτεμβρίου.
Κάθε πιθανή απάντηση του τύπου "δεν ξέρω" παίρνει μηδενική ανταμοιβή, και έτσι εκπαιδεύουμε τα μοντέλα να μην το λένε ποτέ και να προτιμούν μια απάντηση χάλια γιατί ίσως πέσουν μέσα. Η βασική πρόταση είναι κοινωνικο-τεχνική με το να αλλάξουν τα κριτήρια και οι βαθμολογίες των υπαρχόντων benchmarks ώστε να μην τιμωρούνται οι δηλώσεις αβεβαιότητας, κάτι που θα κατευθύνει το πεδίο προς πιο αξιόπιστα συστήματα.
Απίστευτο. Μετά από δεκαετίες έρευνας και αφού ξοδεύτηκαν δισεκατομμύρια έφτασαν στο συμπέρασμα ότι είναι καλύτερο να λες "δεν ξέρω" από το να εφευρίσκεις μ@λ@κίες. Και μετά οι κομπιουτεράδες παραπονιούνται που τους λέμε νερντς..
 
Απίστευτο. Μετά από δεκαετίες έρευνας και αφού ξοδεύτηκαν δισεκατομμύρια έφτασαν στο συμπέρασμα ότι είναι καλύτερο να λες "δεν ξέρω" από το να εφευρίσκεις μ@λ@κίες. Και μετά οι κομπιουτεράδες παραπονιούνται που τους λέμε νερντς..
Έτσι έτσι!!!
Τα LLM αντιγράφουν τα μοτίβα συμπεριφοράς φοιτητών στις εξετάσεις. Αναμενόμενο βέβαια.
Αυτό που δεν λέει το άρθρο είναι ότι η παράλληλη επεξεργασία με διαφορετικούς agents που τρέχουν παράλληλα και αλληλεπιδρούν (ο χρήστης δεν τους βλέπει) έχουν μειώσει κατά πολύ τις παραισθήσεις ήδη, γιατί υπάρχει ένας άλλος "φοιτητής" που του λέει μαζέψου, δεν παίζει αυτό που λες, κοίτα αυτό που λέω εγώ και κυκλικά βελτιώνουν την τελική απάντηση.
Είμαι σίγουρος βέβαια πως είναι έρευνα προηγούμενης γενιάς και τα αποτελέσματα (που δεν τα λέει όλα) τα έχει ήδη ενσωματώσει η OpenAI στην εμπορική έκδοση του ChatGPT 5.
 
Έτσι έτσι!!!
Τα LLM αντιγράφουν τα μοτίβα συμπεριφοράς φοιτητών στις εξετάσεις. Αναμενόμενο βέβαια.
Αναμενόμενο; Γιατί;
Αυτό που δεν λέει το άρθρο είναι ότι η παράλληλη επεξεργασία με διαφορετικούς agents που τρέχουν παράλληλα και αλληλεπιδρούν (ο χρήστης δεν τους βλέπει) έχουν μειώσει κατά πολύ τις παραισθήσεις ήδη, γιατί υπάρχει ένας άλλος "φοιτητής" που του λέει μαζέψου, δεν παίζει αυτό που λες, κοίτα αυτό που λέω εγώ και κυκλικά βελτιώνουν την τελική απάντηση.
Κι αν και ο δεύτερος "φοιτητής" είναι το ίδιο άσχετος;
Είμαι σίγουρος βέβαια πως είναι έρευνα προηγούμενης γενιάς και τα αποτελέσματα (που δεν τα λέει όλα) τα έχει ήδη ενσωματώσει η OpenAI στην εμπορική έκδοση του ChatGPT 5.
Η οποία έκδοση έχει φάει απίστευτο τρολάρισμα...
 
Ναι, ok, σκέφτεται σαφώς πιο γρήγορα από έναν άνθρωπο και έχει τόση μνήμη που δεν χρειάζεται να ανατρέχει σε πράγματα που έκανε.
Σαν ένα έξυπνο κομπιουτεράκι ένα πράγμα.

Σε front-end μπορείς να φτιάξεις διάφορα.
Μόνο που θα απέχουν από τα standards επειδή απλά δεν τα γνωρίζεις για να του τα ζητήσεις 😉

Πλέον τα πάντα μπορεί να σου φτιάξει, όχι μόνο front-end.
Υπάρχουν web-apps που σου κάνουν full stack development πλέον, χρησιμοποιώντας όποιο API μοντέλου θέλεις.

Έβαλα το emergent να φτιάξει μια λύση tracking & billing που να συνδέεται στο open webui, να κάνει track χρήσης τοπικών μοντέλων ανά χρήστη και μοντέλο που χρησιμοποιεί. Το έφτιαξε με το claude opus σε 10 λεπτά, έστησε VM, το δοκίμασε, κάτι δεν έπαιζε, το έφτιαξε, το ξαναδοκίμασε και σε 15 λεπτά το πολύ είχα solution.

Ναι, ήθελε κάποια μικρο-adjustments, αλλά με ~2-3€ έφτιαξε αυτό στο πρώτο prompt:

1757429610669.png

Πόσο θα κόστιζε ώστε να μου το φτιάξει ένας senior full stack και σε πόσο χρόνο;
Σε λιγότερο από μια ώρα και με ~5-6€ τελικό κόστος είχα solution.
 
Πλέον τα πάντα μπορεί να σου φτιάξει, όχι μόνο front-end.
Υπάρχουν web-apps που σου κάνουν full stack development πλέον, χρησιμοποιώντας όποιο API μοντέλου θέλεις.

Έβαλα το emergent να φτιάξει μια λύση tracking & billing που να συνδέεται στο open webui, να κάνει track χρήσης τοπικών μοντέλων ανά χρήστη και μοντέλο που χρησιμοποιεί. Το έφτιαξε με το claude opus σε 10 λεπτά, έστησε VM, το δοκίμασε, κάτι δεν έπαιζε, το έφτιαξε, το ξαναδοκίμασε και σε 15 λεπτά το πολύ είχα solution.

Ναι, ήθελε κάποια μικρο-adjustments, αλλά με ~2-3€ έφτιαξε αυτό στο πρώτο prompt:

View attachment 257343

Πόσο θα κόστιζε ώστε να μου το φτιάξει ένας senior full stack και σε πόσο χρόνο;
Σε λιγότερο από μια ώρα και με ~5-6€ τελικό κόστος είχα solution.
Έτσι ακριβώς είναι. Ευτυχώς έχω γλυτώσει το τρένο της προσωπικής χρήσης των LLM (χρήση ως φίλων, συμβούλων, ψυχολόγων κλπ), αλλά τα έχω σκίσει σε δοκιμές στο επαγγελματικό περιβάλλον. Ένα ακόμη παράδειγμα.
Έχω μια πλατφόρμα από τα χρόνια του διδακτορικού (αναβαθμίζεται μόνιμα από τότε) που έχει σαν καρδιά το λογισμικό TRNSYS - υπάρχει πάνω από 40 χρόνια, μπορείς να γράψεις κώδικα σε ότι γλώσσα θες και να προσθέσεις το dll, αλλά επειδή είμαι δεινόσαυρος και το έμαθα πριν από 20+ χρόνια γράφω κώδικα σε fortran με το πλεονέκτημα ότι μπορώ με recompile να ενσωματώσω τον νεό κώδικά στον πυρήνα του λογισμικού (ναι είναι γραμμένο ακόμη σε FORTRAN), υπάρχει ενεργή σύνδεση με το Matlab αν χρειάζομαι κάποιο add-on (πχ fuzzy logic) και συνεργάζεται μέσω ενός ωραίου interface με το GenOPT που είναι open source λογισμικό βελτιστοποίησης που τρέχει μοντέλα σαν το particle swarm optimization με ταυτόχρονη βελτιστοποίηση μέχρ 100 μεταβλητών (συνεχών και ορισμένων). Η λεπτομέρεια που το κάνει να ξεχωρίζει είναι ότι λύνει διαφορικές μεταξύ t-->Δt αντί για γραμμική συσχέτιση των σημείων. Επίσης όλα αυτά τα χρόνια έχω γράψει κώδικα για κυψέλες καυσίμου, μονάδες ηλεκτρόλυσης, μονάδες αφαλάτωσης, εξωτικές μπαταρίες και υπερπυκνωτές όπως και ελεγκτών με χρήση διάφορων παραδειγμάτων τεχνητής νοημοσύνης (Fuzzy Cognitive Maps, Petri Nets, Grey System Models, κλπ).
Αυτά για να πω ότι αυτή την στιγμή ήθελα να γράψω ένα άρθρο για παραγωγή πράσινων λιπασμάτων, το οποίο προϋποθέτει παραγωγή αμμωνίας σε πρώτο στάδιο, μετά νιτρικού οξέως μέχρι τελικά τη σύνθεση ασβεστούχου νιτρικής αμμωνίας. Τις εξισώσεις / μοντέλα τα έχω έτοιμα, αλλά έπρεπε να γράψω τον κώδικα σε FORTRAN για να τα ενσωματώσω στο παραπάνω ώστε να μπορώ να τρέξω βελτιστοποιήσεις σε συνδυασμό με διάφορες ΑΠΕ. Παραδοσιακά θα ήθελα κατά ελάχιστο 1 εβδομάδα πλήρους δουλειάς για να γράψω τον κώδικά, να κάνω debugging και να είμαι σίγουρος πως δουλεύει καλά πριν αρχίσω να τρέξω το λογισμικό. Επειδή δεν είναι πρώτη προτεραιότητα αυτό το task έχει μείνει πίσω αρκετό καιρό, μέχρι που σκέφτηκα το πολύ απλό. Γιατί δεν βάζω το ChatGPT να μου γράψει όλη τη fortran που να είναι συμβατή με την ενσωμάτωση στο TRNSYS. Μια ημέρα δουλειά μαξ τελικά. 1 ώρα πέρα-δώθε μηνύματα για να τρέχει ο κώδικας και να ενσωματωθεί σωστά και την υπόλοιπη μέρα για χειροκίνητες δοκιμές μήπως και έκανε κάτι λάθος το ChatGPT...
 
Αναμενόμενο; Γιατί;
Γιατί ο φοιτητής είναι η υπέρτατη μηχανή βελτιστοποίησης του πως θα πάρω 5 με ελάχιστο διάβασμα. Κάνω μαθήματα και εξετάσεις σε προπτυχιακό και μεταπτυχιακό επίπεδο κάπου 20 χρόνια τώρα και μου έχει γίνει ξεκάθαρο :)
Στο τωρινό μεταπτυχιακό που κάνω μάθημα στις εξετάσεις τους έχω 20 ερωτήσεις σωστό/λάθος, 16 ερωτησεις πολλαπλής επιλογής, 3 θέματα να διαλέξουν τα 2 για μικρή ανάπτυξη (μαξ 3 προτάσεις) και 3 θέματα να διαλέξουν τα 2 για ανάπτυξη 1 σελίδας Α4. Με τη σημείωση ότι δεν έχω αρνητική βαθμολογία, δεν υπάρχει ούτε 1 φοιτητής που να μην έχει συμπληρώσει το πρώτο μισό ακόμη και αν οι απαντήσεις δείχνουν ότι είναι αδιάβαστος :)
(Μικρό Off-topic, ο μόνος τρόπος στην εποχή των LLM να εξετάσεις και να είσαι σίγουρος είναι με προφορική εξέταση, αλλά είναι χρονοβόρο, δύσκολο και γενικά το αποφεύγουν).

Κι αν και ο δεύτερος "φοιτητής" είναι το ίδιο άσχετος;
Είναι πολύ σπάνιο να είναι ακριβώς το ίδιο άσχετος με τον προηγούμενο. Και ο άσχετος για να έχει περάσει πανεπιστήμιο έχει κάποιες γνώσεις που τον ένα να μπορούν να τον βοηθήσουν στη μία ερώτηση και στην άλλη τον άλλον ή να ήταν στο αμφιθέατρο σε διαφορετικές παραδόσεις και να του έχει μείνει κάτι. Επίσης αν τους αφήσεις να επιχειρηματολογούν μεταξύ τους σχεδόν πάντα (όχι όμως πάντα) η απάντηση του γκρουπ πάει πιο κοντά στη σωστή απάντηση και στη πραγματική ζωή.

Η οποία έκδοση έχει φάει απίστευτο τρολάρισμα...
Το βασικό κύμα hate είχε να κάνει με τον κόσμο που το χρησιμοποιούσε στην προσωπική του ζωή σαν φίλο, σύντροφο, ψυχολόγο, κλπ. Και αν ψάξεις τις αναφορές κανείς δεν ζήτησε επαναφορά του ο1, ο3, ο4-mini-high...όλοι αυτής της κατηγορίας ζήταγαν το 4ο να επιστρέψει.

Και επίσης το 5 έχει καμπύλη εκμάθησης. Μου πήρε αρκετές μέρες να καταλάβω τις ιδιαιτερότητές του, πως πρέπει να το ρωτάω κλπ.

Είναι το πρώτο μοντέλο που εύκολα στήνει sandbox γράφει κώδικα σε python με πρόσβαση σε πραγματικά πολλές βιβλιοθήκες και βγάζει αποτέλεσμα πάρα πολύ καλό με δραστικά μειωμένα τα λάθη σε νούμερα και υπολογισμούς. Επίσης το deep research μπορείς να το χρησιμοποιήσεις και υβριδικά για να σου γράψει μεγάλο κείμενο (πχ άνω των 20,000 λέξεων) με τη μία, ενώ το βασικό παράθυρο περιορίζεται στις ~3000 λέξεις.
Αρκεί δε ένα Prompt σε νέα κουβέντα να ψάξει αν είναι factually correct το κείμενο που σου έδωσε σε άλλο chat για να δεις αν κάτι είναι παραίσθηση. Και πια οι παραισθήσεις έχουν μειωθεί πολύ. Αυτό που συμβαίνει συχνά είναι πχ να σου παραθέτει με πηγές νούμερα πχ του 2023 ενώ εσύ θες του 2025. Όμως όταν σου λέει και την πηγή του αριθμού δεν μπορείς να το κατηγορίσεις για λανθασμένη απάντηση. Ίσως το ChatGPT 4.5 να ήταν ένα τσακ καλύτερο σε αυτό το συγκεκριμένο task και μόνο.
Επίσης εύκολα έχει πρόσβαση σε "κλειδωμένη" επιστημονική βιβλιογραφία αν του πεις ότι έχεις μέσω πανεπιστημίου πρόσβαση πχ. σε Elsevier, IEEE, Spinger, Willey κλπ. Δεν θα σου δώσει ποτέ το άρθρο το κλειδωμένο, αλλά στις πηγές του θα συμπεριλάβει και άρθρα από εκεί που θα μπορείς εσύ να ανοίξεις μέσω της συνδρομής του ιδρύματός σου.

Σε συγκεκριμένα task που το έχουμε δοκιμάσει με συναδέλφους σε επιστημονικά κείμενα, αντιδρά πολλές φορές καλύτερα από καθηγητές πανεπιστημίου με 30 χρόνια πραγματική εμπειρία στο αντικείμενο με εκτενές συγγραφικό έργο. Θα σου δώσω και συγκεκριμένο παράδειγμα. Μια ομάδα γράφει ένα επιστημονικό άρθρο. Πολλές φορές (πριν κατατεθεί το άρθρο το διαβάζει κάποιος με πραγματικά μεγάλη εμπειρία στο αντικείμενο (και συνήθως μπαίνει ως τελευταίο όνομα στο paper). Αυτός κάνει στοχευμένα σχόλια που θα μπορούσε να τα κάνει κάποιος reviewer. Λοιπόν αυτό που κάναμε είναι να κάνουμε παράλληλα την διαδικασία και φυσικά να συζητήσουμε μετά τα αποτελέσματα. Να το πω με απλά λόγια, όλα (100%) των σχολίων του ChatGPT 5 thinking ήταν λογικά, σωστά τεκμηριωμένα και με προτάσεις που θα μπορούσαν να υιοθετηθούν για να ξεπεραστούν. Κάποια τα βρήκαμε τραβηγμένα από την οπτική ότι θα έπρεπε να έχεις διατομεακή ομάδα για να τα δει αυτά συγκεντρωτικά, αλλά η επιστήμη ξεκάθαρα πάει σε διατομεακή (multi- και inter-disciplinary) έρευνα. Επίσης ένα άλλο σχόλιο ήταν ότι αν τα κάναμε όλα αυτά, θα το στέλναμε σε journal με υψηλότερο impact factor (I.F.). Το ΑΙ εργαλείο δεν μπορεί να ξέρει ότι δεν στοχεύουμε πάντα για το 1 υπέρτατο paper, αλλά μπορεί να έχουμε στρατηγική για περισσότερα άρθρα κάποια σε journal υψηλότερου I.F. και άλλα σε χαμηλότερου με πολύ λογική τεκμηρίωση για αυτό.

Δεν ξέρω αν αυτό βαφτίζεται AGI και δεν έχει καμία σημασία. Αλλά με τέτοιες δυνατότητες έχει ήδη ξεφύγει από τη χρήση ως junior συνεργάτη αποφοίτου μεταπτυχιακού με 3 χρόνια προϋπηρεσία που το αξιοποιούμε τώρα.
 
Πλέον τα πάντα μπορεί να σου φτιάξει, όχι μόνο front-end.
Υπάρχουν web-apps που σου κάνουν full stack development πλέον, χρησιμοποιώντας όποιο API μοντέλου θέλεις.

Έβαλα το emergent να φτιάξει μια λύση tracking & billing που να συνδέεται στο open webui, να κάνει track χρήσης τοπικών μοντέλων ανά χρήστη και μοντέλο που χρησιμοποιεί. Το έφτιαξε με το claude opus σε 10 λεπτά, έστησε VM, το δοκίμασε, κάτι δεν έπαιζε, το έφτιαξε, το ξαναδοκίμασε και σε 15 λεπτά το πολύ είχα solution.


Αν έχεις το business intelligence ναι, θα σου φτιάξει κάτι αποδεκτό.
Αλλά ακόμη και εσύ που το γνωρίζεις, του είπες να προσέξει για form injections, security misconfigurations, accessible sensitive data, vulnerable components, authenication failures, server side request forgery, να κάνει log και monitoring, σωστό exception trapping...

Σίγουρα, σε 15 λεπτά δεν θα σου το φτιάξει κανένας senior/junior dev, αλλά κανένας senior δεν θα σου έδινε κώδικα που όποιο script kid θα σου τον έκανε κουρέλια.
Και δεν μιλάμε για κανένα deface να σπάσει την πλάκα του, αλλά από το να φορμάρει τον server σου μέχρι να σου αδειάσει τον τραπεζικό λογαριασμό σου.
 
Α ρε Star Trek, σε όλα μπροστά ήσουνα. Απλά πράγματα, λογικές απαντήσεις, από ένα computer, που δεν φανταζόμαστε καν πότε θα είναι δυνατόν να υπάρξει.

No further entries conforming to search parameters.
The flexibility of the program is limited to the parameters of....
Unknown.

Απλά πράγματα.
 
  • Like
Reactions: Pleo
Αν έχεις το business intelligence ναι, θα σου φτιάξει κάτι αποδεκτό.
Αλλά ακόμη και εσύ που το γνωρίζεις, του είπες να προσέξει για form injections, security misconfigurations, accessible sensitive data, vulnerable components, authenication failures, server side request forgery, να κάνει log και monitoring, σωστό exception trapping...

Σίγουρα, σε 15 λεπτά δεν θα σου το φτιάξει κανένας senior/junior dev, αλλά κανένας senior δεν θα σου έδινε κώδικα που όποιο script kid θα σου τον έκανε κουρέλια.
Και δεν μιλάμε για κανένα deface να σπάσει την πλάκα του, αλλά από το να φορμάρει τον server σου μέχρι να σου αδειάσει τον τραπεζικό λογαριασμό σου.

Στο δικό μου παράδειγμα για την ιστορία, ένα usage tracking app έφτιαξε, πίσω από UAM του firewall, είναι στο δικό του VM και τραβάει δεδομένα από ένα read only api.

Δεν θα αντικαταστήσει τις dev teams του ebanking, αλλά απλά projects για τα οποία δεν υπάρχει έτοιμο solution, από όσο βλέπω, τα κάνει μια χαρά. Οι ομάδες που μπορούν να προσθέσουν τέτοια εργαλεία στη καθημερινότητα, σίγουρα αυξάνουν εκθετικά την παραγωγικότητα τους. Για όσους θέλουν πλήρη έλεγχο στον κώδικα τους, υπάρχουν editors όπως ο cursor, που επίσης βοηθάνε.

Το bottom line για εμένα είναι πως πλέον, ιδέες που δεν μπορούσαν να υλοποιηθούν λόγω έλλειψης γνώσεων/χρόνου, μεγάλου κόστους ή οποιουδήποτε συνδυασμού αυτών, πλέον υλοποιούνται. Για την ώρα, με 3€ δεν έχεις την απόλυτη ποιότητα, αλλά παρατηρώντας τη ταχύτητα με την οποία κινούμαστε, σε 1-2 χρόνια και με λίγο διαφορετικό chain of thought, δεν θα μου κάνει εντύπωση να τη πλησιάσουμε.
 
Δεν θα αντικαταστήσει τις dev teams του ebanking, αλλά απλά projects για τα οποία δεν υπάρχει έτοιμο solution, από όσο βλέπω, τα κάνει μια χαρά.

Σε τρώει να συνεχίσω. 😂
Ας πάμε από τα βασικά που λέω σε κάθε developer που μου έρχεται.
Ποιο PSR χρησιμοποιείς;
Κάνεις push στο git και με comments που μπορείς να καταλάβεις τι αλλαγές έκανες σε κάθε commit;
Αν δει τον κώδικά σου άλλος developer θα μπορεί να καταλάβει τι έκανες και να κάνει maintenance;
Χρησιμοποιείς camel case με σωστές ονομασίες variables ή ο κωδικάς σου μοιάζει σαν να βγήκε μόλις από το uglify;

Ναι, καταλαβαίνω ότι για μία πρόχειρη δουλίτσα εσωτερικής κατανάλωσης δίνει λύσεις.
Λύσεις όμως από όπου δεν έμαθες τίποτα απολύτως, δεν μπορούν να κάνουν maintenance άνθρωποι,


Εδώ δεν ήθελα να ασχοληθώ να μάθω routerOS και πλακωθήκαμε με το Gemini επειδή ήθελε ντε και καλά να βάζει inline comments.
Του λέω "μην βάζεις inline comments", η απάντηση ήταν "κάνε αναβάθμιση στο τελευταίο routerOS που τα δέχεται"
ΡΕ ΕΙΣΑΙ ΗΛΙΘΙΟΣ;
Και εκεί σταμάτησε να μου απαντάει επειδή λέει έγινα επιθετικός.
Αν μιλάμε για intelligence μιλάμε για κάτω του 10.