Τεχνητή Νοημοσύνη (AI). Τι είναι, τι ξέρουμε, τι αλλάζει στη ζωή και στον πολιτισμό;

Gemini 3.1 pro στο παραπάνω prompt.
Απαράδεκτο το excel, χωρίς δεδομένα και χωρίς μορφοποίηση.
Το powerpoint όμως είναι σημαντικά καλύτερο από αυτό που περίμενα, το κάνει και export κατευθείαν στο slides της google -και δουλεύει, εν αντιθέσει με το copilot 365 που για το ίδιο task είναι hit or miss. Τέλειωσε πολύ γρηγορότερα από τα GPT5.4 και Opus 4.6, στο 1/3 του χρόνου.

Σημ. Εάν δεν ενεργοποιήσει το canvas κάποιος, το αποτέλεσμα είναι να απαντήσει το μοντέλο ότι δεν μπορεί να κάνει τίποτα από τα 2.

Excel:

1773354382409.png

Powerpoint:

1773354581297.png




Το ζήτημα για εμένα είναι σε έναν λογικό χρόνο, με ένα prompt που δεν είναι τόσο εκτεταμένο ή να απαιτεί τόση επιμέλεια που να προσεγγίζει τον χρόνο επιμέλειας εγγράφων, να βγαίνει ένα αποτέλεσμα που μετά με ένα γρήγορο σκανάρισμα και με 1-2 επιπλέον prompts να καταλήγει κάτι ευπαρουσίαστο, ακριβές και έτοιμο για επαγγελματική χρήση.

Για να είμαστε δίκαιοι, το 365, εάν δεν του βάλεις δύσκολα, ένα-ένα έγγραφο θα τα φτιάξει, μπορεί να χάσει το αρχείο και να το ψάχνεις στο sharepoint βέβαια. Θα βγάλει πολύ καλύτερο presentation από αυτό που έβγαλε το GPT 5.4 μόνο του γράφωντας κώδικα. Εάν του βάλεις δύσκολα, να φτιάξει λ.χ. 2 έγγραφα μαζί, πνέει τα λοίσθια.

Στο Gemini, εάν του πείς να ξαναφτιάξει το Excel και του γράψεις τι θέλεις ακριβώς να κάνει, θα καταλήξει σε αντίστοιχα αποτελέσματα με τα υπόλοιπα.
 
Είναι προφανώς σημαντικό το one-prompt --> αποδεκτή έξοδος.
Ειδικά για επαναλαμβανόμενα task καθημερινά.
Από την άλλη, λόγω της φύσης της δουλειάς μου, υλοποιώ ένα πολυπρακτορικό μοντέλο χειροκίνητα με εμένα σαν supervisory και χαμάλη agent. Eκεί που το context πριν το ρωτήσω τίποτα το φτιάχνω σε 5-10 prompts και μετά δίνω το task το ChatGPT 5.4 Thinking xhigh νομίζω ότι είναι αυτή τη στιγμή το κορυφαίο.

Να δώσω ένα παράδειγμα όταν έχω να κάνω μια βιβλιογραφική ανασκόπηση για κάτι συγκεκριμένο.
- Agent 1. Βγάζει το prompt για να κάνει search το perplexity. Του φτιάχνω context βηματικά με 5-10 Prompts.
- Agent 2. To Perplexity με deep research που βγάζει ένα πίνακα που οι σημαντικότερες στήλες είναι α. Για ποιο λόγο είναι σχετικό (2-3 προτάσεις μέγιστο), β. Τι προσφέρει στο συνολικό task (πάλι 2-3 προτάσεις μέγιστο).
- Agent 3. Ξαναφτιάχνω χειροκίνητα context με 5-10 prompts και μετά το βάζω να φτιάξει prompt για το deep research του ChatGPT τώρα, αφού έχω μοιραστεί και τον πίνακα οτυ perplexity
- Agent 4. Ξαναφτιάχνω χειροκίνητα context με 5-10 prompts και μετά το βάζω να φτιάξει Internal document της βιβλιογραφικής ανασκόπησης.
- Agent 5. Έλεγχος ακρίβειας και ορθότητας των πηγών και των συμπερασμάτων που βγαίνουν από τις πηγές. Αναμόρφωση του κειμένου με διορθώσεις (αν χρειάζονται).
- Agent 5.1. Το ίδιο με τον παραπάνω, αν δω ότι υπάρχουν αρκετά ζητήματα. Συνήθως θέλω 3-5 iterations πριν το ολοκληρώσω.
Όλα τα παραπάνω κάπου 2 ώρες (που δεν χρειάζεται να είμαι συνεχόμενα από πάνω και πολλά prompts είναι copy/paste/tailor). Και μετά θέλω άλλες 1-2 ώρες να διαβάσω με προσοχή το internal document. Όλοι οι agent οι παραπάνω είναι ξεχωριστά chat στο ChatGPT 5.x thinking xhigh που δεν έχει το ένα πρόσβαση στο υλικό του άλλου. Μόνο ο 2 είναι το Perplexity.
Σύνολο μισή εργατοημέρα. Αυτό το task πριν από 3 χρόνια μου έπαιρνε 1 εβδομάδα (5 εργατοημέρες) για να το κάνω όλο μόνος μου ή 2-3 εβδομάδες αν έδινα κομμάτια δουλειάς σε Juniors. Περιττό να πω πως το αποτέλεσμα του παραπάνω είναι ποιοτικά πολύ καλύτερο γιατί δεν θα μπορούσα ποτέ να διαβάσω πάνω από 1000 ιστοσελίδες / report / κλπ. Δεν έχω επίσης εκτενές υπόβαθρο σε άλλες επιστήμες, μόνο βασικές γνώσεις ενώ οι πράκτορες έχουν και αυτό κάνει τη δουλειά πραγματικά αποτέλεσμα multi-disciplinary έρευνας που στην πράξη είναι πανάκριβο για να γίνει. Επίσης επειδή είμαι μπλεγμένος σε όλα τα βήματα γνωρίζω τη διαδικασία και μπορώ να επέμβω αν δω ότι κάπου κάτι δεν πάει όπως θα ήθελα.
Προσπαθώ το human-in-the-loop να μην το αφήσω όσο μπορώ, γιατί έτσι μαθαίνω να γίνομαι καλύτερος σε αυτό το ρόλο μέχρι να γίνουμε Obsolete...

Από την άλλη στο one prompt σίγουρα είναι πιο πίσω από το Claude και για αυτό για μικρά καθημερινά task χρησιμοποιώ το Gemini 3.1 Pro...ναι Overkill για μια συνταγή μαγειρικής ή κάτι αντίστοιχο.

Πάντως πριν 3 χρόνια αν μου έλεγε κάποιος ότι θα μπορούσα να κάνω το παραπάνω και να έπαιρνα αυτής της ποιότητας το αποτέλεσμα απλά θα γέλαγα. Ζούμε σε πολύ ενδιαφέροντες καιρούς πριν από μια χρυσή εποχή ή την ολική καταστροφή ;) :)
 
Εξαιρετικά ιδιαίτερο use case βέβαια Γιώργο.
Η δική μου ροή εργασιών δεν έχει πρωτότυπη δημιουργία documentation. Αρκετές φορές χρειάζεται να κάνω review, που αναγκαστικά πρέπει να διαβάσω όλο το έγγραφο -και 100 να πάρει μοντέλο στο ARC-AGI πάλι θα το διάβαζα.

Η μεγάλη διαφορά στη καθημερινότητα μου είναι στη μετατροπή πρωτογενών δεδομένων σε δομημένα έγγραφα και παρουσιάσεις. Ένα export του SAP σε 20-30 λεπτά έχει γίνει πλήρης παρουσίαση. Αυτό ξεκίνησε να κουτσο-γίνεται από το GPT5 στο copilot 365, σήμερα έχει οριακά λυθεί ως θέμα.

Για τα γρήγορα καθημερινά και εγώ στο gemini 3.1 pro καταφεύγω. Πιστεύω πως η αναλογία ταχύτητας απάντησης προς μονάδες intelligence είναι μακράν η καλύτερη αυτή τη στιγμή.
 
Screenshot 2026-03-16 043107.png

Στο Opus 4.6, αύξησαν το context window σε 1εκ tokens.
Πλέον τρέχει βαριές υλοποιήσεις συνεχόμενα.
Εδώ σε 17 βήματα, και 1 ώρα+, έφτιαξε λύση για 2FA και με passkeys, τη δοκίμασε, έκανε security review και εν τέλει δουλεύει και καλά.