Τεχνητή Νοημοσύνη (AI). Τι είναι, τι ξέρουμε, τι αλλάζει στη ζωή και στον πολιτισμό;

anderm · 13 March 2026

Gemini 3.1 pro στο παραπάνω prompt.
Απαράδεκτο το excel, χωρίς δεδομένα και χωρίς μορφοποίηση.
Το powerpoint όμως είναι σημαντικά καλύτερο από αυτό που περίμενα, το κάνει και export κατευθείαν στο slides της google -και δουλεύει, εν αντιθέσει με το copilot 365 που για το ίδιο task είναι hit or miss. Τέλειωσε πολύ γρηγορότερα από τα GPT5.4 και Opus 4.6, στο 1/3 του χρόνου.

Σημ. Εάν δεν ενεργοποιήσει το canvas κάποιος, το αποτέλεσμα είναι να απαντήσει το μοντέλο ότι δεν μπορεί να κάνει τίποτα από τα 2.

Excel:

Powerpoint:

Το ζήτημα για εμένα είναι σε έναν λογικό χρόνο, με ένα prompt που δεν είναι τόσο εκτεταμένο ή να απαιτεί τόση επιμέλεια που να προσεγγίζει τον χρόνο επιμέλειας εγγράφων, να βγαίνει ένα αποτέλεσμα που μετά με ένα γρήγορο σκανάρισμα και με 1-2 επιπλέον prompts να καταλήγει κάτι ευπαρουσίαστο, ακριβές και έτοιμο για επαγγελματική χρήση.

Για να είμαστε δίκαιοι, το 365, εάν δεν του βάλεις δύσκολα, ένα-ένα έγγραφο θα τα φτιάξει, μπορεί να χάσει το αρχείο και να το ψάχνεις στο sharepoint βέβαια. Θα βγάλει πολύ καλύτερο presentation από αυτό που έβγαλε το GPT 5.4 μόνο του γράφωντας κώδικα. Εάν του βάλεις δύσκολα, να φτιάξει λ.χ. 2 έγγραφα μαζί, πνέει τα λοίσθια.

Στο Gemini, εάν του πείς να ξαναφτιάξει το Excel και του γράψεις τι θέλεις ακριβώς να κάνει, θα καταλήξει σε αντίστοιχα αποτελέσματα με τα υπόλοιπα.

Γιώργος Κυριακαράκος · 13 March 2026

Είναι προφανώς σημαντικό το one-prompt --> αποδεκτή έξοδος.
Ειδικά για επαναλαμβανόμενα task καθημερινά.
Από την άλλη, λόγω της φύσης της δουλειάς μου, υλοποιώ ένα πολυπρακτορικό μοντέλο χειροκίνητα με εμένα σαν supervisory και χαμάλη agent. Eκεί που το context πριν το ρωτήσω τίποτα το φτιάχνω σε 5-10 prompts και μετά δίνω το task το ChatGPT 5.4 Thinking xhigh νομίζω ότι είναι αυτή τη στιγμή το κορυφαίο.

Να δώσω ένα παράδειγμα όταν έχω να κάνω μια βιβλιογραφική ανασκόπηση για κάτι συγκεκριμένο.
- Agent 1. Βγάζει το prompt για να κάνει search το perplexity. Του φτιάχνω context βηματικά με 5-10 Prompts.
- Agent 2. To Perplexity με deep research που βγάζει ένα πίνακα που οι σημαντικότερες στήλες είναι α. Για ποιο λόγο είναι σχετικό (2-3 προτάσεις μέγιστο), β. Τι προσφέρει στο συνολικό task (πάλι 2-3 προτάσεις μέγιστο).
- Agent 3. Ξαναφτιάχνω χειροκίνητα context με 5-10 prompts και μετά το βάζω να φτιάξει prompt για το deep research του ChatGPT τώρα, αφού έχω μοιραστεί και τον πίνακα οτυ perplexity
- Agent 4. Ξαναφτιάχνω χειροκίνητα context με 5-10 prompts και μετά το βάζω να φτιάξει Internal document της βιβλιογραφικής ανασκόπησης.
- Agent 5. Έλεγχος ακρίβειας και ορθότητας των πηγών και των συμπερασμάτων που βγαίνουν από τις πηγές. Αναμόρφωση του κειμένου με διορθώσεις (αν χρειάζονται).
- Agent 5.1. Το ίδιο με τον παραπάνω, αν δω ότι υπάρχουν αρκετά ζητήματα. Συνήθως θέλω 3-5 iterations πριν το ολοκληρώσω.
Όλα τα παραπάνω κάπου 2 ώρες (που δεν χρειάζεται να είμαι συνεχόμενα από πάνω και πολλά prompts είναι copy/paste/tailor). Και μετά θέλω άλλες 1-2 ώρες να διαβάσω με προσοχή το internal document. Όλοι οι agent οι παραπάνω είναι ξεχωριστά chat στο ChatGPT 5.x thinking xhigh που δεν έχει το ένα πρόσβαση στο υλικό του άλλου. Μόνο ο 2 είναι το Perplexity.
Σύνολο μισή εργατοημέρα. Αυτό το task πριν από 3 χρόνια μου έπαιρνε 1 εβδομάδα (5 εργατοημέρες) για να το κάνω όλο μόνος μου ή 2-3 εβδομάδες αν έδινα κομμάτια δουλειάς σε Juniors. Περιττό να πω πως το αποτέλεσμα του παραπάνω είναι ποιοτικά πολύ καλύτερο γιατί δεν θα μπορούσα ποτέ να διαβάσω πάνω από 1000 ιστοσελίδες / report / κλπ. Δεν έχω επίσης εκτενές υπόβαθρο σε άλλες επιστήμες, μόνο βασικές γνώσεις ενώ οι πράκτορες έχουν και αυτό κάνει τη δουλειά πραγματικά αποτέλεσμα multi-disciplinary έρευνας που στην πράξη είναι πανάκριβο για να γίνει. Επίσης επειδή είμαι μπλεγμένος σε όλα τα βήματα γνωρίζω τη διαδικασία και μπορώ να επέμβω αν δω ότι κάπου κάτι δεν πάει όπως θα ήθελα.
Προσπαθώ το human-in-the-loop να μην το αφήσω όσο μπορώ, γιατί έτσι μαθαίνω να γίνομαι καλύτερος σε αυτό το ρόλο μέχρι να γίνουμε Obsolete...

Από την άλλη στο one prompt σίγουρα είναι πιο πίσω από το Claude και για αυτό για μικρά καθημερινά task χρησιμοποιώ το Gemini 3.1 Pro...ναι Overkill για μια συνταγή μαγειρικής ή κάτι αντίστοιχο.

Πάντως πριν 3 χρόνια αν μου έλεγε κάποιος ότι θα μπορούσα να κάνω το παραπάνω και να έπαιρνα αυτής της ποιότητας το αποτέλεσμα απλά θα γέλαγα. Ζούμε σε πολύ ενδιαφέροντες καιρούς πριν από μια χρυσή εποχή ή την ολική καταστροφή

anderm · 13 March 2026

Εξαιρετικά ιδιαίτερο use case βέβαια Γιώργο.
Η δική μου ροή εργασιών δεν έχει πρωτότυπη δημιουργία documentation. Αρκετές φορές χρειάζεται να κάνω review, που αναγκαστικά πρέπει να διαβάσω όλο το έγγραφο -και 100 να πάρει μοντέλο στο ARC-AGI πάλι θα το διάβαζα.

Η μεγάλη διαφορά στη καθημερινότητα μου είναι στη μετατροπή πρωτογενών δεδομένων σε δομημένα έγγραφα και παρουσιάσεις. Ένα export του SAP σε 20-30 λεπτά έχει γίνει πλήρης παρουσίαση. Αυτό ξεκίνησε να κουτσο-γίνεται από το GPT5 στο copilot 365, σήμερα έχει οριακά λυθεί ως θέμα.

Για τα γρήγορα καθημερινά και εγώ στο gemini 3.1 pro καταφεύγω. Πιστεύω πως η αναλογία ταχύτητας απάντησης προς μονάδες intelligence είναι μακράν η καλύτερη αυτή τη στιγμή.

anderm · 16 March 2026

Στο Opus 4.6, αύξησαν το context window σε 1εκ tokens.
Πλέον τρέχει βαριές υλοποιήσεις συνεχόμενα.
Εδώ σε 17 βήματα, και 1 ώρα+, έφτιαξε λύση για 2FA και με passkeys, τη δοκίμασε, έκανε security review και εν τέλει δουλεύει και καλά.

Γιώργος Κυριακαράκος · 17 March 2026

Δεν ήταν πάντα 1 εκ sto 4.6; Τουλάχιστον στα τεστ που διαβάζω κάτι τέτοιο νομίζω έλεγαν. Μήπως απλά το έκαναν διαθέσιμο και σε άλλα πακέτα συνδρομής;
Τώρα τα ανταγωνιστικά μοντέλα έχουν όλα 1 εκ tokens context window.

Πάντως είμαι σίγουρος πως δεν ξέρουμε να αξιοποιούμε πλήρως ακόμη και αυτά τα μοντέλα που έχουμε σήμερα διαθέσιμα. Θεωρώ ότι μελλοντικές βελτιώσεις εκδόσεων μπορεί να μην προσφέρουν ιδιαίτερα περισσότερη raw power, αλλά καλύτερη κατανόηση των αναγκών των χρηστών και καλύτερες απαντήσεις με λιγότερα και πιο κακογραμμένα prompt...

anderm · 17 March 2026

Είχε 1εκ context window, αλλά διαθέσιμο ως beta μόνο μέσω του API και αυτό με διαφορετική χρέωση για prompts >200K.
Ήταν που ήταν το ακριβότερο, γινόταν επισήμως πανάκριβο. Τώρα το έβγαλαν σε general availability και προστέθηκε στις συνδρομές.

Η διαχείριση του context, μέχρι τώρα πάντως, ήταν περίεργη. Το ζήτημα δεν είναι το να χωράει η πληροφορία στο context window, αλλά και να την θυμάται και ανακαλεί ορθά όπου χρειάζεται. Υπάρχει -φυσικά και θα υπήρχε, benchmark "βελόνα στα άχυρα" που υποτίθεται πως μετράει αυτό ακριβώς.

Γιώργος Κυριακαράκος · 17 March 2026

Διαβάζω το παρακάτω:

https://seekingalpha.com/news/4564980-huang-says-openclaw-to-transform-every-saas-into-agentic-company-gtc

Η NVidia δια στόματος CEO συνεργάζεται με τον Steinberger για να φτιάξει ασφαλές σε enterprize περιβάλλον openclaw. Ναι το ξέρουμε ότι αυτό είναι το επόμενο βήμα ξεκάθαρα. Αλλά πριν λίγες ημέρες δεν ανακοινώθηκε η πρόσληψη από την OpenAI για να κάνει το ίδιο πράγμα;

Δεν νομίζω ότι μπορεί να παίζει και με NVIDIA και με OpenAI στο ίδιο πράγμα χωρίς να υπάρχει τουλάχιστον κατανόηση του τι γίνεται και πως. Ίσως με αυτό απλά ξεφύγει η OpenAI λίγο πιο μπροστά από την Anthropic. Από την άλλη ο Huang αγόρασε σοβαρό μέρος μετοχών και της OpenAI και της Anthropic πριν λίγες ημέρες, ποντάροντας σε αυτές τις 2 ξεκάθαρα.

Μόνο ο χρόνος θα δείξει...

Γιώργος Κυριακαράκος · 17 March 2026

anderm said:
Είχε 1εκ context window, αλλά διαθέσιμο ως beta μόνο μέσω του API και αυτό με διαφορετική χρέωση για prompts >200K.
Ήταν που ήταν το ακριβότερο, γινόταν επισήμως πανάκριβο. Τώρα το έβγαλαν σε general availability και προστέθηκε στις συνδρομές.

Η διαχείριση του context, μέχρι τώρα πάντως, ήταν περίεργη. Το ζήτημα δεν είναι το να χωράει η πληροφορία στο context window, αλλά και να την θυμάται και ανακαλεί ορθά όπου χρειάζεται. Υπάρχει -φυσικά και θα υπήρχε, benchmark "βελόνα στα άχυρα" που υποτίθεται πως μετράει αυτό ακριβώς.

View attachment 268536

Σε αυτό ακριβώς έχει εμφανής βελτίωση και το chatgpt 5.4 από το 5.2.
Ένας από τους λόγους που αρχικά έστησα όλο μου το μοντέλο συνεργασίας με ΑΙ σε πολλούς παράλληλους και αυτόνομους agents που δεν επικοινωνούν μεταξύ τους ήταν και αυτή η αδυναμία σιγά σιγά να ξεχνάνε πράγματα στο ίδιο chat window.

Γιώργος Κυριακαράκος · 20 March 2026

H Apple ισχυριζόταν πάντα ότι ήταν στην αιχμή της τεχνολογίας. Το κομμάτι του ΑΙ της έχει πάει στραβά από την αρχή και το δείχνει ενεργά. Τώρα κόβει apps που υποστηρίζουν vibe coding...απλά για παράδειγμα απαγορεύει στην Vibecode να δημιουργεί apps για το οικοσύστημά της. Έτσι απλά όχι γιατί δεν περνάνε αυτές οι εφαρμογές κάποια πρότυπα ασφάλειας.

Apple goes to war against Vibecoding

natural20.beehiiv.com

Τους βλέπω να καταλήγουν πάλι στην κατηγορία "ταιριάζει με τις κουρτίνες" αν συνεχίσουν έτσι...

Γιώργος Κυριακαράκος · 20 March 2026

O Berny Sanders κάνει brainstorming με το Claude...πολύ ενδιαφέρον.

Πολύ ωραία συζήτηση...αν και η γνώμη του Claude για τα δικαιώματα των ανθρώπων μπορεί να μεταφραστεί ότι στην ΕΕ έχουμε το καλύτερο πλαίσιο - το αρτηριοσκληρωτικό GDPR...

Γιώργος Κυριακαράκος · 20 March 2026

H Anthropic ενεργοποίησε πριν λίγες ημέρες το /loop για το Claude Code. Ουσιαστικά μπορείς να φτιάξεις με αυτό ένα ισοδύναμο με το openclaw, δηλαδή ένα πράκτορα που δουλεύει από μόνος του σε ξεχωριστό χρόνο από τον δικό μας χρόνο.
Αυτό σημαίνει ότι δημιουργικά μπορούμε να φτιάξουμε με αυτόν τον τρόπο αυτόνομες εφαρμογές τύπου Openclaw χωρίς τα θέματα ασφάλειας.
Προφανώς ακόμη θέλει δουλειά από μέρος σου, δεν είναι έτοιμο προϊόν προς χρήση.

https://natesnewsletter.substack.com/p/your-ai-agent-needs-three-things

Kosh · 20 March 2026

Έρευνα του ΜΙΤ: Κάθε φορά που ρωτάς το ChatGPT είναι σαν να ανάβεις μια λάμπα

Η Τεχνητή Νοημοσύνη «διψά» για ρεύμα και αλλάζει τον ενεργειακό χάρτη, την ίδια στιγμή που η Ελλάδα μετατρέπεται σε ψηφιακό κόμβο με επενδύσεις σε data centers

www.protothema.gr

Γιώργος Κυριακαράκος · 21 March 2026

Γίνομαι τελείως βαρετός λέγοντας κάθε φορά πως όλα τρέχουν απίστευτα γρήγορα.

Η επανάσταση του openclaw θεωρείται ήδη το χθες μιας και στην ουσία έχουμε μπει στην ασύγχρονη εποχή όπως την καταλαβαίνω, όπου εμείς οι χρήστες δεν χρειάζεται να είμαστε "από πάνω" και λέμε τι θέλουμε και αυτό το κάνει ενώ εμείς κοιμόμαστε ή κάνουμε άλλα πράγματα. Και τη στιγμή που αυτοματοποιήσουμε το ρόλο μας (που είναι εφικτό) τι μένει για εμάς πέρα από την ανθρώπινη επαφή με ανθρώπους που ακόμη έχουν την ευθύνη λήψης αποφάσεων για να προσπαθούμε να εξηγούμε το χαμό της πληροφορίας που οι πράκτορές μας έχουν κάνει γνώση.

Πολύ ενδιαφέρουσα συνέντευξη του Andrej Karpathy. Ο τίτλος του βίντεο δίνει το όνομα Loopy Era of AI σε αυτή τη νέα εποχή (που θα διαρκέσει στην καλύτερη μερικούς μήνες μέχρι την επόμενη).

Μια ατάκα του Andrej μου έμεινε πολύ. Η βιομηχανία της πληροφορικής πρέπει να σταματήσει να αναπτύσει προϊόντα για ανθρώπους αλλά προϊόντα για agents που χρησιμοποιούν άνθρωποι.

Λαμβάνοντας υπόψη και το νέο προϊόν της Perplexity το computer νιώθω ότι σε πολύ λίγο χρόνο η βιομηχανία της πληροφορικής θα αναπτύσει προϊόντα για αποκλειστικά για agents. Τελεία. Τίποτε άλλο...

Νομίζω πως έχουμε μπει στο Singularity ήδη...

Αυτό που έχω κάνει από μέρους μου είναι να έχω καταγράψει όλο τον τρόπο εργασίας μου σε διάφορα task και να προσπαθώ να δω πως μπορώ να αυτοματοποιήσω περισσότερα τμήματά του. Με το Computer της Perplexity θα μπορούσα σε ένα καλό βαθμό, αλλά δεν ξέρω την ποιότητα του αποτελέσματος. Το θέμα είναι ότι και χαμηλότερη να είναι η ποιότητα, έχει περιθώριο βελτίωσης δεν υπάρχει ταβάνι. Όμως ο όγκος δουλειάς που μπορεί να κάνει; Σε 1-2 ημέρες όλη τη δουλειά του μήνα μου και σε λίγο καιρό οι ημέρες θα γίνουν ώρες.
Νιώθω πως αυτό πια δεν παίρνει δουλειά από άνθρωπο, αλλά από ανθρώπους και μιλάμε για εταιρίες που μπορούν να έχουν το 1/100 ή το 1/1000 σε υπαλλήλους. Και η αλλαγή είναι από πάνω προς τα κάτω αυτή τη στιγμή και το από κάτω προς τα πάνω όπου άνθρωποι χρησιμοποιούν ΑΙ για να βελτιώσουν την απόδοση της εργασίας τους στα συμβατικά πλαίσια θέσης που έχουν καθίσταται τελείως αδιάφορο. Και όλα αυτά πριν λάβουμε υπόψη τα ρομπότ που περιμένουν στη γωνία.

Δεν ξεχνώ και εκείνο το άρθρο που έλεγε ότι αλλάζει η νοητική μας ικανότητα λόγω της χρήσης ΑΙ. Σίγουρα έχει δίκαιο, αλλά πάντα ισχύει τι κάνεις εσύ σε σχέση με το μοντέλο συνεργασίας με το ΑΙ. Αν και πάντα ήμουν multi-tasker στην δουλειά, έχω βελτιστοποιήσει αυτό το skill. Μπορώ πολύ πιο γρήγορα να πηγαίνω από task σε task χωρίς να χάνω το νόημα του τι κάνω σε κάθε task και χωρίς να με κουράζει όπως έκανε πριν από μήνες. Από την άλλη δεν θέλω να θυμάμαι πως ήταν να περνώ ημέρες ψάχνοντας στο google και καταγράφοντας χειροκίνητα. Βέβαια όπως έχω πει η προσέγγισή μου είναι με human-in-the-loop σαν ένα orchestration layer στην κορυφή. Δεν ξέρω για πόσο θα είναι απλά σχετικό αυτό. Ό,τι συζητάμε είναι ουσιαστικά τρόποι για να στήσεις orchestrations layers στο υψηλότερο επίπεδο πάνω από τους Agents και ο άνθρωπος να βγει στο πλάι δίνοντας μόνο μια αρχική εντολή και κοιτώντας το αποτέλεσμα αν του αρέσει.

Γιώργος Κυριακαράκος · 24 March 2026

Άρχιζα να παίζω και εγώ με το Codex της OpenAI...πραγματικά αποκάλυψη...
(Ναι ξέρω κάθε 2 μήνες μιλάμε για κάποια νέα "αποκάλυψη"...)

Το είχα πιάσει στραβά, δηλαδή προσπάθησα με λίγα βίντεο που είχα δει να το αξιοποιήσω στο workflow της δουλειάς μου ανεπιτυχώς και το είχα αφήσει στην άκρη μιας και έκανα τη δουλειά μου με το απλό chat.

Όμως όλη μου η ενασχόληση με το openclaw με έκανε να ξαναγυρίζω στο chat, με το να ψάχνω να βελτιστοποιήσω τη λειτουργία με δεδομένο το μικρό 4Β μοντέλο που τρέχω τοπικά που ενώ στην αρχή είχα κάτι λειτουργικό γρήγορα, τα καθημερινά μηνύματα για μικρά Update είχαν αρχίσει να κουράζουν.

Ένα δικό μου συμπέρασμα είναι ότι το openclaw έχει νόημα αν το συνδέσεις με ΑΡΙ με κάποιο από τα πολύ καλά μοντέλα, ακόμη και τα "instant" ή γενικά ότι καταναλώνει λιγότερα/φθηνότερα token. Η ευκολία στο να φτιάχνεις τα πάντα έχει αυτό το τίμημα. Αν θέλεις να το βελτιστοποιήσεις για περιορισμένο Hardware κλπ τότε αρχίζει να μην είναι η βέλτιση λύση που θεωρούσες πριν.

Έτσι σκέφτομαι γιατί δεν δοκιμάζω κάποιο προσωπικό project στο codex που να βασίζεται κυρίως σε ανάπτυξη λογισμικού. Ε, λοιπόν με 3 prompt κατάλαβε πλήρως και μου έφτιαξε από το τίποτα την εφαρμογή της ψηφιακής γραμματέα επί της "υποδοχής" τοπικά αλλά με υβριδικό τρόπο. Δηλαδή τα περισσότερα task είναι deterministic και το llm απλά αναλαμβάνει να καταλάβει τη φυσική γλώσσα. Αυτό δηλαδή που έπρεπε να αναπτύξω στο openclaw με scripts για να καλύψω τις αδυναμίες του 4Β LLM που απλά δεν υπήρχαν αν χρησιμοποιούσες κάποιο μεγάλο.
Λοιπόν, όχι μόνο το έφτιαξε πολύ καλά, με άλλα 4 μηνύματα κάναμε και αναβαθμίσεις και τώρα το επόμενο βήμα είναι να στήσω αυτή τη γραμματέα σε ένα jetson nano που θα τρέχει τα πάντα τοπικά χωρίς ανάγκη άλλου hardware. Φυσικά μέχρι και από που να αγοράσω όλα τα εξαρτήματα μου βρήκε με το χαμηλότερο κόστος.

Αυτά σε λιγότερο από 1 ώρα. Οπότε μου άνοιξε η όρεξη και είπα απλά τι με δυσκολεύει αυτή τη στιγμή και θα ήθελα να το λύσω με λογισμικό και η απάντηση ήταν ξεκάθαρη:
- Το βασικό μου calendar είναι αυτό της google στο οποίο έχω ένα της δουλειάς και ένα οικογενειακό calendar.
- Η μια από τις εργασίες που κάνω έχει ξεχωριστό mail που το διαχειρίζομαι με το κλασσικό Outlook του office. Το κακό είναι πως έρχονται συμβάντα για ημερολόγιο και εκεί και η μόνη δωρεάν λύση που έχω βρει ως τώρα είναι να ανοίγω αυτά τα email από το κινητό μέσω του Aqua Mail (πληρωμένη έκδοση) και να τα βάζω στο calendar του κινητού το οποίο μετά επειδή είναι το google calendar συγχρονίζει γενικώς.
- Έχει τύχει να χάσω συναντήσεις επειδή δεν είναι πρώτη μου προτεραιότητα να τσεκάρω το δεύτερο calendar που διατηρεί το outlook.
Και ζητώ από το codex να το φτιάξει και του βάζω και παράμετρο τη μέγιστη δυνατή ασφάλεια...ε τι να πω, το έκανε...local εφαρμογή, ένα απλό μενού για κάθε πότε να κάνει αυτόματο sync και ένα κουμπί για manual sync όποτε θέλω. Για το κομμάτι του OAuth client μου έδωσε πολύ αναλυτικές οδηγίες του τι να κάνω και μάλιστα μου εξήγησε και τις επιλογές που έκανε κυρίως με γνώμονα την ασφάλεια που το είχα ζητήσει εξαρχής...

Το software development για ανθρώπους πέθανε. Ο Μιχάλης είναι ήδη πολύ μπροστά μιας και έχει ξεκινήσει να γράφει software για agents που βοηθάνε ανθρώπους που είναι το μέλλον που έχει φτάσει ήδη...

Υ.Γ. Με τα παραπάνω project που είναι πολύ straight forward καταλαβαίνω γιατί τα πρώτα μου πειράματα να ενσωματώσω το codex στο επαγγελματικό workflow απέτυχαν. Τώρα που καταλαβαίνω πως λειτουργεί σίγουρα θα αρχίσω να ετοιμάζω task. Είδα και ένα βίντεο που βασίζεται στο claude cowork όπου περιγράφει αναλυτικά πως φτιάχνει με απλό κείμενο έναν πράκτορα ενορχηστρωτή και μετά φτιάχνει άλλους πράκτορες από κάτω του και πως αυτή τη δομή του λύνει βασικά προβλήματα αυτοματοποιημένα. Μην κολλάτε στην εφαρμογή που θέλει να φτιάξει (note taking). Νομίζω ότι είναι από τα καλύτερα tutorials που έχω δει γιατί εξηγεί ξεκάθαρα τα "για ποιο λόγο", "με ποια προσέγγιση" "πως το υλοποιεί" και "πως δουλεύει". Ακόμη και αν έχετε πρόσβαση στο codex μόνο το θέμα είναι να καταλάβετε την προσέγγιση.

speedman_27 · 24 March 2026

Είχα χρησιμοποιήσει μια εφαρμογή για να κάνω extract hardcore subs και, επειδή το αρχείο είχε και το σημείο που εμφανίζονται τα subs μαζί
με υδατογράφημα, πολλές φορές έβγαζε και αυτό μαζί με τα subs. Στη δωρεάν έκδοση μόνο το
Claude έκανε σωστό καθαρισμό· όχι τέλειο, αλλά σχεδόν άριστο.

anderm · 25 March 2026

Βγήκε η πρώτη μελέτη για το ARC-AGI3:

Γιώργος Κυριακαράκος · 26 March 2026

Αυτό που δεν μπορώ να καταλάβω είναι ποιο μοντέλο του Gemini δίνει τέτοια αποτελέσματα. Αν είναι αυτό με τα 200 ευρώ το μήνα ή αν υπάρχει και κάποια πιο ακριβή έκδοση.
Τόσο η OpenAI και η Anthropic ακόμη και με τις ταπεινές συνδρομές των 20 δολαρίων δίνουν πολύ δυνατά μοντέλα, ενώ η Google μοιάζει να μειώνει πολύ τη δυναμικότητα των μοντέλων στις χαμηλές συνδρομές.

Όσο για το Grok, φαίνεται ξεκάθαρα ότι προσπαθεί, ακουμπάει αλλά ξαναμένει πίσω....

Tzimisce · 26 March 2026

Γιώργος Κυριακαράκος said:
Το software development για ανθρώπους πέθανε. Ο Μιχάλης είναι ήδη πολύ μπροστά μιας και έχει ξεκινήσει να γράφει software για agents που βοηθάνε ανθρώπους που είναι το μέλλον που έχει φτάσει ήδη...

Βασικά ο προγραμματισμός με output σε json είναι πιο πολύ του γούστου μου παρά τα eyecandies της javascript, οπότε τα "παιδιά" μιλάνε στη γλώσσα μου.

Το περίεργο είναι ότι η αγορά δεν έχει πιάσει το νόημα ούτε καν επιφανειακά.
Έχω επιλέξει να δουλεύω 4 LLM (chatgpt, gemini, perplexity και claude) για να κάνω αναλύσεις σε websites ξενοδοχείων και τα πιο "ανεπτυγμένα" websites όπως το Marriot και το Hilton προσφέρουν στην καλύτερη ένα λειψό schema στην home page τους.
Ούτε λόγος για crawlers, πόσο μάλλον για agents. Οπότε το "μέλλον που έχει φτάσει ήδη" ισχύει μάλλον μόνο για μερικούς βλαμμένους σαν εμάς.

Προσωπικά, κάποια skills του στυλ "βρες μου βίλα στη Μύκονο με θέα στη θάλασσα και jacuzzi, σε τιμή κάτω από 800€ την ημέρα" ή "βρες μου δωμάτιο στο τάδε νησί για 4 άτομα με καλές κριτικές, κάτω από τα 100€" είναι το μέλλον.
Αυτό όμως προαπαιτεί ένα "οικοσύστημα" και όχι ξεκάρφωτα nodes από εδώ και από εκεί, εκτός αν κάποιος πάει επί τούτου να ρωτήσει για συγκεκριμένο ξενοδοχείο.
Και όσο η αγορά συμπεριφέρεται σαν ταβερνιάρηδες με κουτούκι στα Σεπόλια, τόσο πιο αργά θα πάμε σε σωστές υλοποιήσεις.

Γιώργος Κυριακαράκος · 26 March 2026

Tzimisce said:
Βασικά ο προγραμματισμός με output σε json είναι πιο πολύ του γούστου μου παρά τα eyecandies της javascript, οπότε τα "παιδιά" μιλάνε στη γλώσσα μου.

Το περίεργο είναι ότι η αγορά δεν έχει πιάσει το νόημα ούτε καν επιφανειακά.
Έχω επιλέξει να δουλεύω 4 LLM (chatgpt, gemini, perplexity και claude) για να κάνω αναλύσεις σε websites ξενοδοχείων και τα πιο "ανεπτυγμένα" websites όπως το Marriot και το Hilton προσφέρουν στην καλύτερη ένα λειψό schema στην home page τους.
Ούτε λόγος για crawlers, πόσο μάλλον για agents. Οπότε το "μέλλον που έχει φτάσει ήδη" ισχύει μάλλον μόνο για μερικούς βλαμμένους σαν εμάς.
Προσωπικά, κάποια skills του στυλ "βρες μου βίλα στη Μύκονο με θέα στη θάλασσα και jacuzzi, σε τιμή κάτω από 800€ την ημέρα" ή "βρες μου δωμάτιο στο τάδε νησί για 4 άτομα με καλές κριτικές, κάτω από τα 100€" είναι το μέλλον.
Αυτό όμως προαπαιτεί ένα "οικοσύστημα" και όχι ξεκάρφωτα nodes από εδώ και από εκεί, εκτός αν κάποιος πάει επί τούτου να ρωτήσει για συγκεκριμένο ξενοδοχείο.
Και όσο η αγορά συμπεριφέρεται σαν ταβερνιάρηδες με κουτούκι στα Σεπόλια, τόσο πιο αργά θα πάμε σε σωστές υλοποιήσεις.

Η διαφορά είναι ότι όταν καταλάβουν αυτοί της Hilton και της Marriot οτι θέλουν τα sites τους έτσι θα πάρουν τηλέφωνο και θα το απαιτήσουν άμεσα όσο και αν κοστίζει. Εσύ θα το έχεις ήδη προσφέρει.

anderm · 26 March 2026

Γιώργος Κυριακαράκος said:
Αυτό που δεν μπορώ να καταλάβω είναι ποιο μοντέλο του Gemini δίνει τέτοια αποτελέσματα. Αν είναι αυτό με τα 200 ευρώ το μήνα ή αν υπάρχει και κάποια πιο ακριβή έκδοση.
Τόσο η OpenAI και η Anthropic ακόμη και με τις ταπεινές συνδρομές των 20 δολαρίων δίνουν πολύ δυνατά μοντέλα, ενώ η Google μοιάζει να μειώνει πολύ τη δυναμικότητα των μοντέλων στις χαμηλές συνδρομές.

Όσο για το Grok, φαίνεται ξεκάθαρα ότι προσπαθεί, ακουμπάει αλλά ξαναμένει πίσω....

Η Google στις μικρές συνδρομές σου δίνει σχετικά περιορισμένο thinking budget. Το ίδιο μοντέλο από το API με "high" thinking budget συμπεριφέρεται τελείως διαφορετικά σε σχέση με το app.
Κατά τα άλλα, έχουν μεγάλο πρόβλημα positioning στην αγορά. Δίνουν πάρα πολύ "inference" (χρόνο που τρέχουν τα μοντέλα) δωρεάν με αποτέλεσμα να είναι εξαιρετικά περιορισμένοι οι υπολογιστικοί πόροι που είναι διαθέσιμοι για οτιδήποτε άλλο εφόσον όλα τα μοντέλα τρέχουν αποκλειστικά σε υποδομή της.

Η Anthropic λ.χ. έχει συμβάσεις με όλους τους Hypervisors, οδηγεί τη κίνηση της μέσω αυτών και οι συνέπειες της όποιας αύξησης χρήσης είναι περιορισμένες.

Τεχνητή Νοημοσύνη (AI). Τι είναι, τι ξέρουμε, τι αλλάζει στη ζωή και στον πολιτισμό;

Γενικός Διαχειριστής

Administration Team

Γενικός Διαχειριστής

Γενικός Διαχειριστής

Administration Team

Γενικός Διαχειριστής

Administration Team

Administration Team

Administration Team

Administration Team

Administration Team

AVClub Fanatic

Administration Team

Administration Team

Supreme Member

Γενικός Διαχειριστής

Administration Team

AVClub Fanatic

Administration Team

Γενικός Διαχειριστής

We value your privacy