Έχει γεμίσει το internet από αναφορές για κάποια μεγάλη εταιρία που έδωσε απεριόριστη χρήση tokens σε όλους τους υπαλλήλους και αυτοί έκαψαν
μισό δισεκατομμύριο δολάρια σε ένα μήνα σε tokens της Anthropic !!!
Δεν είναι λίγες οι εταιρίες που έχουν εισάγει δείκτες παραγωγικότητας για τους υπαλλήλους που τους κάνουν να ρωτάνε για τον καιρό τα πιο ακριβά και σύνθετα μοντέλα για να έχουν καλή εικόνα.
Μετά την εποχή του χωρίς σκέψης καψίματος των token μπαίνουμε σίγουρα σε μια πιο εκλογικευμένη εποχή και με δεδομένο ότι οι τιμές του compute δεν θα πέσουν στο βραχυπρόθεσμο.
Αναμενόμενα όλα αυτά αν με ρωτάτε. Η αποδοτικότητα έχει εφαρμογή στα πάντα. Δεν χρειάζεσαι Pro μοντέλα για να ρωτάς πόσες ώρες αντέχει το ρύζι εκτός ψυγείου. Επίσης όλες οι εταιρίες ΑΙ προσφέρουν πακέτα με χαμηλό κόστος (κάπου 20-25 δολάρια ανά θέση εργασίας) που προσφέρουν πολλά περισσότερα από αυτά που πραγματικά χρειάζεται ο μέσος υπάλληλος.
Δώσε τέτοια πακέτα σε όλους, δώσε πιο ακριβά πακέτα σε πιο υψηλόβαθμους και άσε τη χρήση μέσω ΑΡΙ σε λίγους που εμπιστεύεσαι ότι καταλαβαίνουν τι κάνουν.
Όπως το θέτει ο Derek Thomson μπορούμε να διακρίνουμε 3 μεγάλες χοντρικά εποχές του ΑΙ:
- Η εποχή της κλιμάκωσης και της προσευχής (4ο τρίμηνο 2022 - 2025): Αφού το ChatGPT σάρωσε το διαδίκτυο, οι εταιρείες υπερκλίμακας (hyperscalers) επένδυσαν εκατοντάδες δισεκατομμύρια δολάρια σε υποδομές τεχνητής νοημοσύνης. Παρά τις τεράστιες προσδοκίες για την τεχνολογία, τα πραγματικά έσοδα από την τεχνητή νοημοσύνη υπολείπονταν των δαπανών. Υπήρχαν ισχυρές ενδείξεις ότι η προσφορά ξεπερνούσε τη ζήτηση, ακριβώς όπως συμβαίνει σε κάθε βιομηχανική φούσκα.
- Η εποχή των πρακτόρων (Τέλη 2025 - ???): Με την άφιξη του Claude Code της Anthropic, του Codex της OpenAI και άλλων αυτόνομων πρακτόρων (autonomous agents), οι εταιρικές δαπάνες για την τεχνητή νοημοσύνη εκτοξεύτηκαν σε τόσο φρενήρεις ρυθμούς που οι διακομιστές της Anthropic άρχισαν να λυγίζουν υπό το βάρος του φορτίου. Ξαφνικά, το σκηνικό ανατράπηκε: Η ζήτηση για τεχνητή νοημοσύνη ξεπέρασε αποδεδειγμένα την προσφορά υπολογιστικής ισχύος, περιπλέκοντας το παραδοσιακό αφήγημα της φούσκας.
- Η επιστροφή στην πραγματικότητα (περίπου το 2ο τρίμηνο του 2026): Μετά από μήνες συσσώρευσης λογαριασμών εκατομμυρίων δολαρίων για τη χρήση tokens, ορισμένες εταιρείες άρχισαν να αναρωτιούνται εάν τα κέρδη παραγωγικότητας από τους αυτόνομους πράκτορες δικαιολογούσαν πραγματικά το κόστος. Το ερώτημα μετατοπίστηκε από το «Μπορεί η τεχνητή νοημοσύνη να δημιουργήσει ζήτηση;» στο «Μπορεί η τεχνητή νοημοσύνη να αναπληρώσει την προσφορά;» και, τελικά, στο «Μισό λεπτό, πού ξοδεύουμε όλα αυτά τα χρήματα;».
Η δική μου οπτική είναι ότι είμαστε στη φάση που κάνουμε ένα βήμα πίσω. Θέλει σωστό σχεδιασμό και οργάνωση η χρήση των διαθέσιμων εργαλείων. Και προσωπικά στη δεδομένη στιγμή πρέπει να πάμε σε λελογισμένη χρήση σε εταιρικά περιβάλλοντα, αφού οι επιλογές είναι πρακτικά μεταξύ "κόβουμε το ΑΙ" ή "απολύουμε μαζικά κόσμο". Το δέυτερο δεν έχει έρθει μαζικά γιατί οι περισσότερες εταιρίες δεν είναι ώριμες στο πως να περάσουν σε "cyber" καταστάσεις μιας και θέλει καινούργιες τελείως διαφορετικές εταιρικές οργανωτικές δομές, ενώ στο πρώτο πρέπει να μπουν όρια μιας και το κόστος "εργαζόμενος + ΑΙ" είναι τεράστιο αν το αφήσεις ανεξέλεγκτο.
Ο Thomson πήρε συνέντευξη από τον Doug O’Laughlin της SemiAnalysis’s και του είπε ότι κάθε νέα τεχνολογία απαιτεί μια εκτεταμένη περίοδο trial and error, καθώς οι οργανισμοί εναλλάσσονται μεταξύ
(α) ανεπαρκούς πειραματισμού ή δαπανών, που ακολουθείται από
(β) υπερβολικό πειραματισμό και δαπάνες, που ακολουθείται από
(γ) μια πολύ δραματική περικοπή, που ακολουθείται από
(δ) την επανάληψη των βημάτων (α) έως (γ), μέχρι οι εταιρείες να καταλήξουν σε μια μακροπρόθεσμη ισορροπία μεταξύ των δαπανών για εργατικό δυναμικό και των δαπανών για τεχνολογία. Το κατά πόσον οι σκεπτικιστές της τεχνητής νοημοσύνης έχουν δίκιο ότι η φούσκα είναι έτοιμη να σκάσει, εξαρτάται εξ ολοκλήρου από ένα ερώτημα στο οποίο, μέχρι σήμερα, κανείς δεν μπορεί να απαντήσει με βεβαιότητα: Αξίζει τελικά τον κόπο αυτός ο λογαριασμός;
Να πω πάλι τη γνώμη μου ότι αν ο λογαριασμός είναι λογικός ή με πιο απλά λόγια αν έχει γίνει σωστή μελέτη που να εφαρμόσεις και με ποιο τρόπο το ΑΙ τότε όχι απλά αξίζει, αλλά μπορεί να αυξήσει την κερδοφορία. Αν πας όπως είχε κάνει η Meta να συνδέει εσωτερικά την αξιολόγηση των υπαλλήλων άμεσα με τη χρήση tokens τότε προφανώς είσαι σε κατάσταση σπατάλης.
Ειδικά για τα δεδομένα της Ελλάδας και τις μικρομεσαίες επιχειρήσεις της, θεωρώ ότι καμία εταιρία που δεν είναι στο φάσμα της χρεοκοπίας δεν θα δυσκολευτεί να δώσει ένα 50ευρω το μήνα, να πάρει 2 θέσεις εργασίας, να τις δώσει στα στελέχη που λογικά θα καταλάβουν περισσότερα και σιγά σιγά να κάνουν ανάλυση κόστους-ωφέλειας. Θεωρώ ελάχιστες τις περιπτώσεις που αυτό δεν θα δουλέψει και θα έχει να κάνει με τόσο το είδος της δραστηριότητας όσο και με τους ανθρώπους που δουλεύουν εκεί και πόσο έτοιμοι/διατεθιμένοι είναι να ασχοληθούν. Η απεριόριστη χρήση είναι για λίγους υπαλλήλους σε ελάχιστες εταιρίες, εκεί που αποδεδειγμένα δεν θα γίνει μια νέα πρόσληψη και με 500 ευρώ σε token θα γίνει καλύτερα η δουλειά σε σχέση με ένα junior που κοστίζει πολλαπλάσια.
Δεν είμαστε όλοι Peter Steinberger που με μια ομάδα 3 ατόμων μπορούμε να καίμε $1.3 εκατομύρια δολάρια σε OpenAI API tokens το μήνα, γιατί δεν αναπτύσουμε την επόμενη γενιά εργαλείων που θα μας δώσει η OpenAI. Ακόμη όμως και αυτό το τεράστιο κόστος θα έπεφτε σε μόλις 300.000 δολάρια αν απλά χρησιμοποιούσαν το normal mode αντί για το fast mode στους agents που έτρεχαν μέσω codex. Μιας και ο Steinberger δουλεύει για την OpenAI το κόστος είναι εσωτερικό και πρακτικά δεν έχει αντίκτυπο για την εταιρία. Για μια εταιρία-πελάτη όμως η διαφορά είναι τεράστια σε κόστος, ενώ δύσκολα μπορεί το 1.5x να δικαιολογήσει 4x σε κόστος.
Το νέο μοντέλο του Cursor για παράδειγμα είναι πολύ φθηνό για παράδειγμα και καλύπτει τις ανάγκες πολλών που ασχολούνται με ανάπτυξη/συντήριση λογισμικού. Όπως και πολλά open source με μια υποδομή 10-15000 ευρώ μπορούν να δώσουν απίστευτα καλά αποτελέσματα σε πολλά επαναλαμβανόμενα workflows (ακόμα ψαχνόμαστε πως λειτουργεί πχ το DGX Spark που αν το χρησιμοποιεί ένας χρήσης ακόμη και με παράλληλους πράκτορες ουσιαστικά υπολειτουργεί σε σχέση με τις δυνατότητές του αν χρησιμοποιούσαν την ίδια υποδομή αρκετοί χρήστες κοινώς Concurrency vs Parallelism). Πρέπει όπως μια εταιρία αποφασίζει τι μεταφορικό μέσο θα πάρει για τα Logistics της έτσι να αποφασίσει πολυκριτιριακά τι ΑΙ εργαλεία και με ποιο μοντέλο (συνδρομή, local ή hosted) θα δώσει στην κάθε κατηγορία υπαλλήλων της. Ακόμη και εγώ που είμαι άσχετος με τα Logistics ξέρω ότι χοντρικά υπάρχουν:
1. Μικρά και Αστικά Βαν
2. Μεσαία Βαν
3. Μεγάλα Βαν
4. Βαν με Κουβούκλιο
5. Ελαφρά και Μεσαία Φορτηγά
6. Βαρέα Φορτηγά / Επικαθήμενα
Αναμένουμε τη στιγμή που κάποιος που είναι άσχετος με το ΑΙ θα μπορεί εύκολα να σκεφτεί μια απλή λίστα κατηγοριοποίησης των εργαλείων όπως την παραπάνω. Θέλουμε όμως χρόνο...
Και το πρόβλημα είναι ότι δεν υπάρχουν αρκετοί άνθρωποι να μπορούν να πουν σε μια εταιρία τι να κάνει γιατί έχουμε ελάχιστους domain experts με ΑΙ γνώση σε σχέση με τους generalist AI experts. Τα είδαμε και στην εποχή της ψηφιοποίησης. Μια μεγάλη εταιρία μπορεί να προσλάβει μια μεγάλη consulting που θα προσφέρει μια ομάδα συμβούλων με διαφορετικό υπόβαθρο που θα δώσει λύσεις φυσικά με το αντίστοιχο κόστος. Όμως μια μικρομεσαία επιχείρηση ποιον έχει την οικονομική δυνατότητα να προσλάβει και κατά πόσο αυτός μπορεί όντως να καταλάβει τα σημεία πόνου της εκάστοτε επιχείρησης για να ξεκινήσει από αυτά; Έχω μάθει από φίλους ότι αρκετές σοβαρές εταιρίες το προσπαθούν. Αλλά ακόμη και τα σεμινάρια που κάνουν στους υπαλλήλους στην καλύτερη σταματούν στο τι είναι Prompting...
Πηγές:
The great AI cost panic of 2026 is upon us
www.derekthompson.org
A new report claims AI is getting too expensive for big companies
www.tomshardware.com
Peter Steinberger's three-person team runs 100 AI coding agents on OpenAI's tab.
www.tomshardware.com