Τεχνητή Νοημοσύνη (AI). Τι είναι, τι ξέρουμε, τι αλλάζει στη ζωή και στον πολιτισμό;

Μα αληθινό είναι Γιώργο. Έκανα και για δοκιμή εγγραφή με ένα temp email και μετά διέγραψα τον λογαριασμό.
Είναι αληθινό σαν site, αλλά από όσο έχω διαβάσει δεν είναι λειτουργικό. Μπορεί να κάνω και λάθος ή να ξεκίνησε ως κάτι προβοκατόρικο και τελικά να δουλεύει.
 
  • Like
Reactions: pontios
Μια πολύ ενδιαφέρουσα συζήτηση από ανθρώπους το χώρου για την όλη κατάσταση:
To view this content we will need your consent to set third party cookies.
For more detailed information, see our cookies page.
 
Βγήκαν και τα benchmarks.
Να σας πω ότι το Opus 4.6 για όποιον το πληρώσει μέσω του API της Anthropic, πρόκειται για -μετά διαφοράς, ότι πιο ακριβό υπάρχει. Με τη Max συνδρομή όλα καλά, αλλά είδα το account μας της δουλειάς και το κόστος του API είναι ακραία υψηλό.

Σημ. δείτε και το Kimi K2.5, δωρεάν διαθέσιμο, ανοιχτό μοντέλο που μπορεί να το τρέξει ο καθένας σε υποδομή του.

1770418068056.png

1770418081152.png

1770418093797.png
 

Έφτιαξαν ένα "fast mode" που κάνει 2,5 φορές πιο γρήγορο το Opus 4.6 χωρίς να του περιορίζει το thinking budget. Εξαιρετικό, δεν λέω, αλλά το ήδη τεράστιο κόστος, έστω πως το χρησιμοποιήσεις, καταλήγει στο εξωφρενικό των 30$/1M input tokens και 150!!$/1M output tokens (που περιλαμβάνονται και αυτά του thinking).
 

Έφτιαξαν ένα "fast mode" που κάνει 2,5 φορές πιο γρήγορο το Opus 4.6 χωρίς να του περιορίζει το thinking budget. Εξαιρετικό, δεν λέω, αλλά το ήδη τεράστιο κόστος, έστω πως το χρησιμοποιήσεις, καταλήγει στο εξωφρενικό των 30$/1M input tokens και 150!!$/1M output tokens (που περιλαμβάνονται και αυτά του thinking).
Εδώ θέλει καλή διαχείριση των resources που έχεις. Αν κάποιο παλαιότερο, λιγότερο καλό, αλλά αρκετά καλό για συγκεκριμένη εργασία υπάρχει πρέπει να το επιλέξεις. Θέλει πολύ συνετή χρήση και σίγουρα όχι κάποια σύνδεση με Agent τύπου openclaw γιατί θα κλάψεις μετά.

Μια πολύ ενδιαφέρουσα συζήτηση από ανθρώπους το χώρου για την όλη κατάσταση:
To view this content we will need your consent to set third party cookies.
For more detailed information, see our cookies page.
Το newsletter του Diamantis είναι αρκετά καλό και προσφέρει μια καλή ματιά με αισιοδοξία γενικά. Οι συζητήσεις τους είναι ενδιαφέρουσες, αλλά πολύ μεγάλες για τα γούστα μου για συστηματική ακρόαση.
Άλλη μια ενδιαφέρουσα έρευνα για τη ΤΝ

How the World Lives with AI: Findings from a Year of Global Dialogues

The 2025 Global Dialogues Index Report.​

Δυστυχώς πάντως η ενσωμάτωση ΑΙ στις ελληνικές επιχειρήσεις είναι μικρή. Υπάρχουν μελέτες από αρκετούς φορείς με διαφορετικά αποτελέσματα ανά μελέτη. Το παρακάτω άρθρο αποτυπώνει τα δεδομένα από τον ΟΟΣΑ που είναι τουλάχιστον συγκρίσιμα με τις υπόλοιπες χώρες.
 
1770935633880.png

Βγήκε το νέο Gemini 3 deep think, διαθέσιμο μόνο στην ακριβή τους συνδρομή, για την ώρα μετά διαφοράς πρώτο.
Αυτό έχει προφανώς σχετικά μικρή σημασία για πολύ κόσμο εφόσον για να έχει πρόσβαση χρειάζεται τη συνδρομή των 200€/μήνα.

Tο σημαντικό:

Εάν ανοίξουμε το chatgpt στο δωρεάν πλάνο του και επιλέξουμε και thinking από τις επιλογές, το GPT 5 Mini Thinking μοντέλο που χρησιμοποιεί, έχει 4% σκορ στη κλίμακα του ARC-AGI-2 ενώ το επί πληρωμή τους με τη συνδρομή των 20€, έως 52.9%! To ARC-AGI είναι ένα σύνολο δοκιμασιών στις οποίες ένας άνθρωπος-Expert στον κλάδο του παίρνει 100% και αυτό είναι το reference.

Αυτό συνοψίζει και την εικόνα που έχει ο καθένας για τα διάφορα μοντέλα. Εάν λάβουμε ως δεδομένο πως συζητάμε για τα εξαιρετικά μοντέλα των μεγάλων lab, Anthropic, OpenAI, Google, με τις όποιες διαφορές τους, παρατηρήστε το εξής, υπάρχουν πολύ μεγάλα μοντέλα όπως τα Claude Opus της Anthropic, που είναι εξαιρετικά, αλλά και εξαιρετικά ακριβά στο να τρέξουν (inference). Παρατηρήστε ότι ανεξαρτήτως του thinking budget (πόσο επιτρέπεται στο μοντέλο να "σκεφτεί"), τα σκόρ του Opus 4.6 στο γράφημα είναι σχετικά παρεμφερή.

Τα υπόλοιπα lab, βασίζονται περισσότερο στην MoE (Mixture of Experts) αρχιτεκτονική. Όταν στέλνουμε ένα αίτημα προς το μοντέλο, το διαβάζει η διαλογή και αποφασίζει ποιά υπο-μέρη του μοντέλου πρέπει να ενεργοποιήσει για να το απαντήσει. Το μοντέλο είναι συνολικά εξαιρετικά μεγάλο, ωστόσο για να περιοριστεί το κόστος του να "τρέχει" (inference), οι ενεργές παράμετροι είναι περιορισμένες. Σε αυτές τις περιπτώσεις, το thinking budget παίζει εξαιρετικά σημαντικό ρόλο στο εν τέλει αποτέλεσμα που θα λάβουμε.

Χαρακτηριστικό παράδειγμα το Gemini 3 flash ή το GPT 5.2.
Για το GPT 5.2, στο low thinking budget έχει score 9.7% και στο xhigh 52.9%.
 
Χαίρομαι ιδιαίτερα που έχουμε στον χώρο μας άτομα σαν εσάς ,που τον κοσμούν με τις γνώσεις σας.
Άσχετα αν λόγω έλλειψης,σπουδών ,γνώσεων και αναγκαίας ευφυΐας θα έλεγα,δεν μπορώ να παρακολουθήσω το επίπεδο και την ροή της συζήτησης σας,μπορώ να καταθέσω το εξής.

Επειδή ένα χώρο που τον κατέχω σχετικά καλά είναι το WRC ,έκανα μερικές ερωτήσεις στο Gemini και στην κυριολεξία ήταν για κλωτσιές.
Όταν ,σχετικά ευγενικά,του είπα ότι δε ξέρει τι του γίνεται,μου απάντησε ότι χαίρετε που με την σφαλιάρα που του έριξα (έτσι ακριβώς το έγραψε) τον ξύπνησα και απάντησε με μεγαλύτερη ακρίβεια.
Αργότερα,σε άλλο κραυγαλέο του λάθος,του είπα ότι αν είναι να τον μαθαίνω εγώ δεν έχει νόημα η συζήτηση.
Μου δικαιολογήθηκε ότι οι serves που αντλεί πληροφορίες αργούν να ενημερωθούν και ότι από την συζήτηση που έχει λάβει χώρα,θα δίνει καλύτερες πληροφορίες και απαντήσεις στους επόμενους ερωτωντες.
Μάλιστα με ευχαρίστησε κιόλας.😀
Αν λοιπόν στις αστείες ερωτήσεις που του έκανα ήταν τρείς λαλούν και δυο χορεύουν, φαντάζομαι τι θα λέει σε εσάς που το ζοριζετε το θέμα.

(πάντως όταν κλείσαμε την συζήτηση το ευχαρίστησα ευγενικά,γιατί ποτέ δεν ξέρεις τι σου ξημερώνει με δαυτα 😀)