Ηλία έχεις κάνει ένα βασικό λάθος.
Σύμφωνα με την ΑΑΔΕ: «1.548 τυχεροί λαχνοί αντιστοιχούν σε μηνιαίες συναλλαγές από 3,70 έως 200 , οι 6.057 λαχνοί σε συναλλαγές μεταξύ 200,01 και 1.000 , ενώ 3.395 τυχεροί λαχνοί προέρχονται από μηνιαίες
συναλλαγές άνω των 1.000 ». Συνεπώς 1.548 τυχεροί λαχνοί ανήκουν σε ΑΦΜ που είχαν από 1 ως 150 λαχνούς, 6.057 σε ΑΦΜ με 151-467 λαχνούς και 3.395 σε ΑΦΜ με περισσότερους από 467 λαχνούς. Προφανώς αυτή η κατανομή στους τυχερούς λαχνούς, ισχύει και στο σύνολο των λαχνών. Δηλαδή αφού το 1.548/11.000=14,07% των τυχερών λαχνών ανήκει σε ΑΦΜ με 1-150 λαχνούς, το 14,07% όλων των λαχνών ανήκει σε ΑΦΜ με 1-150 λαχνούς.
Πάμε τώρα στην τελευταία προσπάθεια. Χρησιμοποιούμε ως πηγή την κατανομή εισοδημάτων της ΑΑΔΕ, το φύλλο Π2 από το
ετήσιο στατιστικό δελτίο του φορολογικού έτους 2015. Η ΑΑΔΕ μας δίνει το σύνολο των εισοδημάτων και τον αριθμό φορολογουμένων ανά κλιμάκιο εισοδήματος. Αφαιρούμε το πρώτο κλιμάκιο με εισόδημα 0 και επανυπολογίζουμε το ποσοστό των φορολογουμένων ανά κλιμάκιο. Αυτό το κάνουμε υποθέτοντας ότι κάποιος με μηδενικό εισόδημα δεν έχει κάνει συναλλαγές και άρα δεν έχει λαχνούς. Έτσι έχουμε ανά κλιμάκιο το ποσοστό ΑΦΜ με μη μηδενικό εισόδημα και το ποσοστό εισοδήματος. Π.χ. στο κλιμάκιο 8.000 -9.000 ετήσιο εισόδημα, ανήκει το 3,88% των ΑΦΜ με μη μηδενικές δαπάνες και έχει το 2,46% του εισοδήματος.
Υποθέτουμε ότι για όλα τα κλιμάκια το ποσοστό των συναλλαγών είναι αντίστοιχο του εισοδήματος. Δηλαδή αν ένα κλιμάκιο έχει το 2,46% του εισοδήματος θα έχει κάνει και το 2,46% των ηλεκτρονικών συναλλαγών. Σημειωτέον ότι η ΑΑΔΕ δίνει τα κλιμάκια οικογενειακού εισοδήματος (υπόχρεου και σύζυγου μαζί) και όχι των μεμονωμένων ΑΦΜ. Στην κλήρωση οι δύο σύζυγοι θα μετέχουν λογικά με δύο διαφορετικά ΑΦΜ. Αλλά είναι δύσκολο να βρούμε καλύτερη πηγή για να προσομοιώσουμε την κατανομή των συναλλαγών.
Οπότε τώρα έχουμε χωρίσει τα ΑΦΜ σε ζώνες (κλιμάκια), γνωρίζοντας τι ποσοστό ΑΦΜ ανήκει σε κάθε ζώνη και τι ποσοστό των ηλεκτρονικών συναλλαγών έχει κάνει κάθε ζώνη. Για την ακρίβεια κάνοντας μια βάσιμη υπόθεση κατανομής και όχι μία τελείως αυθαίρετη κατανομή.
Ξέρουμε ότι ο μέσος όρος των ΑΦΜ ανά κλήρωση (μήνα) είναι 4.307.305 και των συναλλαγών 2.037.804.074,81. Υποθέτοντας ότι εντός κάθε ζώνης υπάρχει ομοιόμορφη κατανομή των συναλλαγών, μπορούμε να υπολογίσουμε τις συναλλαγές κάθε ΑΦΜ εντός της ζώνης και άρα και τον αριθμό λαχνών κάθε ΑΦΜ της ζώνης. Και κατά συνέπεια το σύνολο των λαχνών ανά ζώνη και μετά φυσικά το ποσοστό.
Με ΑΦΜ=4.307.305 και Συναλλαγές=2.037.804.074,81 η υποθετική κατανομή μας δίνει το εξής σύνολο λαχνών και ποσοστό λαχνών ανά κατηγορία σε σχέση με τα πραγματικά:
| Υποθετική Κατανομή | Πραγματικότητα |
Σύνολο Λαχνών | 1.055.273.798 | 1.028.713.291 |
Ποσοστό Λαχνών σε ΑΦΜ με 1-150 λαχνούς | 11,04% | 14,07% |
Ποσοστό Λαχνών σε ΑΦΜ με 151-467 λαχνούς | 60,94% | 55,06% |
Ποσοστό Λαχνών σε ΑΦΜ με περισσότερους από 467 λαχνούς | 28,02% | 30,86% |
Βλέπουμε δηλαδή ότι η κατανομή μας υπεραντιπροσωπεύει τα πλούσια ΑΦΜ και βγάζει περισσότερους λαχνούς από τους κανονικούς. Για να βγάλει λιγότερους λαχνούς πρέπει να αυξήσουμε την κατανομή των συναλλαγών στα πλούσια ΑΦΜ.
Εν πάση περιπτώσει τρέχουμε την εξομοίωση με ΑΦΜ=4.307.305, Συναλλαγές=2.037.804.074,81 και Αριθμό Λαχνών=1.055.273.798. (Ο Αριθμός Λαχνών δεν επηρεάζει το αποτέλεσμα, η κατανομή τους είναι που μετράει. Τον χρησιμοποιούμε απλώς ως μέτρο για να δούμε αν η κατανομή των συναλλαγών είναι σωστή).
Παίρνουμε ως αποτέλεσμα με 100.000 δείγματα:
Μέση τιμή διπλονικητών 31.01 με τυπική απόκλιση 5.51
Μέση τιμή τριπλονικητών 0,85 με τυπική απόκλιση 0,92. Η συχνότητα εμφάνισης 4 ή παραπάνω τριπλονικητών είναι 1,115% (1.115 δείγματα στα 100.000).
Μάλιστα επειδή η κατανομή μας υποαντιπροσωπεύει τα πλούσια ΑΦΜ όπως είδαμε, η πραγματική πιθανότητα για 4 ή παραπάνω τριπλονικητές είναι υψηλότερη. Π.χ. παίζοντας λίγο «μπακάλικα» με το ποσοστό συναλλαγών ώστε να μειώσω τις μεσαίες ζώνες, έβγαλα 13,84% με 1-150 λαχνούς, 55,22% με 151-467 και 30,94% με πάνω από 467. Τότε είχαμε μέση τιμή τριπλονικητών 1,12 με τυπική απόκλιση 1,05 και συχνότητα εμφάνισης 4 ή παραπάνω τριπλονικητών 2,648%. Η συχνότητα εμφάνισης μάλιστα ενός τουλάχιστον τετραπλού νικητή βγήκε 6,399%!
Επισυνάπτω το excel και την html σελίδα. Θέλουν μετονομασία σε .xlsx και .html αντίστοιχα.