Κληρώνει σήμερα η ΑΑΔΕ!

Pantos

AVClub Addicted Member
29 December 2013
1,643
Επανερχόμενος στα αδέρφια:
Και αν υποθέσουμε από τα 4.500.000 ΑΦΜ ότι 500.000 δεν έχουν αδερφό στο δείγμα, 3.000.000 έχουν 1 αδερφό και 1.000.000 2 αδερφούς έχουμε:
1.500.000 ζεύγη αδερφών με πιθανότητα νίκης και των δύο αδερφών 5,97*10^-6
333.333 τριπλέτες αδερφών με πιθανότητα νίκης δύο αδερφών 1,79*10^5 (HYPGEOM.DIST(2;11000;3;4500000;FALSE)) και τριών 1,46*10^-8
Και αναμενόμενη (μέση) τιμή ζευγών αδερφών που κέρδισαν 14,92=[1.500.000*5,97*10^-6] + [333.333*1,79*10^-5]
 

chrisssb

Μέλος Σωματείου
26 August 2008
29,794
Kingdom of Rain
Οπότε ?? Τί κατανομή περιμένουμε μετα την άθροιση αυτων των 100.000 επαναλήψεων μιας υπεργεωμετρικής ??.

Θεωρώ ότι όσον αφορά για κάθε μία από τις 11 ξεχωριστές κληρώσεις θα πρέπει να γίνει χρήση της υπεργεωμετρικής προκειμένου να βρούμε τις *πιθανότητες να κερδίσει κάποιος.
Για τις πιθανότητες 2πλο-τριπλο νικητών θα πρέπει να γίνει χρήση της προηγούμενης πιθανότητας και μετά να αναλυθούν** τα αποτελέσματα.

* μπορεί προσεγγιστικά να χρησιμοποιηθεί η μέση πιθανότητα αν και το σωστό θα ήταν να βρούμε πιθανότητες ανά οικονομική ζώνη και για κάθε μια ζώνη να γίνει μετά η χρήση της διωνυμικής για (11 ανα 2) (11 ανα 3).

** θα έχει ενδιαφέρον παράδειγμα αν βρεθεί τριπλονικητής (αλλά δυστυχώς δεν έχουμε τα στοιχεία) της χαμηλής οικονομικής ζώνης, άρα με την μικρότερη πιθανότητα επιτυχίας να έχει προκύψει 2πλο ή χειρότερα 3πλο νικητής.
Το ίδιο ενδιαφέρον έχει και η περίπτωση των 2 αδερφών. Να ανήκουν δηλαδή σε χαμηλή οικονομική ζώνη, και να έχουν κερδίσει όντας μέλη της ίδιας οικογένειας.
 

chrisssb

Μέλος Σωματείου
26 August 2008
29,794
Kingdom of Rain
Επανερχόμενος στα αδέρφια:
Και αν υποθέσουμε από τα 4.500.000 ΑΦΜ ότι 500.000 δεν έχουν αδερφό στο δείγμα, 3.000.000 έχουν 1 αδερφό και 1.000.000 2 αδερφούς έχουμε:
1.500.000 ζεύγη αδερφών με πιθανότητα νίκης και των δύο αδερφών 5,97*10^-6
333.333 τριπλέτες αδερφών με πιθανότητα νίκης δύο αδερφών 1,79*10^5 (HYPGEOM.DIST(2;11000;3;4500000;FALSE)) και τριών 1,46*10^-8
Και αναμενόμενη (μέση) τιμή ζευγών αδερφών που κέρδισαν 14,92=[1.500.000*5,97*10^-6] + [333.333*1,79*10^-5]

Αυθαίρετη η παραδοχή, αλλά εγγενώς λάθος (ότι παραδοχή και να κάνεις).

Εδώ το ζητούμενο δεν είναι η πιθανότητα να κερδίσουν δύο αδέρφια.
Παράδειγμα ένας 50ρης και ο αδερφός του, ένας 60ρης.

Το ζητούμενο είναι να κερδίσουν 2 αδέρφια που ανήκουν και στην ίδια οικογένεια. Ήτοι την ίδια οικογενειακή μερίδα.

Γιατί οι περισσότεροι ενήλικες, μπορεί να έχουν 1,2,3 δεν ξέρω πόσα αδέρφια, αλλά ο καθένας από αυτούς έχει τη δική του οικογένεια δηλ. ανήκει σε διαφορετική οικογενειακή μερίδα.
 

Pantos

AVClub Addicted Member
29 December 2013
1,643
* μπορεί προσεγγιστικά να χρησιμοποιηθεί η μέση πιθανότητα αν και το σωστό θα ήταν να βρούμε πιθανότητες ανά οικονομική ζώνη και για κάθε μια ζώνη να γίνει μετά η χρήση της διωνυμικής για (11 ανα 2) (11 ανα 3).
Θα προσεγγίζαμε ακόμα περισσότερο την πραγματικότητα αν βάζαμε μη ομοιόμορφη κατανομή σε κάθε ζώνη αλλά π.χ. γραμμική. Δηλαδή ο φτωχότερος της φτωχής ζώνης να έχει 1 λαχνό, ο μεσαίος της φτωχής ζώνης 10 και ο πλουσιότερος της φτωχής ζώνης π.χ. 20. Τότε π.χ. θα ίσχυε ακόμα η διωνυμική;

Αυθαίρετη η παραδοχή, αλλά εγγενώς λάθος (ότι παραδοχή και να κάνεις).

Εδώ το ζητούμενο δεν είναι η πιθανότητα να κερδίσουν δύο αδέρφια.
Παράδειγμα ένας 50ρης και ο αδερφός του, ένας 60ρης.

Το ζητούμενο είναι να κερδίσουν 2 αδέρφια που ανήκουν και στην ίδια οικογένεια. Ήτοι την ίδια οικογενειακή μερίδα.

Γιατί οι περισσότεροι ενήλικες, μπορεί να έχουν 1,2,3 δεν ξέρω πόσα αδέρφια, αλλά ο καθένας από αυτούς έχει τη δική του οικογένεια δηλ. ανήκει σε διαφορετική οικογενειακή μερίδα.

Σε χάνω λίγο εδώ. Εγώ υπολόγισα την πιθανότητα να κερδίσουν δύο αδέρφια με μία αυθαίρετη φυσικά κατανομή αριθμού αδερφών. «Εμπνεόμενος» από το παράδειγμα των 2 αδερφών στο Ηράκλειο. Το ενδιαφέρον είναι ότι όταν άπλωσα την κατανομή από 1 αδέρφια, σε 0-2 αδέρφια, η μέση τιμή παρέμεινε περίπου ίδια.
Εσύ θέλεις να υπολογίσουμε την πιθανότητα να κερδίσουν δύο αδέρφια που έχουν την ίδια οικογενειακή μερίδα, δηλαδή δεν έχουν δική τους οικογένεια; Γιατί το λες αυτό, ξέρεις ότι οι αδερφές στην Κρήτη ήταν ανύπαντρες και δεν είχαν δική τους οικογένεια;

Παρεμπιπτόντως ψάχνοντας για τις δύο αδερφές βρήκα αυτό το βίντεο. Στο πρώτο μιλάει και η Διευθύντρια Ηλεκτρονικής Διακυβέρνησης ΑΑΔΕ για την κλήρωση. Λέει κάτι για 8 ΑΦΜ που κέρδισαν εντός της ίδιας κλήρωσης και άλλα με 7.000 στην κλήρωση. Δεν κατάλαβα αν εννοεί 7.000 λαχνούς ή 7.000 αγορές ανά μήνα. Ίσως λαχνούς γιατί 7.000 αγορές το μήνα δεν ακούγεται και τόσο εξωπραγματικό για κάποιον πλούσιο.


Τέλος λαχνούς κερδίζεις και με τις αγορές εντός ΕΕ. Οπότε αν πάει ο/η πλούσιος/α για ψώνια στο Μιλάνο ή κλείσει πεντάστερο ξενοδοχείο στο Παρίσι κερδίζει λαχνούς.
 

chrisssb

Μέλος Σωματείου
26 August 2008
29,794
Kingdom of Rain
Για την διωνυμική όπως είπα από την αρχή έχω κάποιες αμφιβολίες.
Δυστυχώς δεν έχω τον χρόνο να το ψάξω ώστε να σου πω στα σίγουρα.

Έχω την εντύπωση ότι οι 2 αδερφές ήταν μέλη της ίδιας οικογένειας.
Μάλιστα κάνανε λέει Χριστούγεννα μαζί με τους γονείς τους.

Μπορεί να κατάλαβα λάθος αλλά αυτό θυμάμαι.

Επίσης η μία σίγουρα άνεργη (άρα με μικρότερη από το μέσο όρο αριθμό λαχνών).

Πάντως το να είναι στην ίδια οικογένεια με το να είναι γενικά αδερφές έχει μεγάλη σημασία στις πιθανότητες.

Να ακόμη ένα θολό σημείο.
 

chrisssb

Μέλος Σωματείου
26 August 2008
29,794
Kingdom of Rain
Re: Συνδρομητές της εταιρίας Wind προσοχή!!

Το βρήκα:
Εδώ λέει ότι και οι δύο έχουν παιδιά.

Αρά άκυρο το να είναι στην ίδια οικογενειακή μερίδα.
 

Pantos

AVClub Addicted Member
29 December 2013
1,643
Για την διωνυμική όπως είπα από την αρχή έχω κάποιες αμφιβολίες.
Δυστυχώς δεν έχω τον χρόνο να το ψάξω ώστε να σου πω στα σίγουρα.

Νομίζω ότι έχεις άδικο. Κάναμε και την εξομοίωση (για μοντέλο με 4.500.000 ΑΦΜ όπου ο κάθε ένας έχει 1 λαχνό) και βγήκε η ίδια μέση τιμή που υπολογίσαμε θεωρητικά. Άρα το έχουμε βρει θεωρητικά, με εξομοίωση. Τι άλλο να κάνουμε;

Πάντως το να είναι στην ίδια οικογένεια με το να είναι γενικά αδερφές έχει μεγάλη σημασία στις πιθανότητες.
Να ακόμη ένα θολό σημείο.

Αυτό που τράβηξε την προσοχή της κοινής γνώμης είναι ότι κέρδισαν δύο αδέρφια. Οπότε βρίσκουμε (με απλοποιήσεις φυσικά) την πιθανότητα να κέρδισαν δύο αδέρφια.
Όσο βάζουμε παραπάνω προϋποθέσεις, π.χ. να είναι και οι δύο γυναίκες, να είναι ανύπαντρες (ή παντρεμένες), να είναι ξανθές, να είναι από το Ηράκλειο, να αρχίζει το επίθετό τους από Σ προφανώς η πιθανότητα όλο και μικραίνει.
Είναι σαν να λέμε ότι κέρδισε το λαχείο ένας ψηλός, καραφλός, 50αρης από το Αγρίνιο με τρία παιδιά. Και μετά να λέμε ποια είναι η πιθανότητα να κερδίσει το λαχείο ένας ψηλός, καραφλός, 50αρης από το Αγρίνιο με τρία παιδιά; Προφανώς απειροελάχιστη, άρα καταλήγουμε ότι κάτι θολό υπάρχει στην κλήρωση του λαχείου;
Λάθος λογική γιατί εμείς ψάχνουμε την πιθανότητα να κερδίσει οποιοσδήποτε το λαχείο (και όχι ένα συγκεκριμενο άτομο) όπως ψάχνουμε την πιθανότητα να κερδίσουν οποιαδήποτε αδέρφια στην ΑΑΔΕ (και όχι κάποια συγκεκριμένη κατηγορία από αδέρφια όπως θηλυκά, ανύπαντρα (ή παντρεμένα) αδέρφια)
 

chrisssb

Μέλος Σωματείου
26 August 2008
29,794
Kingdom of Rain
Νομίζω ότι έχεις άδικο. Κάναμε και την εξομοίωση (για μοντέλο με 4.500.000 ΑΦΜ όπου ο κάθε ένας έχει 1 λαχνό) και βγήκε η ίδια μέση τιμή που υπολογίσαμε θεωρητικά. Άρα το έχουμε βρει θεωρητικά, με εξομοίωση. Τι άλλο να κάνουμε;



Αυτό που τράβηξε την προσοχή της κοινής γνώμης είναι ότι κέρδισαν δύο αδέρφια. Οπότε βρίσκουμε (με απλοποιήσεις φυσικά) την πιθανότητα να κέρδισαν δύο αδέρφια.
Όσο βάζουμε παραπάνω προϋποθέσεις, π.χ. να είναι και οι δύο γυναίκες, να είναι ανύπαντρες (ή παντρεμένες), να είναι ξανθές, να είναι από το Ηράκλειο, να αρχίζει το επίθετό τους από Σ προφανώς η πιθανότητα όλο και μικραίνει.
Είναι σαν να λέμε ότι κέρδισε το λαχείο ένας ψηλός, καραφλός, 50αρης από το Αγρίνιο με τρία παιδιά. Και μετά να λέμε ποια είναι η πιθανότητα να κερδίσει το λαχείο ένας ψηλός, καραφλός, 50αρης από το Αγρίνιο με τρία παιδιά; Προφανώς απειροελάχιστη, άρα καταλήγουμε ότι κάτι θολό υπάρχει στην κλήρωση του λαχείου;
Λάθος λογική γιατί εμείς ψάχνουμε την πιθανότητα να κερδίσει οποιοσδήποτε το λαχείο (και όχι ένα συγκεκριμενο άτομο) όπως ψάχνουμε την πιθανότητα να κερδίσουν οποιαδήποτε αδέρφια στην ΑΑΔΕ (και όχι κάποια συγκεκριμένη κατηγορία από αδέρφια όπως θηλυκά, ανύπαντρα (ή παντρεμένα) αδέρφια)

Μα απάντησα ήδη.
Ότι δηλαδή ξεκαθαρίστηκε πως δεν είναι στην ίδια οικογενειακή μερίδα.
ΑΝ ήτανε τότε θεωρώ πως θα είχε μεγάλη διαφορά και δεν έχει να κάνει με προϋποθέσεις του τύπου να είναι ξανθές ή κοντές κ.λπ.
Θα ήτανε πολύ σημαντική απόκλιση για πολλούς λόγους.
 
19 June 2006
4,594
Θεσσαλονίκη
Θεωρώ ότι όσον αφορά για κάθε μία από τις 11 ξεχωριστές κληρώσεις θα πρέπει να γίνει χρήση της υπεργεωμετρικής (1) προκειμένου να βρούμε τις *πιθανότητες να κερδίσει κάποιος.
Για τις πιθανότητες 2πλο-τριπλο νικητών θα πρέπει να γίνει χρήση της προηγούμενης πιθανότητας και μετά να αναλυθούν** (3) τα αποτελέσματα.

(2) * μπορεί προσεγγιστικά να χρησιμοποιηθεί η μέση πιθανότητα αν και το σωστό θα ήταν να βρούμε πιθανότητες ανά οικονομική ζώνη και για κάθε μια ζώνη να γίνει μετά η χρήση της διωνυμικής για (11 ανα 2) (11 ανα 3).

** θα έχει ενδιαφέρον παράδειγμα αν βρεθεί τριπλονικητής (αλλά δυστυχώς δεν έχουμε τα στοιχεία) της χαμηλής οικονομικής ζώνης, άρα με την μικρότερη πιθανότητα επιτυχίας να έχει προκύψει 2πλο ή χειρότερα 3πλο νικητής.
Το ίδιο ενδιαφέρον έχει και η περίπτωση των 2 αδερφών. Να ανήκουν δηλαδή σε χαμηλή οικονομική ζώνη, και να έχουν κερδίσει όντας μέλη της ίδιας οικογένειας.

(1) Είμαστε ΟΚ διότι η υπεργεωμετρική χρησιμοποιήθηκε (με την μορφή του γινομένου (1-1/ΑΦΜ) * (1-1/(ΑΦΜ-1) * ... και στην προσομοίωση και στο Excel για την περίπτωση των δοκιμών χωρίς ζώνες.

Στην προσομοίωση με ζώνες στο σκριπτ του Pantos είμαστε εντελώς ΟΚ (πλήν της περίπτωσης η ακρίβεια να μην είναι επαρκής π.χ. αν κάνει χρήση float_16bit ή int16/32 ..)

Στην επίλυση με ζώνες στο Εxcel χρησιμοποίησα ανα κατηγορία το απλοποιημένο 1000 * "λαχνοι_ανα_ΑΦΜ"/"λαχνοί_μήνα" το οποίο μου δίνει διαφορά μόνο στο 15ο δεκαδικό σε σχέση με το γινόμενο της σειράς .. και ακόμα λιγότερο σε σχέση με την υπεργεωμετρική του Excel .. να πώ την αλήθεια .. πιστεύω οτι δεν είναι και εντελώς ακριβές το Excel ούτε στο γινόμενο ούτε στην υπεργεωμετρική ..
Κατα τα άλλα έγινε η εύρεση πιθανοτήτων ανα ζώνες και η διωνυμική ανα ζώνες και στο συγκεντρωτικό μπαίνει το άθροισμα των ζωνών

Αρα και το (2) έγινε όπως το λές

(3) Ακριβώς για την ανάλυση των στοιχείων βάζω θέμα για την καταλληλότητα των κατανομών μονών/διπλών/τριπλών .. Ο Pantos το έκανε στην προσoμοίωση .. αλλά για το Excel θέλω να βρίσκω υπολογιστικά την τυπική απόκλιση και τις πιθανότητες απόκλισης και να οργανώσω ενα πινακάκι που να τα δείχνει, άρα χρειάζομαι την σωστή συνάρτηση πιθανοτήτων .. με τους διπλούς/τριπλούς είμαι ΟΚ αλλά στους μονούς ακόμα δεν το χώνεψα ..

Το βράδυ θα καθαρίσω το Εχελάκι απο μπερδευτικούς πειραματισμούς και θα το ανεβάσω ..

Κάτι που δεν κάναμε είναι να βρούμε με περισσότερη ακρίβεια την κατανομή λαχνών ανα ΑΦΜ .. υπάρχουν συγκεντρωτικά στοιχεία ανα μήνα και ίσως μπορεί να γίνει κατι με τον solver του excel ..

π.χ. οι προκύπτοντες λαχνοί σε σχέση με τον όγκο συναλλαγων κάτι μπορούν να δείξουν ..
Code:
[FONT=Fixedsys]
	ΑΦΜ	   ----Συναλλαγές	   -------Λαχνοί	   ---------Λαχν./ 	   ----Λαχν./ΑΦΜ
ιαν	3.890.833	1.828.609.747,52	    918.748.104,00   0,502429841	236,131467
φεβ	4.066.902	1.803.063.873,14	    928.773.721,00 	 0,515108608	228,373765
μαρ	4.152.346	2.006.550.166,68	 1.003.567.519,00	 0,500145741	241,686873
απρ	4.177.105	1.993.480.528,51	 1.009.805.390,00	 0,506553927	241,747667
μαϊ	4.273.981	2.086.015.957,59	 1.042.172.847,00	 0,499599652	243,841245
ιουν	4.295.371	2.009.643.268,52	 1.015.492.802,00	 0,505309981	236,415621
ιουλ	4.421.759	2.197.872.787,36	 1.094.775.774,00	 0,498106979	247,588296
αυγ	4.464.467	2.153.878.797,31	 1.083.440.482,00	 0,503018314	242,680813
σεπ	4.484.689	2.072.219.778,99	 1.052.265.121,00	 0,507796099	234,635026
οκτ	4.556.328	2.093.786.015,92	 1.074.332.777,00	 0,513105336	235,789166
νοε	4.596.573	2.170.723.901,33	 1.092.471.665,00	 0,503275273	237,670905
δεκ				[/FONT]
 
19 June 2006
4,594
Θεσσαλονίκη
Το εξελάκι .. για πειράματα και διορθώσεις τυχόν λαθών και επεκτάσεις ..

Μετονομασία σε .xlsx
 

Attachments

  • _ΓŽΒ±Γβ‚¬ΓŽΒΏΓŽΒ΄ΓŽΒ΅ΓŽΒΉΓŽΒΎΓŽΒ΅Γβ€°ΓŽΒ½-clean - ΓŽβ€˜ΓŽΒ½Γβ€žΓŽΒΉΓŽΒ³ΓΒΓŽΒ±Γβ€ ΓŽΒ?...doc
    20.9 KB · Views: 2

Pantos

AVClub Addicted Member
29 December 2013
1,643
Ηλία έχεις κάνει ένα βασικό λάθος. Σύμφωνα με την ΑΑΔΕ: «1.548 τυχεροί λαχνοί αντιστοιχούν σε μηνιαίες συναλλαγές από 3,70 έως 200 , οι 6.057 λαχνοί σε συναλλαγές μεταξύ 200,01 και 1.000 , ενώ 3.395 τυχεροί λαχνοί προέρχονται από μηνιαίες
συναλλαγές άνω των 1.000 ». Συνεπώς 1.548 τυχεροί λαχνοί ανήκουν σε ΑΦΜ που είχαν από 1 ως 150 λαχνούς, 6.057 σε ΑΦΜ με 151-467 λαχνούς και 3.395 σε ΑΦΜ με περισσότερους από 467 λαχνούς. Προφανώς αυτή η κατανομή στους τυχερούς λαχνούς, ισχύει και στο σύνολο των λαχνών. Δηλαδή αφού το 1.548/11.000=14,07% των τυχερών λαχνών ανήκει σε ΑΦΜ με 1-150 λαχνούς, το 14,07% όλων των λαχνών ανήκει σε ΑΦΜ με 1-150 λαχνούς.


Πάμε τώρα στην τελευταία προσπάθεια. Χρησιμοποιούμε ως πηγή την κατανομή εισοδημάτων της ΑΑΔΕ, το φύλλο Π2 από το ετήσιο στατιστικό δελτίο του φορολογικού έτους 2015. Η ΑΑΔΕ μας δίνει το σύνολο των εισοδημάτων και τον αριθμό φορολογουμένων ανά κλιμάκιο εισοδήματος. Αφαιρούμε το πρώτο κλιμάκιο με εισόδημα 0 και επανυπολογίζουμε το ποσοστό των φορολογουμένων ανά κλιμάκιο. Αυτό το κάνουμε υποθέτοντας ότι κάποιος με μηδενικό εισόδημα δεν έχει κάνει συναλλαγές και άρα δεν έχει λαχνούς. Έτσι έχουμε ανά κλιμάκιο το ποσοστό ΑΦΜ με μη μηδενικό εισόδημα και το ποσοστό εισοδήματος. Π.χ. στο κλιμάκιο 8.000 -9.000 ετήσιο εισόδημα, ανήκει το 3,88% των ΑΦΜ με μη μηδενικές δαπάνες και έχει το 2,46% του εισοδήματος.


Υποθέτουμε ότι για όλα τα κλιμάκια το ποσοστό των συναλλαγών είναι αντίστοιχο του εισοδήματος. Δηλαδή αν ένα κλιμάκιο έχει το 2,46% του εισοδήματος θα έχει κάνει και το 2,46% των ηλεκτρονικών συναλλαγών. Σημειωτέον ότι η ΑΑΔΕ δίνει τα κλιμάκια οικογενειακού εισοδήματος (υπόχρεου και σύζυγου μαζί) και όχι των μεμονωμένων ΑΦΜ. Στην κλήρωση οι δύο σύζυγοι θα μετέχουν λογικά με δύο διαφορετικά ΑΦΜ. Αλλά είναι δύσκολο να βρούμε καλύτερη πηγή για να προσομοιώσουμε την κατανομή των συναλλαγών.


Οπότε τώρα έχουμε χωρίσει τα ΑΦΜ σε ζώνες (κλιμάκια), γνωρίζοντας τι ποσοστό ΑΦΜ ανήκει σε κάθε ζώνη και τι ποσοστό των ηλεκτρονικών συναλλαγών έχει κάνει κάθε ζώνη. Για την ακρίβεια κάνοντας μια βάσιμη υπόθεση κατανομής και όχι μία τελείως αυθαίρετη κατανομή.


Ξέρουμε ότι ο μέσος όρος των ΑΦΜ ανά κλήρωση (μήνα) είναι 4.307.305 και των συναλλαγών 2.037.804.074,81. Υποθέτοντας ότι εντός κάθε ζώνης υπάρχει ομοιόμορφη κατανομή των συναλλαγών, μπορούμε να υπολογίσουμε τις συναλλαγές κάθε ΑΦΜ εντός της ζώνης και άρα και τον αριθμό λαχνών κάθε ΑΦΜ της ζώνης. Και κατά συνέπεια το σύνολο των λαχνών ανά ζώνη και μετά φυσικά το ποσοστό.


Με ΑΦΜ=4.307.305 και Συναλλαγές=2.037.804.074,81 η υποθετική κατανομή μας δίνει το εξής σύνολο λαχνών και ποσοστό λαχνών ανά κατηγορία σε σχέση με τα πραγματικά:


Υποθετική ΚατανομήΠραγματικότητα
Σύνολο Λαχνών1.055.273.7981.028.713.291
Ποσοστό Λαχνών σε ΑΦΜ με 1-150 λαχνούς11,04%14,07%
Ποσοστό Λαχνών σε ΑΦΜ με 151-467 λαχνούς60,94%55,06%
Ποσοστό Λαχνών σε ΑΦΜ με περισσότερους από 467 λαχνούς28,02%30,86%


Βλέπουμε δηλαδή ότι η κατανομή μας υπεραντιπροσωπεύει τα πλούσια ΑΦΜ και βγάζει περισσότερους λαχνούς από τους κανονικούς. Για να βγάλει λιγότερους λαχνούς πρέπει να αυξήσουμε την κατανομή των συναλλαγών στα πλούσια ΑΦΜ.


Εν πάση περιπτώσει τρέχουμε την εξομοίωση με ΑΦΜ=4.307.305, Συναλλαγές=2.037.804.074,81 και Αριθμό Λαχνών=1.055.273.798. (Ο Αριθμός Λαχνών δεν επηρεάζει το αποτέλεσμα, η κατανομή τους είναι που μετράει. Τον χρησιμοποιούμε απλώς ως μέτρο για να δούμε αν η κατανομή των συναλλαγών είναι σωστή).


Παίρνουμε ως αποτέλεσμα με 100.000 δείγματα:
Μέση τιμή διπλονικητών 31.01 με τυπική απόκλιση 5.51
Μέση τιμή τριπλονικητών 0,85 με τυπική απόκλιση 0,92. Η συχνότητα εμφάνισης 4 ή παραπάνω τριπλονικητών είναι 1,115% (1.115 δείγματα στα 100.000).


Μάλιστα επειδή η κατανομή μας υποαντιπροσωπεύει τα πλούσια ΑΦΜ όπως είδαμε, η πραγματική πιθανότητα για 4 ή παραπάνω τριπλονικητές είναι υψηλότερη. Π.χ. παίζοντας λίγο «μπακάλικα» με το ποσοστό συναλλαγών ώστε να μειώσω τις μεσαίες ζώνες, έβγαλα 13,84% με 1-150 λαχνούς, 55,22% με 151-467 και 30,94% με πάνω από 467. Τότε είχαμε μέση τιμή τριπλονικητών 1,12 με τυπική απόκλιση 1,05 και συχνότητα εμφάνισης 4 ή παραπάνω τριπλονικητών 2,648%. Η συχνότητα εμφάνισης μάλιστα ενός τουλάχιστον τετραπλού νικητή βγήκε 6,399%!


Επισυνάπτω το excel και την html σελίδα. Θέλουν μετονομασία σε .xlsx και .html αντίστοιχα.
 

Attachments

  • aade-draw-calculator.doc
    17.7 KB · Views: 2
  • calc-weights.doc
    22.9 KB · Views: 1
19 June 2006
4,594
Θεσσαλονίκη
Ηλία έχεις κάνει ένα βασικό λάθος. Σύμφωνα με την ΑΑΔΕ: «1.548 τυχεροί λαχνοί αντιστοιχούν σε μηνιαίες συναλλαγές από 3,70 έως 200 , οι 6.057 λαχνοί σε συναλλαγές μεταξύ 200,01 και 1.000 , ενώ 3.395 τυχεροί λαχνοί προέρχονται από μηνιαίες
συναλλαγές άνω των 1.000 ». Συνεπώς 1.548 τυχεροί λαχνοί ανήκουν σε ΑΦΜ που είχαν από 1 ως 150 λαχνούς, 6.057 σε ΑΦΜ με 151-467 λαχνούς και 3.395 σε ΑΦΜ με περισσότερους από 467 λαχνούς. Προφανώς αυτή η κατανομή στους τυχερούς λαχνούς, ισχύει και στο σύνολο των λαχνών. Δηλαδή αφού το 1.548/11.000=14,07% των τυχερών λαχνών ανήκει σε ΑΦΜ με 1-150 λαχνούς, το 14,07% όλων των λαχνών ανήκει σε ΑΦΜ με 1-150 λαχνούς.


.

Αααα .. ωραία .. έγραφε για και εγώ το έβαλα ως λαχνούς ;)

Αλλά πρέπει να πάρουμε υπόψιν και κάτι άλλο .. οτι τα αναφερόμενα ποσά συναλλαγών ανα κατηγορία δεν είναι ο μέσος μηνιαίος όρος αλλά ο μήνας όπου κληρώθηκαν .. αυτό επειδή υπάρχει διασπορά απο μήνα σε μήνα βγάζει πλασματικά αυξημένο ποσό (η πιθανότητα να κέρδισαν σε δυνατό μήνα είναι μεγαλύτερη) π.χ. εγώ είχα διασπορά απο 100-1300 με Μ.Ο. 400 αλλά ο ισοδύναμος_Μ.Ο (αυτός που βγάζει ίδιες πιθανότητες με την ανα μήνα επίλυση) είναι πάνω απο 500

Επίσης .. ίσως ήδη το πρόσεξες .. απο την αναλογία περιπου 0,50 Λαχνοί/ μας προκύπτει ισοδύναμος_Μ.Ο_λαχνών = 400 αντι του Μ.Ο 239 λαχνών που συμμετείχαν ;)
 

Pantos

AVClub Addicted Member
29 December 2013
1,643
Αλλά πρέπει να πάρουμε υπόψιν και κάτι άλλο .. οτι τα αναφερόμενα ποσά συναλλαγών ανα κατηγορία δεν είναι ο μέσος μηνιαίος όρος αλλά ο μήνας όπου κληρώθηκαν .. αυτό επειδή υπάρχει διασπορά απο μήνα σε μήνα βγάζει πλασματικά αυξημένο ποσό (η πιθανότητα να κέρδισαν σε δυνατό μήνα είναι μεγαλύτερη)
Ναι έχεις δίκιο. Αλλά έκανα την απλοποίηση ότι οι συναλλαγές είναι σταθερές ανά μήνα. Αλλιώς άντε να λυθεί. Πάντως αν ένα μεσαίο ΑΦΜ είναι στους μισούς μήνες φτωχό και στους μισούς πλούσιο, αυτό λογικά αυξάνει την πιθανότητα τριπλονικητών. Όσο οι συναλλαγές συμπιέζονται προς τη μέση μειώνονται οι τριπλονικητές, όσο απλώνουν προς τα άκρα οι τριπλονικητές αυξάνονται.

π.χ. εγώ είχα διασπορά απο 100-1300 με Μ.Ο. 400 αλλά ο ισοδύναμος_Μ.Ο (αυτός που βγάζει ίδιες πιθανότητες με την ανα μήνα επίλυση) είναι πάνω απο 500
Δεν καταλαβαίνω πως προκύπτει το 500 .

Επίσης .. ίσως ήδη το πρόσεξες .. απο την αναλογία περιπου 0,50 Λαχνοί/ μας προκύπτει ισοδύναμος_Μ.Ο_λαχνών = 400 αντι του Μ.Ο 239 λαχνών που συμμετείχαν
Δεν σε έπιασα. Το 400 από που βγαίνει;

Υ.Γ: Μέτρησα και σε ποια ζώνη ανήκουν οι τριπλονικητές. Πάνω από το 90% ανήκουν στην υψηλότερη ζώνη!
 
19 June 2006
4,594
Θεσσαλονίκη
Tο σκριπτ κόλλησε .. είχα βάλει 20.000 επαναλήψεις και σταματησε σε κάποια φάση χωρίς να βγάλει αποτέλεσμα .. έχω 4GB μνήμη .. έτρεχα και κατι άλλα παραλληλα .. έχεις καμιά ιδέα πως να το παλέψω ?.

Το 500+ .. υπολόγισα αναλυτικά με τα μηνιαία μου στοιχεία την πιθανότητα για τους 11 μήνες συνολικά .. και μετά βρήκα για ποιά τιμή (ίδια για όλους τους μήνες) βγαίνει ίδια πιθανότητα .. δεν βρίσκω τον υπολογισμό τώρα να δω μην και έκανα κανένα λάθος ..

Το 400 .. βγαίνει απο την αναλογία /λαχνοί = 0,50 .. στα 0-100 είναι 1,00 .. 101-500 είναι 0,50 και θέλεις και άλλα 300 στην 501-1000 για να βγεί = 0,50 100+400+300 = 800 μας κάνουν 100+200+100 = 400 λαχνούς (αναλογία λαχνοί/ =0,50 ) .. οτιδήποτε παρακάτω έχει μεγαλύτερη αναλογία - οτιδήποτε παραπάνω έχει μικρότερη.
Σκεφτόμουνα μήν και βάλουμε αυτή την συνθήκη σαν επιπλέον όρο για εύρεση ζωνών με solver .. αλλά μάλλον η λύση που έδωσες με τα φορολογικά στοιχεία είναι καλύτερη ..

Τι άνω όριο έχεις στην ψηλή κατηγορία ?.

Υ.Γ: Μέτρησα και σε ποια ζώνη ανήκουν οι τριπλονικητές. Πάνω από το 90% ανήκουν στην υψηλότερη ζώνη!
Εεε αφού είχε φανεί καθαρά απο το πρώτο excel .. μόνο οι δυνατοί παίχτες παίζουν για πάνω απο 1 επιτυχία

Εχω μια ασάφεια για την κατανομή στους μονούς νικητές .. επειδή είδα και λίγο παράξενα n,p στην σύγκριση καμπυλών που έκανες ..
Με τον τύπο της δυωνυμικής για την τυπική απόκλιση variance = n*p*(1-p) .. stdev = sqrt(variance) .. έχουμε π.χ. n = 11.000 προσδοκώμενους μονούς 10.900 .. p = 10.900/11.000 = 0,99090909 .. stdev = sqrt(11.000*0,99090909*(1-0,99090909)) = 9,95444.. σωστά ?
 

Pantos

AVClub Addicted Member
29 December 2013
1,643
Tο σκριπτ κόλλησε .. είχα βάλει 20.000 επαναλήψεις και σταματησε σε κάποια φάση χωρίς να βγάλει αποτέλεσμα .. έχω 4GB μνήμη .. έτρεχα και κατι άλλα παραλληλα .. έχεις καμιά ιδέα πως να το παλέψω ?.
Με Firefox τρέχει πιο γρήγορα από άλλους browsers. Επίσης στη javascript console γράφει μήνυμα κάθε 1.000 δείγματα για να ξέρεις ότι προχωράει. Google it για το πως θα δεις τη javascript console στο browser σου. Από εκεί και πέρα δεν ξέρω. Κάνε reboot για καθαρό PC, μην τρέχεις άλλα προγράμματα ή κάνε upgrade to PC! Ή βάζε λιγότερα δείγματα.

Τι άνω όριο έχεις στην ψηλή κατηγορία ?.
Δεν έχω βάλει όριο. Για όλα τα κλιμάκια οι συναλλαγές θεωρούνται ανάλογες των εισοδημάτων, θεωρώ ότι όλες οι κατηγορίες ξοδεύουν το ίδιο ποσοστό εισοδήματος σε ηλεκτρονικές συναλλαγές. Είπαμε απλοποιημένο μοντέλο. Ίσως οι υπερπλούσιοι να πάνε στο Μιλάνο να σηκώνουν τα μαγαζιά και να κλείνουν εξάστερα ξενοδοχεία πληρώνοντας ηλεκτρονικά. Λογικότατη πάντως η ερώτηση.
Θεωρητικά πρέπει να πάρουμε τα εισοδήματα της ΑΑΔΕ, να βρούμε από ποια κατανομή εκφράζεται, και να πειράξουμε τις παραμέτρους ώστε να ταιριάζει με τον αριθμό λαχνών και το ποσοστό λαχνών ανά ζώνη.

Εχω μια ασάφεια για την κατανομή στους μονούς νικητές .. επειδή είδα και λίγο παράξενα n,p στην σύγκριση καμπυλών που έκανες ..
Με τον τύπο της δυωνυμικής για την τυπική απόκλιση variance = n*p*(1-p) .. stdev = sqrt(variance) .. έχουμε π.χ. n = 11.000 προσδοκώμενους μονούς 10.900 .. p = 10.900/11.000 = 0,99090909 .. stdev = sqrt(11.000*0,99090909*(1-0,99090909)) = 9,95444.. σωστά ?
Καμία σχέση αυτά τα n και p που λες. Απλώς είδα με το μάτι ότι η κατανομή μοιάζει με διωνυμική. Ξέροντας μέση τιμή και διασπορά, και ότι μ=n*p και σ^2=n*p(1-p) έλυσα ως προς n,p και βρήκα τις τιμές που ταιριάζουν. Δεν έχουμε αποδείξει μαθηματικά ότι ο αριθμός των μονονικητών ακολουθεί την διωνυμική κατανομη. Βλέπουμε απλώς ότι η διωνυμική κατανομή ταιριάζει και μετά βρίσκουμε τα n,p.

Υ.Γ: Γενικώς μια ιδέα για την τάξη μεγέθους μπορούμε να βγάλουμε εμείς μόνο. Αν ισχύει και αυτή με τόσες απλοποιήσεις! Το να βρεις μαθηματικά την πιθανότητα είναι αδύνατον, μόνο με εξομοίωση βγαίνει.
 

Pantos

AVClub Addicted Member
29 December 2013
1,643
Ούτε εγώ :bigcry:

Θα βγάλει άραγε η ΑΑΔΕ συγκεντρωτικά για συνολικούς διπλο, τριπλονικητές στις 12 κληρώσεις μέχρι τώρα ή το έκανε μόνο στις 10 κληρώσεις που ήταν όλες μαζί;

Ένα σχόλιο ακόμα. Μόλις είδα ότι τα νούμερα των λαχνών μου είναι ανακατεμένα, δηλαδή σε άλλους μήνες έχω υψηλά νούμερα (π.χ. λαχνούς 975.000.00), σε άλλους χαμηλά (18.000.00). Και δεν φαίνεται να υπάρχει σχέση ανάμεσα στον αν έχω πολλούς λαχνούς ένα μήνα και στο αν τα νούμερα των λαχνών μου θα είναι μικρά ή μεγάλα. Άρα ακόμα και αν η γεννήτρια τυχαίων αριθμών ευνοεί κάποια νούμερα λαχνών, είναι δύσκολο να ευνοεί κάποια συγκεκριμένα ΑΦΜ.

Και μια ερώτηση. Πολλές φορές μου βγάζει συνεχώς error στο login το gsis, μπαίνω από άλλο δίκτυο (π.χ. κινητό 4G αντί για WiFi) και τότε μπαίνει. Έχετε και εσείς τέτοιο θέμα;