Födelsedagsparadoxen i verkligheten

606 visningar
uppladdat: 2016-10-10
Carl Örnberg

Carl Örnberg 18 år

Från
Svedala
Utbildning
High School : ProCivitas i Lund
Facebook
https://www.facebook.com/app_scoped_user_id/1083394455050254/
Nedanstående innehåll är skapat av Mimers Brunns besökare. Kommentera arbete

 
Projektrapport i kurs Ma1b 
ProCivitas Lund 
 
 

 
 
Projektrapport 
Klass:
?  EK15   

Elev: 
?Carl Örnberg 

Datum: 
?2016­03­17 

Medlaborant:
? Alexander Egard 

Kurs: 
?Matematik 1b
  

  
Födelsedagsparadoxen i verkligheten 
 
 
 

 
 

1.Inledning 
1.1 Teori 

Teorins grundtanke är att benämna det skenbart orimliga faktum att sannolikheten är 
större än 0,5 för att det i en grupp om 23 slumpmässigt utvalda personer finns minst 2 
personer med samma födelsedag, alltså att det sker en matchning. Antaganden till teorin är 
följande; att den 29 februari utesluts vilket leder till att året har 365 dagar (antalet möjliga 
utfall), att de 365 dagarna är lika troliga det vill säga att antalet födda en viss tidsperiod, 
exempelvis under en månad inte är större än antalet under någon annan tidsperiod och 
slutligen att födelsedagarna är självständiga vilket menas med att antalet ?k ?personer i en 
grupp, inte innehåller tvillingpar, trillingpar osv.  

1.2 Syfte 

Frågeställningen är ifall denna teori kan framställas i en annan form som i en graf eller 
diagram och om teorin kan överensstämma med verkligheten utan antagandena. Alltså om 
utfallet visar någorlunda samma resultat som kan beräknas fast än att personerna som 
kommer att undersökas må fylla år den 29 februari och att alla dagar inte är lika troliga 
samt att det kan finnas tvillingpar etc i slumpmässigt utvalda gruppen. 

1.3 Hypotes 

Om en undersökning görs enligt teorin och dennes antaganden bör den överensstämma 
med beräkningar som gjorts under rapportens tidsförlopp och bör visa till exempel att om 
gruppen består av 58 personer, kommer minst två av dem med väldigt stor  sannolikhet ( 
ca 99%) ha samma födelsedag. Huruvida utfallet förhåller sig till teorin utan att ha 
antaganden i åtanke är svårt att säga men eftersom att den 29 februari uppstår var fjärde 
år, vilket betyder att den är mindre trolig än övriga dagar, borde den faktor göra att 
felmarginalen inte bör bli stor. Likaså för de två andra antagandena. Det må finnas en risk 
att om ett tvillingpar undersöks under samma undersökning som förändrar sannolikheten 
till att genast vara 1 (om inte tvillingarna fötts under 2 olika dagar).  
 
  

 
  ?
2.   Materiel 

Penna 
Papper 
Online­kompilator för C++ kod, ?https://ideone.com/ 
Matematik Origo 1b matematisk lärobok, Dufåker Daniel med flera 
“Lecture 3: Birthday Problem, Properties of Probability | Statistics 110”, Harvard 
University, YouTube, ?https://youtu.be/LZ5Wergp_PA 
“The Birthday Problem / Paradox”,  RichardB1983, YouTube, 
https://youtu.be/QrwV6fJKBi8  

Födelsedagsparadoxen, Wikipedia, 
https://sv.wikipedia.org/wiki/F%C3%B6delsedagsparadoxen 
 
 
 

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

 

3.   Metod 

Teorin började beräknas med formlen?för sannolikheten ,
365
 
k
365 * 364 * 363... (365 - k + 1)
**
P(A)
c
 
som var komplementhändelse till  och där ?k ? var antalet personer i en grupp. P(A)P(A) 
stod för att det fanns minst två personer med samma födelsedag, alltså en matchning, och 
stod för att det inte fanns några personer med samma födelsedag, alltså ingenP(A)
c
 
matchning. Sedan, för att slippa beräkna formlen varenda gång ?k?­värdet förändrades, 
skrevs en kod i C++ som använde 2 ?for­loops? och genererade en utmatning som beräknade 
 för respektive ?k?­värde. Startvärdet för ?k ?var 1 och stoppvärdet 100. Värdet av P(A)P(A) 
var begränsad till 6 decimaler per utmatning. Koden representerade den generella formlen 
för P(A) som beräknades  och såg ut såhär:(A) (A) 1 (1)P=1-P
c
= -?
k-1
i=0
-
i
365
 
#include ?

 
int? main?(?void?)? ?{ 
double? p?;? ?//Variabel som står för komplementhändelsen P().A
c
 
long? ?int? ii?;? ?//Inkrementsvärde för den andra for loopen. 
long? ?int? k?;? ?//Värdet för antal personer beskrivs med variabeln k. 
for? ?(?k ?=? ?1?;? k ?<=? ?100?;? k?++?)? ?{ 
  p ?=? ?1?;? ?//P(A) = 1 ­  P(A^c) 
  ?for? ?(?ii ?=? ?1?;? ii ?

    p ?*?=? ?(?365.0? ?­? ii?)? ?/? ?365.0?;? ?//* Varenda gång variabeln "ii" är mindre än variabeln "k" 
kommer programmet utföra beräkningar och mata ut dem.*// 
    ?//*Här utförs även formlen för teorin via en for loop som ökar differensen och 
sannolikheten.*// 
  ?} 
  ?printf?(?"För %d personer är sannolikheten %.10f?
\n
?"?, k, ?1? ?­? p?)?;? ?//*Här betyder %.10f hur 
många decimaler utmatningen ska innehålla, för tillfället är den satt till 10 decimaler. 

return? ?0?; ?} 
Figur 8, Lösning av paradoxen med C++ programmeringskod, med kommentarer 
Denna kod sattes sedan in i en online­kompilator som kunde kompilera och exekvera koden 
och genererade en utmatning.  Utfallet där användes för att sammanställa en tabell med 
k­?värdet 1 som startvärde och ?k­?värdet 100 som stoppvärde. Värdena skrevs in i ett Google 

 
kalkyldokument för att sedan skapa en graf.  Grafen skapades genom att en kolumn för 
k­?värden och en kolumn för respektive sannolikhet skrevs in i kalkylarket. Sedan 
markerades kolumnerna och muspekaren på datorn klickade på infoga, sedan på diagram 
där en graf­layout valdes att användas. 
Sedan begärdes klasslistor från gymnasieskolan ProCivitas i Lund, på klasserna EK15 och 
NA15 som skulle vara första slumpförsöket, SA15 och NA14 som skulle vara andra 
slumpförsöket och EK14 som tredje slumpförsök, för att kunna granska och beräkna ett 
resultat. EK15 hade 35 elever, NA15 hade 23 elever, SA15 hade 33, EK14 hade 31 och NA14 
hade 16 elever. Sammanlagt ingick 138 elever i undersökningen och i första slumpförsöket 
undersöktes 58, i andra slumpförsöket 49 och i tredje undersöktes 31. Sedan anmärktes 
sannolikheten för respektive slumpförsök och anmärkte att 58 personer skulle motsvara ca 
99?%, för 49 personer  anmärktes sannolikheten att vara ca 96,57% och för 31 personer var 
sannolikheten beräknad till ca 73%. 
Varje elevs födelsemånad i varje slumpförsök noterades utifrån klasslistorna och ett 
cirkeldiagram för respektive slumpförsök framställdes i Google kalkyldokumentet. Detta 
gjordes genom att var slumpförsök hade sina egna två kolumner för varje månad och 
respektive födelsedagar i den födelsemånad. Sedan markerades vardera 
slumpförsökskolumner och muspekaren klickade på infoga, sedan på diagram där ett 
cirkeldiagram som visade antal födelsedagar per månad och andel i procent valdes.  
  
 
 
 
  

 
 ?
4.  Resultat 
        4.1 Graf
 

 

Figur 1 ­Födelsedagsparadoxens graf, av Carl Örnberg och Alexander Egard 
Figur 1 representerar sannolikheten ?P? för antalet personer ?K. P? står för sannolikheten för 
att minst två personer i antalet ?K? personer har samma födelsedag.  

 
 
 

 

  4.2 Tabeller 
Datum Antalet personer EK15 Antalet personer NA15 

30 juni 2 1 
26 januari 1 1 
 

Datum Antalet personer NA14 Antalet personer SA15 

20 maj 1 1 
 
Figur 2 och 3 ­ Tabeller för slumpförsök 1 och 2 i kronologisk ordning 

Slumpförsök Matchningar per 
datum 
Antal elever i 
EK15/SA15 
Antal elever i 
NA15/NA14 
Slumpförsök 1 
2 3 (2 den 30 juni, 1 
den 26 januari) 
2(1 den 30 juni, 1 
den 26 januari) 

Slumpförsök 2 
1 1 1 

 Matchningar per 
datum
 

EK14 
 

Slumpförsök 3
 0 0  
 
Figur 4, Sammanställd tabell över matchningar 

 
Under undersökningen av klasserna i slumpförsök 1, EK15 och NA15, hade 3 personer (2 
från EK15 och 1 från NA15) samma födelsedag den 30 juni och 2 personer (1 från EK15 och 
1 från NA15) den 26 januari. I slumpförsök 2, fanns det två personer (1 från NA14 och 1 
från SA15) som fyllde år den 20 maj. I det tredje slumpförsök fanns det inga matchningar 
mellan eleverna. 

  
 
 
 
 
 
 
 
 
 
 
 
 
 

 

4.3 Födelsedagstrender 

 
Figur 5 ­ Diagram över elevers födelsemånad slumpförsök 1 
 

 
Figur 6 ­ Diagram över elevers födelsemånad slumpförsök 2 
 
Figur 7, Diagram över elevers födelsemånad, slumpförsök 3 
  
 
 
 
 
 

 
  ?
4.4 Uträkningar 

Uträkning för den generella formel för ;(A)P 
(A) (A) 1 (1)P=1-P
c
= -?
k-1
i=0
-
i
365
 
Uträkning för när ?k ?= 58 personer; 
1­= 
  
365
58
365364363...(365 - 58+1)
***
=1- 
365
58
365364363...308
***
  1-
4,1019110
*
148
3,4189510
*
146
  
 1,08335020611 ˜ 0,916649794 ˜ 99% ˜-009 
Uträkning för när ?k? = 49 personer; 

  
365
49
365364363...(365 - 49+1)
***
=1- 
365
49
365364363...317
***
=1- 
1,2207710
*
124
3,5673910 
*
125
 1,3422039068 ˜ 0,657796093 ˜ 97%  ˜-009  
Uträkning för när ?k? = 31 personer; 
1­=1 ­ 
  
365
31
365364363...(365 - 31+1)
***
=1- 
365
31
365364363...335
***
2,4291710
*
81
2,6982310 
*
79
 1 0.269545366271 ˜ 0.730454633729 ˜ 73% ˜-  
Successionsandelen,? dvs ?andelen framgångsrika utfall/antal möjliga utfall?* för slumpförsök 
1, 2 och 3;    
  
3
2
0,66666.. ˜ 0,676, & 6, = 66= <67>66  

 
*Notera att i resultatet har vardera slumpförsök olika värden för P(A) och ovanstående 
uträkning betraktas inte som relativa frekvensen. Med andelen framgångsrika utfall menas 
att det fanns minst en matchning bland eleverna.  

5. Slutsats och diskussion 
5.1 Om teorin, resultatet och diskussion kring den relativa frekvens 

I de diagram ovan går det att intyga att av de två slumpförsök fanns sju individer som hade 
gemensamma födelsedatum med någon annan inom respektive slumpförsök. I slumpförsök 
1 fanns fem individer som delade födelsedatum med någon annan medan i slumpförsök 2 
fanns det endast två individer som delade födelsedatum. I slumpförsök 1 fanns det 58 
individer som medverkade vilket gav c.a.  99,2% chans att det fanns två individer som 
delade födelsedatum. I slumpförsök 2 fanns 49 medverkande individer, detta gav en chans 
på ungefär 96,6% att det var två individer som delade födelsedatum. I slumpförsök 3 så 
medverkade 31 individer vars sannolikhet motsvarade 73%. Det går att analysera att alla 
de tre slumpförsökens sannolikhet hade majoritet för minst en matchning. 
Relativa frekvensen kunde inte beräknas då vardera slumpförsök hade olika stor 
sannolikhet och därför kunde endast successionsandelen beräknas av att två eller fler 
individer som delade födelsedatum. Detta gjordes genom att dividera antalet framgångsrika 
utfall, dvs utfall 1 (slumpförsök 1)  och utfall 2 (slumpförsök 2) på antalet möjliga utfall, dvs 
utfall 1 till 3. Beräkningen blev således  . Men låt
3
2
0,66666.. ˜ 0,676,,6, = 66= <67 >66 
säga att slumpförsöken hade samma sannolikhet, dvs att lika många personer undersöktes i 
vardera slumpförsök (konstant värde på variabeln ?k?). Då hade det ändå behövts fler 
slumpförsök för att förfina mot ett exaktare sannolikhetsvärde (desto fler gånger man utför 
identiska slumpförsök så blir den relativa frekvensen närmre sannolikheten som kan 
beräknas). 
Fler slumpförsök inom denna tidsperiod och antalet födelsedatum hade dock varit omöjligt 
eftersom det fanns en begränsad mängd födelsedatum med på listan. Det begränsade 

 
antalet födelsedatum hade påverkat resultatet genom att samma födelsedatum hade 
använts flera gånger och därav kunde inte fler slumpförsök utföras. En återanvändning av 
eleverna i klasslistorna hade dessutom inte varit en slumpmässig undersökning. För att 
göra fler slumpförsök hade fler klasslistor med fler personer behövts.  
Att 1 adderas till  inuti parentesen (365­?k?) är eftersom att annars hade det varit en person 
för mycket som räknats med i uträkningen. Detta kan ses vid beräkning av fem personer;
) = 1 ­ . Om(minst en matchning vid 5 personer) (A) 1 (1P=1-P
c
= -?
5-1
i=0
-
i
365
365
5
365364...(365 - 5+1)
*
 
1 inte hade adderas hade det blivit  = 1­som hade givit ett inkorrekt resultat.
365
5
365364..(365-5)
*
  

5.1.1 Utveckling av teorin / andra användningsområden 

Utveckling av teorin eller andra användningsområden är att räkna ut t.ex. hur många som 
är födda i en speciell månad bland ?k? antal personer eller även räkna på hur många som är 
födda ett speciellt datum t.ex. 26:e i varje månad. En annan aspekt som kan tas med är 
toleransen av definitionen av en matchning. Alltså hur stor är chansen att det matchar om 
det sker en ökning av toleransen från 0 till 1. Alltså får exakta datumet anses matcha med ?k 
­ 1, k ?och ?k + 1?, exempelvis om ?k = ?26: mars, så tolereras matchningar med 25:e, 26:e och 
27:e mars. Sannolikheten hade stigit eftersom det hade funnits fler matchningar. Detta 
bevisar den generella formeln; 
 (A)(A)(1) ,för k21P=1-P
c
=1-?
k-1
i=0
-
3i
365
 <1 
Om vi jämför med den andre teorin där sannolikheten nådde 0,5 vid ca 23 personer så når 
denna nya teori med toleransen +­1 sannolikheten 0,5 vid 13 personer; 
    
(A)(A) ˜ 1,59667622235514 ˜ 54,3%P=1-P
c
=1-
365
13
365362359...(365-133+1)
****
=
365
13
365362359...327
***
-040 

 
Denna modifikation på teorin når sannolikheten 0,5 ungefär 77% snabbare än den teori där 
en matchning betraktas med toleransen 0 (endast ?k? ger matchning). Beräkningen blir 
således; 
 , ˜ 1,6923076923 ˜ 1,7 
13
23
77  
Kontroll: ,733,117
*
1=20 

5.2  Diskussion om trender 

Trender är något som kan vara en stor faktor av resultatet eftersom det syns en stor 
skillnad på födelsedagar i de olika månaderna. Om det finns fler som är födda under en 
speciell månad t.ex. juni som är väldigt frekvent i alla slumpförsök, ökar chanserna att man 
hittar en matchning markant då det inte finns lika många möjliga utfall i en månad jämfört 
med ett helt år. Samtidigt så minskar sannolikheten för att folk är födda i de resterande 
månader och ger en motsättning på ett av teorins antagande ­ att alla 365 dagar är lika 
troliga. 

5.3 Om Hypotesen 

Enligt hypotesen skulle det vara en väldigt stor sannolikhet att det skulle finnas två 
personer som delade födelsedatum bland 58 personer. Detta visade sig stämma då det 
fanns fem personer som hade samma födelsedatum som någon annan i test gruppen. 
Hypotesen är även att procentsatsen minskar med antalet personer, detta visades när det 
var en mindre test grupp. Den mindre test gruppen hade 73% chans för att det fanns 
matchningar men vid denna undersökning blev det inga matchningar. 

5.4 Felkällor 

Vid dessa försök finns det några olika felkällor som kan ha påverkat resultatet och lett till 
att exakta resultat inte framkommit.  Första felkällan uppstår vid beräkningen av 

 
procentsatserna då inte alla decimaler räknas med då talen är flera. Redan där har exakta 
värdet gått förlorat. Den andra felkällan som uppstår är vid avrundning av decimaltal för att 
få fram ett mer läsvänligt svar. Båda felkällorna är inte några större problem eftersom det 
är väldigt minimala summor som förändras.  

5.5 Vid ett ytterligare försök 

För att bevisa att denna teori stämmer bättre än vad som visats under denna laboration 
hade det behövts fler människor och mycket mer tid. För att få fram ett tillförlitligt resultat 
kan det behövas ungefär 23.000 människor. 23 stycken människor till varje försök och för 
att få en minskad felmarginal, göra försöket tusen gånger. Det måste vara unika människor 
för att resultaten inte ska kunna vara påverkade av något annat resultat om flera personer 
använts i olika undersökningar. 

5.6 Avslutande slutsatser
 
Så, det konstateras att födelsedagsparadoxens sannolikhet per antalet personer kan 
framställas i en graf om tillräcklig data finns. Hypotesen som framfördes i början av denna 
laboration stämde bra överens med det som i slutändan visade sig, även om sannolikheten 
för de olika slumpförsöken varierade.  
Nästa fråga är då ifall teorin kan stämma utan antagandena och svaret blir således lite 
svårare att ge. För antagandet gällande exkluderingen av den 29: e februari så finns det en 
större sannolikhet för att det överensstämmer med teorin då den 29:e februari sker vart 
fjärde år och det är en väldigt liten chans att någon fyller år på den dagen. Det hade 
dessutom gjort en minimal skillnad i det större perspektivet då dagen utgjort chans
1
3654+1
*
 
utöver de 365 resterande dagarna (antalet möjliga utfall hade varit 365+ eller ca 365
1
1461
 
+0,000684462696783). 
För antagandet om trender sågs hur liten betydelse de spelar i utfallen vilket resultatet 
fastslår. Exempelvis i slumpförsök 2 så skedde matchningen  i maj som endast utgjorde ca 

 
8,2% av de 12  födelsemånader vilket är relativt litet då största andelen i det slumpförsök 
låg på 14,3%. Differens var hela 4,1 procentenheter. Dock får man ha i åtanke att 
sannolikhet inte är något som fastslår något med 100% om inte just sannolikheten är 1, 
vilket medför att diskussionen i detta fall kan bli oändlig.  
Det som kan påverka ett resultat väldigt kraftigt är om ett tvillingpar som är födda på 
samma dag medverkar i detta experiment då detta förhållandet inte är beräknat i de 
matematiska uträkningarna. Detta kan endast bevisas i teorin under denna laboration p.g.a. 
att det saknas underlag av tvillingpar. 
Så, motsättningar må finnas i teorin i dennes verkliga form och fler slumpförsök bör utföras 
för att ge ett bättre svar på frågan. Så kanske blir slutsatsen att ställa en till hypotes för en 
framtida laboration som är mer omfattande och på denna hypotes anses resultaten i denna 
rapport vara grundpelare. De belyser tydligt det faktum att vid varierande 
sannolikhetsvärden där värdena är närmare 100% chans än 0% chans, så agerade 
majoriteten av utfallen enligt teorin, och det är något extraordinärt för den utåtstående 
individ som ej hört talas om denna paradox förut. 
 
 
 
 
 
 

 

 

 
6. Källanvisning 

Birthday Problem, Wikipedia, ?https://en.wikipedia.org/wiki/Birthday_problem? , 17/ 03 
­16 
Födelsedagsparadoxen, Wikipedia, 
https://sv.wikipedia.org/wiki/F%C3%B6delsedagsparadoxen? 14 / 03 ­16 
Ideone, ?https://ideone.com/ 
Lecture 3: Birthday Problem, Properties of Probability | Statistics 110, Harvard University , 
YouTube,,?https://youtu.be/LZ5Wergp_PA?, 16 / 03 ­16 
Lösning av Paradoxen med C++ kod, av Carl Örnberg, Ideone, ?https://ideone...

...läs fortsättningen genom att logga in dig.

Medlemskap krävs

För att komma åt allt innehåll på Mimers Brunn måste du vara medlem och inloggad.
Kontot skapar du endast via facebook.

Källor för arbetet

Saknas

Kommentera arbetet: Födelsedagsparadoxen i verkligheten

 
Tack för din kommentar! Ladda om sidan för att se den. ×
Det verkar som att du glömde skriva något ×
Du måste vara inloggad för att kunna kommentera. ×
Något verkar ha gått fel med din kommentar, försök igen! ×

Kommentarer på arbetet

Inga kommentarer än :(

Liknande arbeten

Källhänvisning

Carl Örnberg [2016-10-10]   Födelsedagsparadoxen i verkligheten
Mimers Brunn [Online]. http://mimersbrunn.se/article?id=59891 [2018-04-26]

Rapportera det här arbetet

Är det något du ogillar med arbetet? Rapportera
Vad är problemet?



Mimers Brunns personal granskar flaggade arbeten kontinuerligt för att upptäcka om något strider mot riktlinjerna för webbplatsen. Arbeten som inte följer riktlinjerna tas bort och upprepade överträdelser kan leda till att användarens konto avslutas.
Din rapportering har mottagits, tack så mycket. ×
Du måste vara inloggad för att kunna rapportera arbeten. ×
Något verkar ha gått fel med din rapportering, försök igen. ×
Det verkar som om du har glömt något att specificera ×
Du har redan rapporterat det här arbetet. Vi gör vårt bästa för att så snabbt som möjligt granska arbetet. ×

Logga in med Facebook