WinGoldBet - Forum di pronostici di calcio e altri sport - studio e analisi su avvenimenti sportivi

Modello a partire da identificazione variabili significative

« Older   Newer »
  Share  
CAT_IMG Posted on 28/9/2012, 11:06

Junior Member

Group:
Member
Posts:
67
Location:
Porto Sant'Elpidio (FM)

Status:
OFFline


Salve a tutti,
sto cercando di costruire un modello statistico (spero affidabile). Per fare ciò,come la prassi insegna, è necessario individuare le variabili che possono essere realmente significative e magari in seguito inserire dei parametri di interferenza che possano far discostare il risultato da quello previsto in precedenza. Questo metodo non ha la pretesa di essere vincente fin da subito in quanto non ho molto tempo a mia disposizione per svilupparlo (vedete anche quanti pochi post ho scritto da quando son qui).

Come prima variabile significativa ho scelto la differenza reti generale (DR) e per non complicare troppo l'elaborazione ho preso in considerazione il campionato italiano e inglese,entrambi dalla stagione 2000/2001,per un totale di 5294 incontri.il conteggio della DR viene fatto a partire da inzio campionato e si riazzera a fine campionato.per ogni partita quindi ho calcolato la differenza delle differenze reti dei 2 team (DDR)
In seguito ho contato il numero di 1,X,2 per ogni DDR da -25 a +25. con i valori ottenuti ho effettuato una interpolazione polinomiale ottenendo i seguenti risultati:
supponendo che x sia la DDR (ovvero DR(home)-DR(away)) ottengo le seguanti probabilità di sortita dell'evento:

P(1)=1E-09x6 + 2E-08x5 - 1E-06x4 - 8E-06x3 + 0.0004x2 + 0.0088x + 0.4543 con R^2=0.8696 (molto alto)
P(X)=-1E-09x6 + 1E-09x5 + 2E-06x4 - 5E-06x3 - 0.0005x2 - 0.0003x + 0.3048 con R^2=0.4139 (basso)
P(2)= 3E-10x6 - 2E-08x5 - 3E-07x4 + 1E-05x3 + 8E-05x2 - 0.0085x + 0.241 con R^2=0.8361 (molto alto)

essendo il risultato di un'intepolazione la somma delle probabilita 1,X,2 per una stessa DDR non sarà 1 (100%).Tuttavia essendo il valore R^2 di P(X) abbastanza basso da non ritenerlo affidabile possiamo prendere per buone P(1) e P(2) e considerare P(X)=1-P(1)-P(2).
Questo è il punto dove sono arrivato.non ho ancora testato i risultati con le quote,un po' perche non ne ho voglia,un po perche a me interessa il modello,un po perche il MM va scelto considerando il metodo,cosa ancora non pronta.

In seguito studierò anche altre variabili così da avere il picchetto finale piu preciso possibile.

Spero di non avervi annoiato

Saluti
ioenopio

PS: ho provato ad analizzare anche U/O 2,5 e G/NG tramite DDR ma i risultati non sono apprezzabili (le probabilità finali sono troppo vicine ed R^2 troppo basso).Posso concludere che la variabile DR non è significativa per lo studio di queste tipologie di scommesse.

Edited by ioenopio2 - 28/9/2012, 12:28
 
Top
Rick71
CAT_IMG Posted on 28/9/2012, 11:38




ottimo ...

peccato che la mia giornata duri solo 24 ore ... :D

 
Top
CAT_IMG Posted on 28/9/2012, 11:49
Avatar

Advanced Member

Group:
Member
Posts:
2,746
Location:
roma

Status:
Anonymous


CITAZIONE (Rick71 @ 28/9/2012, 12:38) 
ottimo ...

peccato che la mia giornata duri solo 24 ore ... :D

te l'avevo detto ...manco una da 96 te basterebbe!!
:D :D :D
 
Top
CAT_IMG Posted on 28/9/2012, 11:54

Junior Member

Group:
Member
Posts:
67
Location:
Porto Sant'Elpidio (FM)

Status:
OFFline


bo alla fine sono solo moltiplicazioni e potenze...non è molto difficile o lungo da applicare con excel...
 
Top
Rick71
CAT_IMG Posted on 28/9/2012, 12:25




ibra .. lo sai come sono fatto ormai :D .. mi piacerebbe svilupparlo .. ma 96 sono ancora poche :P

---------

ioenopio2 ... il problema nn sono le formule ... ma gestire una struttura bene definita di dati e ricavare un backup da cui estrare un eventuale giudizio (prono)

ho tutto in mente .. ma per applicarlo ci vuole tempo ... :(
 
Top
CAT_IMG Posted on 28/9/2012, 12:46
Avatar

Advanced Member

Group:
Member
Posts:
1,028
Location:
cagliari

Status:
OFFline


CITAZIONE (ioenopio2 @ 28/9/2012, 12:06)
Salve a tutti,
sto cercando di costruire un modello statistico (spero affidabile). Per fare ciò,come la prassi insegna, è necessario individuare le variabili che possono essere realmente significative e magari in seguito inserire dei parametri di interferenza che possano far discostare il risultato da quello previsto in precedenza. Questo metodo non ha la pretesa di essere vincente fin da subito in quanto non ho molto tempo a mia disposizione per svilupparlo (vedete anche quanti pochi post ho scritto da quando son qui).

Come prima variabile significativa ho scelto la differenza reti generale (DR) e per non complicare troppo l'elaborazione ho preso in considerazione il campionato italiano e inglese,entrambi dalla stagione 2000/2001,per un totale di 5294 incontri.il conteggio della DR viene fatto a partire da inzio campionato e si riazzera a fine campionato.per ogni partita quindi ho calcolato la differenza delle differenze reti dei 2 team (DDR)
In seguito ho contato il numero di 1,X,2 per ogni DDR da -25 a +25. con i valori ottenuti ho effettuato una interpolazione polinomiale ottenendo i seguenti risultati:
supponendo che x sia la DDR (ovvero DR(home)-DR(away)) ottengo le seguanti probabilità di sortita dell'evento:

P(1)=1E-09x6 + 2E-08x5 - 1E-06x4 - 8E-06x3 + 0.0004x2 + 0.0088x + 0.4543 con R^2=0.8696 (molto alto)
P(X)=-1E-09x6 + 1E-09x5 + 2E-06x4 - 5E-06x3 - 0.0005x2 - 0.0003x + 0.3048 con R^2=0.4139 (basso)
P(2)= 3E-10x6 - 2E-08x5 - 3E-07x4 + 1E-05x3 + 8E-05x2 - 0.0085x + 0.241 con R^2=0.8361 (molto alto)

essendo il risultato di un'intepolazione la somma delle probabilita 1,X,2 per una stessa DDR non sarà 1 (100%).Tuttavia essendo il valore R^2 di P(X) abbastanza basso da non ritenerlo affidabile possiamo prendere per buone P(1) e P(2) e considerare P(X)=1-P(1)-P(2).
Questo è il punto dove sono arrivato.non ho ancora testato i risultati con le quote,un po' perche non ne ho voglia,un po perche a me interessa il modello,un po perche il MM va scelto considerando il metodo,cosa ancora non pronta.

In seguito studierò anche altre variabili così da avere il picchetto finale piu preciso possibile.

Spero di non avervi annoiato

Saluti
ioenopio

PS: ho provato ad analizzare anche U/O 2,5 e G/NG tramite DDR ma i risultati non sono apprezzabili (le probabilità finali sono troppo vicine ed R^2 troppo basso).Posso concludere che la variabile DR non è significativa per lo studio di queste tipologie di scommesse.

io rimango sempre a bocca aperta quando vi leggo con tutti questi calcoli....avvolte mi sembra che neanche parliamo di un pallone.... :D
 
Top
5 replies since 28/9/2012, 11:06   184 views
  Share