Buscar
Estás en modo de exploración. debe iniciar sesión para usar MEMORY

   Inicia sesión para empezar

level: Level 1 of domande d'esame

Questions and Answers List

level questions: Level 1 of domande d'esame

QuestionAnswer
probabilità condizionata: dimmi tutto quello che sai- Definizione: La probabilità condizionata è la probabilità che un evento A si verifichi, dato che un altro evento B è già avvenuto. - Calcolo: P(A|B) = P(A ∩ B) / P(B) - Esempi: lancio di due dadi - Utilizzi: viene utilizzata nel teorema di Bayes - Particolarità: se A e B sono indipendenti, P(A|B) = P(B|A)
immagina di aver lanciato 3 volte una moneta non truccata. Sapendo che hai avuto almeno 2 volte testa, qual è la probabilità che sia uscito testa 3 volte?è pari alla probabilità che anche la terza volta esca testa, ovvero 1/2
immaginiamo di essere nel ambito della statistica inferenziale con un campione estratto da una popolazione descritta da un modello di poisson di parametro sconosciuto, se volessi stimare la varianza della popolazione che stimatore utilizzeresti?Utilizzerei la varianza campionaria in quanto si tratta di uno stimatore non deviato per la varianza di popolazione
Qual è il risvolto pratico, il vantaggio, di lavorare con uno stimatore che non è distorto?lo stimatore è piu preciso, in quanto il suo valore atteso coincide con il valore che si vuole stimare
se la variabile aleatoria definisse una popolazione in un problema di statistica descrittiva, qual è il primo grafico che disegneresti per ottenere altre informazioni sulla popolazione.utilizzerei un grafico a barre/bastoncini in modo da determinare il numero di osservazioni per punto di massa.
Disegna il grafico della funzione di ripartizione di una variabile aleatoria di Bernoulli indicandomi tutte le informazioni rilevanti- la funzione per il calcolo - la funzione è discontinua in due punti (0 e 1)
se ti dico che il valore atteso di una variabile aleatoria è 42, puoi dedurre che le osservazioni sono concentrate in questo valore?no, sono centrate, non concentrate.
se volessi introdurre una variabile aleatoria nel problema del lancio di una moneta, cosa dovrebbe misurare quest'ultima?il numero di lanci in cui è uscito testa a fronte di tutti quelli effettuati
Cosa sai dirmi su questa variabile aletoria? [il numero di lanci in cui è uscito testa a fronte di tutti quelli effettuati]Può essere modellata utilizzando una distribuzione di Bernoulli di parametro p, dove p vale 0.5 dato che la moneta è non truccata.
Quindi se voglio modellare 3 lanci quale modello dovrei usare, quale modello dovrei utilizzare e con quali parametri?binomiale in quanto si tratta di una serie di esperimenti bernouliani, di parametro n=3 e p=0.5
Immagina di avere un campione estratto da una popolazione binomiale, e di sapere i parametri di tale distribuzione. Dov'è ragionevole trovare la moda del campione?icino al valore atteso della distribuzione
Perchè è ragionevole aspettarsi che la media è la moda siano vicini nel caso di un modello Binomiale?Perchè il valore atteso coincide con l'asse di simmetria della distribuzione in cui è presente il valore massimo
cosa afferma la proprietà di assenza di memoria del modello esponenziale?partendo dalla funzione di ripartizione del modello esponenziale:
Supponi di avere un campione estratto da una popolazione che segue un modello esponenziale, quale stimatore utilizzeresti per stimare la deviazione standard?utilizzerei la deviazione standard campionaria per stimare la deviazione standard della popolazione
Perchè tra tutti gli stimatori mi hai proposto quello, perchè è sensato?perchè la varianza campionaria è uno stimatore non distorto per la varianza di popolazione
parlami del concetto di concentrazione... Perchè è utile normalizzare un indice?- normalizzare gli indice rende i dati confrontabili anche se sono su diverse scale - per facilità di interpretazione e visualizzazione dei dati
Che cos'è la covarianza? In che contesto abbiamo visto la covarianza, quando la usiamo?covarianza campionaria:dato un campione bivariato questa si definisce con: rappresenta una correlazione diretta o indiretta fra i dati covarianza di variabili aleatorie: è la covarianza fra variabili di una intera popolazione
cosa sai dirmi del diagramma quantile-quantile?è un grafico utilizzato per confrontare due distribuzioni per poter essere generato devono essere presi in considerazione un certo numero di quantili per ogni distribuzione(campione), i valori di questi vengono poi inseriti nel grafico e in base a quanto rispettano la bisettrice si può asserire che le distribuzioni sono simili
Diciamo di aver calcolato i quantili del campione, che differenza c'è tra due quantili campionari?un quantile è per definizione l'insieme di valori che siano maggiori di un valore e minore di un altro, due quantili differenti (a meno che i dati del campione non siano tutti uguali) saranno inevitabilmente differenti
cosa lega un quantile teorico con uno empirico?un quantile teorico si basa sul valore di una distribuzione teorica e quindi assume valori precisi un quantile campionario può approssimare il quantile teorico se i valori del campione rispettano una distribuzione
Perchè l'operazione di standardizzazione di una variabile aleatoria normale ci permette di "fregarcene" del valore della media e della varianza?ci permette di "fregarcene" del valore della media e della varianza perché la trasforma in una nuova variabile con media uguale a zero e varianza uguale a uno.
cosa misura la varianza di una variabile aleatoria?ci dice quanto i possibili valori assunti dalla v.a. tendono ad allontanarsi dalla media
quanto vale la differenza tra una varianza di una variabile aleatoria e una costante?per x si intende la X v.a. non so se questo risponde alla domanda
cosa succede alla variabile aleatoria normale se ci applichi una trasformazione lineare?considerazione 6.3.4 la nuova variabile sarà sempre gaussiana ma con i parametri modificati
cosa significa che uno stimatore è consistente in media quadratica?.
perchè è desiderabile che il valore del MSE tenda a zero?Un valore di MSE pari a zero indica che la funzione di regressione perfettamente si adatta ai dati, ossia che i valori predetti dal modello coincidono perfettamente con i valori reali.
Se X1, . . . , Xn indica il campione, cosa indica X?La popolazione
[5 febbraio1] Immaginiamo di avere un campione casuale estratto da una popolazione esponenziale: come ne stimiamo la mediana?Nel problema della stima parametrica, Θ indica il parametro ignoto (che potrebbe non essere esattamente ciò che voglio stimare): non essendo la mediana un pa- rametro della distribuzione, non posso usarlo come Θ. Supponiamo quindi che Θ = λ: per stimare il parametro, possiamo usare il reciproco della media campionaria. Infatti sappiamo stimare ’facilmente’ il valore atteso di una popolazione, ed il valore atteso di un’esponenziale è λ1 Per stimare la mediana di un’esponenziale, che abbiamo dimostrato essere uguale a ln 2 , è quindi ragionevole uti- ̄λ lizzare ln 2X come stimatore.
[5febbraio 2] data una popolazione esponenziale se ne indichiamo la mediana con m = ln (2 λ) Vogliamo stimare m, quindi τ(Θ) = m e τ(λ) = ln 2 λ La media campionaria è sempre uno stimatore consistente e non deviato per il valore atteso di una popolazione, ma ora vogliamo stimare λ (il parametro di un’esponenziale)non possiamo usare la media campionaria così com’è. Dobbiamo fare un ragionamento che coinvolga il campione: riscriviamo il fatto che il valore atteso di un’esponenziale è λ1 mettendo il campo la media campionaria (suppongo dovesse scrivere qualcosa del tipo: λ1 = E(X ̄) In conclusione, se voglio stimare λ utilizzo il reciproco della media campionaria; se voglio stimare m = ln 2 , utilizzo la λ media campionaria moltiplicata per ln 2
Abbiamo un’urna con 10 palline, di cui 4 nere e 6 bianche. Vogliamo contare il numero di palline bianche estratte. Quale distribuzione può modellare questa situazione?La distribuzione ipergeometrica è pensata proprio per situazioni di questo tipo.
data un’urna con 10 palline, di cui 4 nere e 6 bianche. Vogliamo contare il numero di palline bianche estratte. Supponiamo di reimmettere le palline una volta estratte: - Quali sono i parametri del modello binomiale risultante? - Come calcoliamo la probabilità di non estrarre alcuna pallina bianca?n è il numero di ripetizioni p è la probabilità di estrarre una pallina bianca -------------------------------------------------------------------- 2) 1 - P(estrarre pallina bianca)
Quando uno stimatore si dice non deviato?quando E(T) = τ(θ), ugualmente si può affermare ciò quando il bias è pari a 0
Indichiamo con una variabile aleatoria Y l’esito della classificazione, e condizioniamo rispetto ad altre due variabili aleatorie, X1 ed X2, che rappresentano due attributi di interesse. Su quale ipotesi si basano questi classificatori ’ingenui?’a differenza dei classificatori normali che utilizzano un solo parametro con la formula: i classificatori Naive Bayes analizzano più parametri contemporaneamente, facendo una assunzione non del tutto corretta ma che porta il tempo di computazione da n*m a n+m :
Cosa deve succedere perché due variabili aleatorie siano indipendenti?affinchè X e Y siano indipendenti deve succedere che: ∀A,B P(X ∈ A,Y ∈ B) = P(X ∈ A)P(Y ∈ B) ovvero la distribuzione congiunta di X e Y sia uguale al prodotto delle distribuzioni marginali
Quali interessanti proprietà possiamo ricavare sapendo che X ed Y sono indipendenti?- la distribuzione congiunta può essere fattorizzataP(X∈A,Y ∈B)=P(X∈A)·P(Y ∈B)di conseguenza:-- FX,Y (a,b) = FX(a) FY(b)-- pX,Y (a,b) = pX(a) pY(b)- il valore atteso del loro prodotto è uguale al prodotto dei valori attesi: E(X)E(Y)- la covarianza di due variabili indipendenti è pari a 0: Cov(X, Y ) = E(XY ) − E(X)E(Y )- la varianza della somma è uguale alla somma delle varianze
Cosa vuol dire che la media campionaria gode della proprietà di linearità?che la media di una trasformazione lineare equivale alla trasformazione applicata sulla stessa media media(a*X) = a*media(X) così anche per le altre trasformaizoni
È sempre vero che la varianza di una somma è uguale alla somma della varianza?la varianza di due variabili aleatorie può essere riscritta come sommatoria delle singole varianze solo se le variabili sono indipendenti
Quale teorema possiamo applicare per approssimare la distribuzione della media campionaria???? Per n che tende a +∞, la distribuzione espressa dal teorema del limite centrale non è più approssimata ma esatta.
quale è una possibile applicazione degli indici di eterogeneità?Negli alberi di decisione, la domanda più corretta da fare è quella che suddivide in parti uguali gli elementi, quindi una domanda che se applicata su un campione ha G' = 0.5
La variabile aleatoria Z è data dalla differenza tra due normali standard, X ed Y . Cosa possiamo dire del valore atteso di Z?grazie alla proprietà di riproducibilità che accomuna Gaussiane, Poissoniane e Binomiali: "sommando v.a. che hanno una distribuzione comune, si ottiene ancora una v.a. con lo stesso modello". oppure grazie al Teorema Centrale del Limite si può desumere la stessa cosa (approssimazione con una Normale)
In quale caso possiamo scrivere la funzione di massa congiunta come prodotto delle marginali?nel caso le variabili siano indipendenti