Come funziona veramente l'MPEG

Come funziona veramente  l'MPEG da HouseDigital  Sistemi Tecnologici

Da: HouseDigital Sistemi Tecnologici  18/07/2007
Parole chiave: Ricevitori Satellitari, Mediasetpremium, Antenne Tv Terrestre E Satellite,

-- Ciò è accettabile in questo contesto in quanto l’occhio umano è un organo tollerante, di solito in grado di riconoscere solo un errore ogni 120.000 campioni.. Per contro, l’orecchio è capace di rilevare un errore ogni 1,5 milioni di campioni. In MPEG il suono viene pertanto trattato in modo diverso.Tutti i “PEG” utilizzano di base lo stesso sistema di riduzione. Le differenze si riscontrano nel dettaglio. Il DVB-S e S2 sono incentrati sulle irregolarità del segnale. Questo viene generato in un ambiente elettronicamente pulito, poi nel percorso di trasmissione entra in un campo molto rumoroso dove ci si può attenere ogni tipo di distorsione. Il segnale deve pertanto essere preparato per affrontare questa fase. Inevitabilmente, vi saranno dunque da pagare dei piccoli sacrifici nel processo di espansione.Vale anche la pena ricordare che in questa fase il DVB-S ed il DVB-T elaborano i segnali in modo molto diverso. La “bacchetta magica” è la DCT: Discrete Cosine Transform (Trasformazione Discreta Coseno). Questo grazie all’abilità della DCT di rappresentare le informazioni visivamente più significative di un immagine utilizzando solo pochi coefficienti. Al contrario, la Discrete Fourier Transform (Trasformazione Discreta di Fourier) effettua essenzialmente gli stessi calcoli, ma creando componenti di ordine molto più elevato e quindi producendo nel complesso una compressione meno efficiente.La DCT è solo uno di un insieme di strumenti di compressione molto potenti. Si genera una struttura a blocchi, si creano 64 macroblocchi e si applica la DCT separatamente a ciascun blocco. Questo processo converte i macroblocchi dal dominio frequenza tempo in coefficienti di frequenza spaziale. Ciò riduce considerevolmente i dati. Quello che rimane tende ad abbassare i componenti di frequenza. Vengono caricati i valori DCT ottenuti, i valori RGB sono trasformati in una scala di grigi, il Blu e il Rosso vengono utilizzati per il colore e vengono risolti a banda dimezzata. Tutti i componenti residui sono prossimi allo zero e quindi vengono ritenuti insignificanti e quindi filtrati come rumore. I 64 macroblocchi sono blocchi di 8x8 pixel il cui contenuto di frequenza aumenta orizzontalmente e verticalmente. Essi contengono tutte le forme che statisticamente possono esistere. Il sistema seleziona il blocco avente la corrispondenza di coefficienti più vicina al macroblocco di video ed applica la DCT. Per ripristinare le informazioni si moltiplica ciascun blocco per il suo peso DCT ed il risultato è l’immagine originale. Possiamo ora quantizzare ogni valore DCT in un intero. Questo produce una perdita di precisione e solitamente lascia solo alcuni coefficienti diversi da zero. A questo punto si passa ad esaminare a zig zag i coefficienti quantizzati. Questo produce l’effetto di raggruppare insieme tutti i coefficienti diversi da zero. Poi si applica la codifica a livello di esecuzione. Ciò produce una sequenza di coppie di numeri. Il primo valore è il numero degli zero che precedono, il secondo è il livello o il numero diverso da zero. A questa stringa viene agevolmente applicato un encoder (codificatore) ad entropia che assegna un codice breve ai gruppi che ricorrono più di frequente ed un codice lungo ai gruppi più rari.Il risultato è un’immagine ulteriormente compressa. Altri strumenti vengono impiegati per la stima del movimento. I dati possono essere ulteriormente ridotti significativamente se il fotogramma precedente viene estratto dal fotogramma attuale. L’immagine residuale, che contiene pochi dati, è la differenza tra i due fotogrammi. Questo si ottiene solitamente elaborando campioni di luminanza 16 x 16. Essi vengono confrontati con le aree adiacenti del fotogramma precedente. La migliore corrispondenza trovata viene identificata come area di riferimento. Lo scostamento è calcolato tra il macroblocco corrente e l’area di riferimento. Si ottiene così il vettore di movimento. Si sottrae l’area di riferimento dal macroblocco corrente e si codifica il macroblocco di differenza nel quale sarà rimasta una minore quantità di dati. Tutto questo significa una compressione più efficiente. Vi sono poi altri strumenti per le elaborazioni inter-fotogramma. Solitamente l’encoder sarà impostato per lavorare su un gruppo di 12 fotogrammi. Questi sono gli I-Frame (Inter Fotogrammi). Essi vengono compressi autonomamente senza essere derivati da altri fotogrammi. Di conseguenza contengono la maggior parte dei dati.I P-Frame (Fotogrammi Predittivi) sono predetti riferendosi ad un fotogramma precedente. I B-Frame (Fotogrammi Intermedi) sono predetti riferendosi ad entrambi i fotogrammi adiacenti. E’ evidente che l’utilizzo di P e B-Frame migliora notevolmente l’efficienza della compressione in quanto essi contengono solamente le differenze tra fotogrammi. Generalmente vi sono poche differenza tra un coppia di fotogrammi televisivi, quindi gli unici dati che devono essere trasmessi sono le informazioni di differenza tra la predizione ed il fotogramma corrente.I vari documenti pubblicati da DVB, ETSI, ITU, ecc. non spiegano ai produttori come realizzare encoder e decoder. Piuttosto, forniscono linee guida ed algoritmi per il sistema MPEG. Il risultato è che sul mercato gli unici parametri certi sono ciò che entra e ciò che esce da un determinato apparecchio. In questo modo si possono riscontrare notevoli differenze nelle funzioni utente e nelle prestazioni. L’MPEG-2 fornisce solo tre livelli di definizione in ingresso:Livello Basso 360x288 (Livello VHS) Livello Principale 720x576(trasmissione) Livello Alto 1920x1152 (Utilizzato per HDTV ed applicazioni specializzate)Sono inoltre definite tre strutture per il campionamento di luminanza/crominanza: 4:4:4, 4:2:2, e 4:2:0. Nella pratica il formato utilizzato più diffusamente è 720x576 in 4:2:0, conosciuto come [email protected] Solo di recente ha assunto una certa rilevanza il 4:2:2 che viene solitamente riservato ad eventi di un certo prestigio. Dal punto di vista operativo, la maggior parte degli encoder imposta automaticamente la risoluzione passando in [email protected] In questa modalità regola la velocità del clock di ingresso per adeguarsi ai dettaglio del video in entrata. Massimizza quindi i suoi parame-tri e ne risulta una buona compressione. Si evitano così sovrascritture dei registri e le “bloccosità” che si avrebbero con un clock di ingresso troppo basso. Ho personalmente provato encoder con bassissimo bit rate di 0,5 Mb/s. Su un video normale non ho rilevato blocchi o altri arte-fatti. Vi sono però i tipici “Artefatti MPEG” in certe condizioni video con un contrasto eccessivo, ad esempio erba in primo piano. Qui il sistema produce una falsa immagine nella quale ogni filo d’erba ha esattamente la stessa struttura, angolazione e forma. Un altro esempio è l’oceano. Quando in una scena predominano le onde ad una certa distanza, l’MPEG produce un oceano con onde esattamente identiche alle proprie vicine. Infine, anche le lingue di fuoco possono produrre artefatti in determinate condizioni. Si tratta di esempi molto rari, ma che possono verificarsi se si utilizzano bit rate molto bassi. Un ulteriore strumento di compressione utilizzato su canali a basso bit rate è il Multiplexing Statistico (utilizzato anche per la creazione di bouquet). Normalmente un segnale MPEG viene dapprima generato poi miscelato per soddisfare i vincoli di modulazione e banda. Quando è in uso, si effettua una prima passata in modo che il segnale contenga tutte le tabelle e le altre informazioni. In certi casi verrà applicato il riempimento di bit per bilanciare il costo.Il Multiplexing Statistico viene poi impostato per rimuovere tutte le informazioni designate ed i bit di riempimento lasciando solo le tabelle desiderate. Ciò consente di ottenere un bit rate maggiorato all’interno di una busta fissa. Un moderno encoder di qualità supporterà il calcio, un sport universalmente considerato ad alto movimento, con il modulatore di uscita impostato a 3 MHz con FEC di 3/4 in 4:2:2. Con queste impostazioni non vi saranno blocchi, contrasti eccessivi e cali di risoluzione percettibili. Questo è quanto ho personalmente verificato su diverse partite A questo punto siamo pronti a passare all’AVC (H264) con l’S2. Esso ha anche avuto l’effetto di farci tornare indietro nel tempo. Come già detto in precedenza “è tutto nel dettaglio”.Nell’AVC viene implementata una struttura a macroblocco mobile. L’encoder deve decidere al volo quali blocchi di video sono significativi e di quali dimensioni saranno. Possono essere memorizzati contemporaneamente fino 32 blocchi. Poi, il sistema deve creare su quel blocco un’analisi DCT modificata memorizzando la risultante nel “bidone”, un nuovo deposito interattivo.Nei fotogrammi successivi queste informazioni devono essere ripristinate e rivisualizzate con il movimento modificato. Ad un certo punto devono essere inscatolate ed un nuovo macroblocco acquisito. Attualmente tutto ciò sta causando una certa apprensione a numerosi costruttori che sono stati costretti a pubblicizzare un limite di circa 6 MHz sull’uscita HD.Il nuovo AVC promette di scendere sotto 1 MHz SD e 2 MHz HD. Penso tuttavia che occorreranno alcuni anni prima di raggiungere questo obiettivo. Nel frattempo sembra non vi siano controindicazioni nell’uso dell’MPEG-2 con l’S2 che produrrebbe canali sotto 1 MHz se solo i produttori di set-top-box si adeguassero.

Parole chiave: Antenne Tv Terrestre E Satellite, Decoder Interattivi, Mediasetpremium, Ricevitori Satellitari,

Contatto HouseDigital Sistemi Tecnologici

Sito web - Non fornito

Email

Stampa questa pagina