Turbocodici, decodifica SISO, informazione estrinseca. LDPC e decodifica iterativa

Prev Sezione 17.4: Codifica di canale Su Capitolo 17: Capacità e codifica di canale Capitolo 18: Caratterizzazione circuitale, rumore ed equalizzazione dati Next

17.5 Verso il limite di Shannon

I codici a blocco e convoluzionali (e loro combinazioni) esaminati nella precedente sezione sono utilizzati in innumerevoli sistemi [982] [982] In particolare sono stati adottati nell’ambito della telefonia gsm, gprs, edge, e 3g e 3gpp, della diffusione televisiva dvb-s e dvb-t, del wifi (802.11a-g) e delle missioni spaziali, per non parlare dei supporti di memorizzazione come cd audio, dvd, unità raid. Per una narrazione di questa evoluzione, oltre che degli argomenti che stiamo trattando, si veda http://www.crit.rai.it/eletel/LeMiniSerie/MS1.pdf anche grazie ai progressi avvenuti nel frattempo dal punto di vista delle capacità di calcolo e memorizzazione, arrivando a conseguire prestazioni che si discostano di circa 3 dB da quelle limite previste dalla teoria di Shannon (§ 17.3.2). Sembrava che non si riuscisse a fare di meglio, quando nei primi anni ’90 sono stati definiti i turbo-codici [983] [983] Vedi ad es. https://en.wikipedia.org/wiki/Turbo_code (Berrou, Glavieux), e poco dopo rivalutati i codici ldpc [984] [984] Vedi ad es. https://en.wikipedia.org/wiki/Low-density_parity-check_code, inizialmente proposti nel ’62 da Gallager. Mentre il primo metodo prende le mosse da un nuovo modo di applicare la codifica convoluzionale, il secondo è un codice lineare a blocchi non sistematico, con n molto grande (decine di migliaia). In entrambi i casi è determinante l’adozione di una decodifica soffice, a cui si affianca la novità dell’adozione di un algoritmo iterativo, in modo da arrivare per gradi alla decodifica del messaggio. Il risultato è che (sempre grazie all’evoluzione della tecnologia) si è riusciti ad approssimare ancor più da vicino il limite dei − 1.6 dB per ^E_b⁄_N₀ (§ 17.3.4) rispetto al quale mancano solo da 0.7 a 0.5 dB per le due tecniche, determinando la loro adozione da parte dei sistemi più recenti [985] [985] Come ad esempio dvb-2, telefonia umts ed lte, 10gbase-t Ethernet, wifi 802.11n e ab, WiMAX 802.16, nonché le missioni spaziali più recenti.. Vediamo dunque di che si tratta.

17.5.1 Codifica turbo

L’aggettivo turbo deve la sua origine al funzionamento iterativo dell’algoritmo di decodifica, che fa uso dei risultati parziali ottenuti al passo precedente [986] [986] Evidenziamo tra breve la presenza di un vero e proprio percorso di retroazione, ma l’aggettivo turbo è nato in analogia a quanto avviene in campo automobilistico con i motori turbo, una novità tecnica introdotta negli stessi anni in cui è stato definito questo metodo di decodifica..

Codifica

La versione di turbo codice più studiata è il codice convoluzionale concatenato parallelo (pccc) che consiste nel codificatore sistematico mostrato in figura, in cui

Codificatore turbo parallelo

due CC ricorrenti (rsc [987] [987] L’acronimo sta per Recursive Sistematic Convolutional, ed al § 17.4.2.4 ne è raffigurato un possibile schema architetturale. Il motivo di questa scelta è triplice: da un lato un rsc è simile ad uno scrambler pseudo random, e la teoria di Shannon basa la sua dimostrazione (vedi nota 934 a pag. 17.3) su codeword casuali; inoltre, un rsc ha prestazioni migliori dei CC classici per bassi valori di ^E_b⁄_N₀. Infine, solo poche sequenze di lunghezza finita in ingresso ne producono di lunghezza finita in uscita, indice di una elevata ridondanza.) uguali [988] [988] In realtà possono anche essere diversi e con un diverso tasso R_c, ma non si desidera appesantire la trattazione. elaborano il medesimo bitstream m di ingresso producendo i bit di protezione c₁ e c₂, tranne che il secondo encoder riceve una copia rimescolata da parte dell’interleaver, la cui definizione [989] [989] Ad esempio, l’interleaver può essere implementato mediante una sequenza di numeri pseudo casuali da utilizzare ciclicamente come indice di scrittura in un array dove si memorizzano gli elementi della sequenza di ingresso, e la cui lettura avviene poi in modo sequenziale. è fondamentale per la riuscita di un turbo codice: grazie ad esso infatti gli ingressi ai due rami divengono istante per istante incorrelati, così come le rispettive uscite.

La fase di codifica suddivide il bitstream di ingresso m in segmenti di dimensione k uguale a quella dell’interleaver, ed applica la tecnica del tail biting (§ 17.4.2.2) in modo da ottenere per ogni ramo una sequenza c = (c₁, ⋯, c_k) di k bit di protezione del segmento. Alla fine viene quindi trasmessa una parola x = (m, c₁, c₂) di n = 3k bit ottenendo un tasso complessivo R_c = ¹⁄₃, eventualmente aumentato mediante una successiva operazione di perforazione.

Trasmissione e decodifica soft

La figura sotto ha il duplice scopo di riepilogare la

notazione adottata e di evidenziare la presenza di un canale soffice che, pur includendo codifica di linea, modem e canale awgn (§ 17.3), non prevede la presenza di un decisore, e dunque fornisce al decodificatore la sequenza y di valori analogici (soft) necessaria per la decodifica turbo, con elementi y_j = x_j + ε in cui ε è una v.a. gaussiana a media nulla, varianza σ² e valori indipendenti. Il processo di decodifica è anch’esso di tipo soft e per questo detto siso, ed il suo esito viene espresso come un valore di verosimiglianza logaritmica a posteriori L^p per ognuno dei k bit m_i del messaggio informativo, in modo da poter applicare un criterio di massima prob. a posteriori o map (§ 17.1.2) ossia decidere che m̂_j = 1 o 0 a seconda se L^p(m_j) ≷ 0.

Verosimiglianza logaritmica ed informazione estrinseca

Finché non si attua la decodifica, l’osservazione del valore y_j in uscita dal canale permette il calcolo della verosimiglianza logaritmica a posteriori (nel seguito llr ossia log likelihood ratio) per ciascun bit x_j in ingresso al canale soffice come

(21.119)
L(x_j) = ln Pr(x_j = 1 ⁄ y_j)Pr(x_j = 0 ⁄ y_j) = ln Pr(y_j ⁄ x_j = 1)Pr(x_j = 1)Pr(y_j ⁄ x_j = 0)Pr(x_j = 0) = ln Pr(y_j ⁄ x_j = 1)Pr(y_j ⁄ x_j = 0) + ln Pr(x_j = 1)Pr(x_j = 0) = L^c(y_j) + L^a(x_j)

in cui alla seconda eguaglianza si applica il teorema di Bayes, ed il risultato si interpreta osservando che L(x_j) è somma di due termini: il primo L^c(y_j) è dovuto al canale e dipende solo dal valore y_j ricevuto, mentre il secondo L^a(x_j) è legato alla prob a priori di x_j ed è nullo se 0 ed 1 sono equiprobabili.

A differenza della (21.119), il valore L^p(x_j) = ln Pr(x_j = 1 ⁄ y)Pr(x_j = 0 ⁄ y) della llr a posteriori in uscita dal decoder è ottenuto a partire da tutti i bit ricevuti y, compresi quelli di ridondanza c₁ e c₂, e per questo la decisione map presa in base ai valori di L^p(x_j) contiene meno errori. La variazione della llr L^p(x_j) rispetto alla (21.119) vale

(21.120)
L^e(x_j) = L^p(x_j) − L(x_j) = L^p(x_j) − L^c(y_j) − L^a(x_j)

e prende il nome di informazione estrinseca [990] [990] Questo è il nome attribuito a tale quantità dalla comunità che ha lavorato alla definizione dei turbocodici. In effetti, essendo la llr un logaritmo di probabilità può a tutto diritto essere chiamata informazione, ma espressa in nat anziché in bit, avendo adottato un logaritmo in base e. in quanto aggiunta da parte del decoder; si può dimostrare che questa non dipende dai valori di m, ma solo da quelli della ridondanza c₁ e c₂.

Soft input soft output a quattro porte

L’algoritmo siso adottato nella decodifica turbo può essere schematizzato come nella figura a fianco, che lo mostra accettare in ingresso le componenti della llr (21.119) ovvero i contributi delle singole osservazioni L^c(y_j) e quelli a priori L^a(x_j), e ottenere in uscita sia il valore di llr a posteriori L^p(x_j) (ottenuta applicando il metodo di decodifica) sia quello della informazione estrinseca ottenuta applicando la (21.120).

Valutazione della llr di ingresso e di uscita al siso

Consideriamo di effettuare una trasmissione binaria antipodale, in cui i valori del segnale agli istanti di simbolo sono espressi come x_j = (2m_j − 1) ossia assumono i valori ±1 quando m_i = 1 oppure 0, e lo stesso dicasi per i bit di protezione c_1j e c_2j: in tal caso il termine L^c(y_j) = ln Pr(y_j ⁄ x_j = 1)Pr(y_j ⁄ x_j = 0) (eq. (21.119)) assume il valore [991] [991] Infatti ora y_i è una v.a. gaussiana con media x_i = ±1 e varianza σ², e dunque

ln Pr(y ⁄ x = 1)Pr(y ⁄ x = 0) = ln 1√2πσexp( − (y − 1)²2σ²)1√2πσexp( − (y + 1)²2σ²) = − (y − 1)²2σ² + (y + 1)²2σ² = − y² + 2y − 1 + y² + 2y + 12σ² = 4y2σ² = 2σ²y

(21.121) L^c(y_j) = 2σ²y_j

Per quanto riguarda invece L^p(x_i) = ln Pr(x_j = 1 ⁄ y)Pr(x_j = 0 ⁄ y) diciamo che nel contesto dei codici rsc usati nel caso in esame il relativo decodificatore opera su di un traliccio analogo a quello visto nella decodifica di Viterbi, ed il valore L^p(x_j) può essere approssimato ricorrendo ad una decodifica sova (§ 17.4.2.7) [992] [992] Per poter utilizzare anche le prob. a priori in sova occorre che nella (21.112) venga sommato anche un termine ln (p(x_j))., ma per ottenere il suo valore esatto (e dunque le migliori prestazioni) occorre ricorrere ad una modifica dell’algoritmo BCJR [993] [993] L. Bahl; J. Cocke; F. Jelinek; J. Raviv, Optimal decoding of linear codes for minimizing symbol error rate, in IEEE Trans. on Inf. Theory, March 1974, per come modificato in C Berrou, A Glavieux, Near optimum error correcting coding and decoding: Turbo-codes, IEEE Trans. on Comm., Oct. 1996.

In parole povere, il traliccio è esaminato oltre che da sinistra a destra, anche da destra a sinistra, permettendo il calcolo per ogni istante i della probabilità congiunta di trovarsi in uno stato, e che sia stato trasmesso un valore x_i, da cui saturando sugli stati ottenere i valori Pr(x_i = 1 ⁄ y) e Pr(x_i = 0) ⁄ y). Tale procedura fu poi adottata nel contesto della stima di parametro dei modelli di Markov nascosti (hmm) utilizzati per il riconoscimento del parlato, ma quella è un'altra storia.

, le cui problematiche numeriche spingono però ad utilizzare metodi sub-ottimi e che operano direttamente nel dominio logaritmico [994] [994] Vedi ad es. P. Robertson; E. Villebrun; P. Hoeher, A comparison of optimal and sub-optimal MAP decoding algorithms operating in the log domain, Proc. IEEE ICC ’95.

Decodifica

Siamo finalmente in grado di illustrare l’operatività della tecnica, con l’aiuto di fig. 17.34, in cui (come nel seguito) si adotta la notazione L(m) per indicare tutti i valori L(m_j) per j = 1, 2, ⋯, k:

Figure 17.34 Schema di decodifica turbo per un codificatore rsc parallelo

una prima decodifica siso₁ considera nulla la verosimiglianza a priori ovvero L^a(m) = 0 (switch a massa), e in base a L_c in uscita dal canale, relativa ai bit di m e di c₁ (prodotti dal primo rsc di codifica) ottiene la verosimiglianza a posteriori L^p₁( m) e da questa l’informazione estrinseca L^e₁( m) = L^p₁ − L^c che dipende solo dai valori di c₁;
il blocco siso₂ adotta L^e₁( m) come valore della llr a priori L^a₂( m) per i bit di messaggio m, dopo che l’interleaver ne ha posto i valori nello stesso ordine con cui si sono presentati a rsc₂. Dato che L^e₁ dipende dai valori di c₁ a cui siso₂ non ha accesso, rappresenta effettivamente qualcosa in più. Siso₂ esegue l’algoritmo di decodifica ottenendo L^p₂( m) a partire da L^c(m), L^c(c₂) e L^a₂( m), e valuta L^e₂ = L^p₂ − L^c − L^a₂, che dipende solamente da c₂;
dopo essere stata di nuovo riordinata temporalmente, l’informazione L^e₂( m) viene fornita al blocco siso₁ sull’ingresso a priori L^a₁( m), in quanto anch’essa rappresenta qualcosa che siso₁ non può calcolare per suo conto. Ecco così attuato il principio di controreazione! Ciò consente di ottenere dei nuovi valori per L^p₁ e L^e₁ = L^p₁ − L^c − L^a₁;
se i valori di L^p₁ e L^p₂ sono abbastanza simili per tutti gli indici j = 1, 2, ⋯, k i due rami sono collaborativamente addivenuti alla stessa conclusione, e la decodifica finale per tutti gli m̂_j si ottiene dall’uscita L^p di uno dei due siso valutando se L^p≷0; altrimenti, si torna al passo 2. La tecnica descritta si è mostrata capace di convergere nel giro di una decina di iterazioni.

Utilizzi

I turbo codici sono utilizzati, oltre che nei sistemi UMTS ed LTE, dagli standard DVB-RCS, WiMax, e da missioni spaziali. Il principio della codifica turbo si applica non solo al caso accennato degli rsc paralleli, ma può essere adottato anche per schemi seriali, e per codici prodotto. Il blocco di codifica interno può altresì essere sostituito da un modulatore-demodulatore con memoria, come ad es. il tcm (pag. 1). In base alla stessa logica anche l’equalizzazione mlsd di un canale con memoria (§ 18.4.5) può beneficiare di uno schema turbo, in cui equalizzatore e decodificatore si scambiano iterativamente informazione estrinseca per addivenire ad una decisione condivisa [995] [995] Vedi ad es. https://en.wikipedia.org/wiki/Turbo_equalizer.

17.5.2 Codifica a bassa densità di controllo parità

Questo approccio si basa su di un codice lineare a blocchi caratterizzato da una una matrice di controllo H con una bassa densità di uni, da cui I’acronimo LDPC (low-density parity-check).

Riprendendo i concetti espressi al § 17.4.1, la moltiplicazione con somma modulo due ⊕ (pag. 1) x = m ⋅ G tra il vettore riga m dei k bit di messaggio e la matrice binaria G (detta generatrice) con k righe ed n colonne produce una codeword x di n elementi. Se G è posta nella forma G = [I_k|P ] con I_k matrice identità con k righe e colonne e P matrice di parità di k righe per n − k colonne, il codice è detto sistematico e le codeword possono esser scritte come x = [ m₁ ⋯ m_k c₁ ⋯ c_n − k ] in cui [996] [996] Si adotta il simbolo ∑^k_i = 1_⊕ per intendere una somma modulo due. c_j = ∑^k_i = 1_⊕ m_ip_ij valuta la parità sui bit m_i per i quali p_ij = 1.

Un codice ldpc non è definito a partire da G bensì dalla matrice H di controllo di dimensione (n − k) × n e che nel caso sistematico ha la forma [997] [997] Ci si discosta dalla notazione adottata a pag. 1 in quanto la H definita qui è la trasposta di quella definita in tale sede. H = [P^T|I_n − k ], ed in generale soddisfa la condizione (valida anche per un codice non sistematico)

G ⋅ H^T = 0_{k × (n − k)}

in quanto ciascuna riga di H è ortogonale [998] [998] Vedi ad es. S.Lin, D.J.Costello, Error control coding, Prentice-Hall 1983 ad ogni riga di G; pertanto risulta [999] [999] Infatti H ⋅ x^T = H ⋅ (m ⋅ G)^T = H ⋅ G^T ⋅ m^T = (G ⋅ H^T)^T ⋅ m^T = 0_{(n − k) × k} ⋅ m^T = 0^T_n − k H ⋅ x^T = 0^T_n − k se e solo se x è una codeword; mentre in presenza di errori il vettore ricevuto è y ≠ x, e se il codice è sistematico il prodotto H ⋅ y^T ≠ 0 è detto sindrome e viene usato per individuare i bit errati.

Precisiamo ora che le codeword x di un codice ldpc non fanno distinzione tra bit di messaggio m e di parità c, e sebbene il codice possa essere di tipo sistematico, è di gran lunga preferibile che non lo sia, per i motivi presto illustrati; questo fa si che la decodifica basata sulla sindrome non sia applicabile. Un modo per descrivere il funzionamento di un ldpc è pensare che ogni riga i di H rappresenti il vincolo imposto sulle codeword da una tra n − k equazioni di parità del tipo

∑ⁿ_j = 1_⊕x_jh_ij = 0

equivalente riga per riga dell’espressione H ⋅ x^T = 0.

Esempio La matrice di controllo H riportata sotto corrisponde alle quattro equazioni di vincolo scritte a fianco, che devono essere soddisfatte dai bit x_j delle codeword esenti da errore. Il codice risultante è descritto dai parametri n, k = 8, 4 e da un tasso R_c = ¹⁄₂.

H = ⎡⎢⎢⎣ 0 1 0 1 1 0 0 1 1 1 1 0 0 1 0 0 0 0 1 0 0 1 1 1 1 0 0 1 1 0 1 0 ⎤⎥⎥⎦

⎧⎪⎪⎨⎪⎪⎩ x₂ ⊕ x₄ ⊕ x₅ ⊕ x₈ = 0 x₁ ⊕ x₂ ⊕ x₃ ⊕ x₆ = 0 x₃ ⊕ x₆ ⊕ x₇ ⊕ x₈ = 0 x₁ ⊕ x₄ ⊕ x₅ ⊕ x₇ = 0

A parte il piccolo dettaglio di come poter effettuare la codifica [1000] [1000] In linea di principio per trovare una matrice generatrice G_k × n tale che G ⋅ H^T = 0 si può procedere trasformando prima H nella forma canonica di un codice sistematico, modificandone le righe applicando il metodo di Gauss; ciò determina però una G per nulla sparsa, ed una eccessiva complessità di codifica per n elevato. Fortunatamente hanno escogitato metodi più efficienti, anche ricorrendo a codici ldpc non regolari; per un approfondimento si può vedere W.E.Rayan, An introduction to ldpc code, Univ. of Arizona 2003, ed es. presso http://tuk88.free.fr/LDPC/ldpcchap.pdf. x = m ⋅ G, per la matrice dell’esempio possiamo osservare che ogni bit x_i compare in due equazioni, ed ogni equazione si applica a quattro bit. In generale un codice ldpc si dice regolare se presenta esattamente w_c ≪ n − k elementi pari ad uno per ogni colonna, e w_r = w_cnn − k uni per ogni riga, a cui corrisponde un tasso R_c = ^k⁄_n = 1 − ^w_c⁄_{w_r}.

Grafo di Tanner

E’ il nome dato al grafo di cui H è la matrice di adiacenza, e che risulta essere tipo bipartito ovvero i cui vertici si dividono in due insiemi, tra gli elementi dei quali non sono presenti archi. Si traccia (fig. 17.35) riportando sotto i nodi (detti variabile) associati agli n bit ricevuti [1001] [1001] La nomenclatura adottata in letteratura indica i nodi-variabile come v-nodes e li rappresenta con la lettera c, mentre quelli di controllo (check-nodes o nodi-fattore) sono rappresentati dalla lettera f. Preferisco qui attenermi alla notazione dell’attuale contesto espositivo. x_j, e sopra quelli (di controllo) c_i che verificano il rispetto delle equazioni di vincolo; tra questi nodi si traccia un arco tra

Figure 17.35 Grafo di Tanner per la matrice dell’esempio precedente

x_j e c_i se è presente un uno tra la riga i e la colonna j di H, ovvero se h_ij = 1.

In altre parole, i w_c uni nelle n colonne rappresentano le connessioni dei nodi x_j (ed infatti ne troviamo due) mentre i w_r uni sulle n − k righe indicano le connessioni dei nodi c_i (e ne troviamo quattro per ciascuno).

17.5.2.1 Decodifica iterativa

La particolarità più rilevante di un ldpc è quella di svolgere la decodifica in modo iterativo basandosi su di un ripetuto scambio di messaggi di natura probabilistica tra nodi-variabile e nodi di controllo, realizzando una applicazione di propagazione della credenza [1002] [1002] Dall’inglese belief propagation, vedi ad es. https://en.wikipedia.org/wiki/Belief_propagation nota anche come algoritmo somma-prodotto. Lo scopo dell’algoritmo è individuare la codeword x̂ = argmax_xp(x ⁄ y) che rende massima la prob. a posteriori (pap) una volta noto il vettore y in uscita dal canale. La ricerca è condotta attraverso un raffinamento successivo di ipotesi, a partire dalla conoscenza dei valori y_j indipendenti che fornisce una p(x ⁄ y) = ∏ⁿ_j = 1p(x_j ⁄ y_j) di partenza.

Ad ogni iterazione ciascun nodo-variabile j invia a tutti i w_c nodi di controllo i(u), u = 1, ⋯, w_c a cui è connesso un messaggio q_ji (pensiamo stia per query) in cui comunica la sua percezione della probabilità p_j di essere pari ad uno. Ricevuti i messaggi q_ji, ogni nodo di controllo c_i invia a ciascun nodo variabile j(u), u = 1, ⋯, w_r a cui è connesso un messaggio r_ji in cui risponde con nuove stime di p_j ottenute combinando le opinioni q_ji ricevute da tutti i nodi tranne quello a cui è diretta la risposta. A questo punto i nodi-variabile generano nuovi messaggi q_ji integrando la propria opinione di partenza con quella r_ji ricevuta dai nodi di controllo, omettendo di includere l’informazione ricevuta da quello verso cui è diretto il messaggio. Il senso di omettere l’informazione proveniente dal destinatario è quello di attingere unicamente all’informazione estrinseca, ossia non ricavabile autonomamente a destinazione, come avviene per i codici turbo.

L’opinione di partenza sulla pap p_j che il bit x_j sia pari ad 1 è ottenuta (per ogni istante j = 1, ⋯, n) a partire dal valore y_j in uscita dal canale come [1003] [1003] Applicando il solito teorema di Bayes, ed omettendo il pedice j per estetica e spazio.

p_j = p(x = 1 ⁄ y) = p(y ⁄ x = 1)p(x = 1)p(y) = K ⋅ p(y ⁄ x = 1)

in cui K = p(x = 1)p(y) = 1p(y ⁄ x = 1) + p(y ⁄ x = 0) [1004] [1004] Questo perché p(x = 1) è la prob. a priori considerata pari a ¹⁄₂, e quindi p(x = 1)p(y) = p(x = 0)p(y). Imponendo ora p(x = 1 ⁄ y) + p(x = 0 ⁄ y) = 1 si ottiene (p(y ⁄ 1) + p(y ⁄ 1))K = 1, e dunque il risultato.. A seconda se in presenza di un bsc (§ 17.1.1) oppure di un canale soffice (o awgn, pag. 1)

bsc: il canale compie una decisione hard ed emette un valore y pari a zero od uno, con prob. condizionata in avanti p(y ⁄ x) di valore p(1 ⁄ 1) = p(0 ⁄ 0) = 1 − p_e, p(0 ⁄ 1) = p(1 ⁄ 0) = p_e. Dunque K = 1 [1005] [1005] In quanto p(1 ⁄ 1) + p(1 ⁄ 0) = 1 − p_e + p_e = 1 sia per y = 1 che per y = 0, e p(x = 1 ⁄ y) = p_e se y = 0 oppure 1 − p_e quando y = 1 ;
awgn: in funzione del valore binario di x ∈ {0, 1} il canale emette il valore continuo y = 2x − 1 + ε che è una v.a. gaussiana a valori indipendenti, media ±1 a seconda se x = 1 o 0, e varianza σ²; si ha quindi p(y ⁄ x) = 1√2πσexp⎧⎩− (y±1)²2σ²⎫⎭.

In entrambi i casi, ogni nodo variabile j pone il messaggio iniziale q_ji = p_j uguale per tutti gli i.

Calcolo ai nodi di controllo

Consideriamo ora un nodo c_i che riceve più di un q_ji, e che sa che tra i nodi-variabile a lui collegati ci deve essere un numero pari di uni. Per ottenere il valore del messaggio r_ji da inviare indietro, c_i somma le stime di probabilità ricevute.

Esempio Il nodo c₁ dell’esempio di fig. 17.35 deve far valere il vincolo x₂ ⊕ x₄ ⊕ x₅ ⊕ x₈ = 0 ovvero nei quattro bit ci devono essere 4 uni, oppure due, oppure nessuno. Genera quindi il messaggio r₂₁ diretto a x₂ tenendo conto delle probabilità q_j1 ricevute da x₄, x₅ e x₆ e, considerandole statisticamente indipendenti, stima

r₂₁ = p̂₂ = q₄₁(1 − q₅₁)(1 − q₆₁) + (1-q₄₁)q₅₁(1 − q₆₁) + (1-q₄₁)(1-q₅₁)q₆₁ + q₄₁q₅₁q₆₁

ossia pari a quella che ci sia un altro uno, oppure tre. Calcola quindi in modo analogo i messaggi r₄₁ , r₅₁ e r₆₁ omettendo ogni volta di considerare l’informazione originata dal nodo destinazione.

Calcolo ai nodi-variabile

A questo punto ogni nodo-variabile j ha ricevuto w_c messaggi r_ji, da cui ne calcola altrettanti da rispedire indietro, considerando oltre all’informazione p⁽⁰⁾_j proveniente dal canale anche quella r_ji proveniente dai nodi c_i, tranne quello di destinazione. Questa volta il calcolo di q_ji comporta il prodotto dei valori di probabilità ricevuti.

Esempio Il nodo x₁ ha ricevuto r₁₂ e r₁₄, e valuta q₁₂ = p⁽¹⁾₁ = k₂p⁽⁰⁾₁r₁₄ da inviare a c₂ in cui [1006] [1006] Il risultato si ottiene imponendo che la stessa normalizzazione valga anche per l’evento complementare, ovvero 1 − q₂₁ = k₂(1 − p⁽⁰⁾₁)(1 − r₁₄), ma dall’equazione sopra abbiamo anche 1 − q₂₁ = 1 − k₂p⁽⁰⁾₁r₁₄, ed eguagliando le due espressioni si consegue lo scopo. k₂ = 1(1 − p⁽⁰⁾₁)(1 − r₁₄) + p⁽⁰⁾₁r₁₄ serve per normalizzare la stima, dato che se k₂ non fosse presente p⁽¹⁾₂ risulterebbe più piccolo di tutti i valori ricevuti. In modo simile, il nodo x₁ calcola poi q₁₄ da inviare a c₄ omettendo di usare r₁₄.

Arresto

Ad ogni ciclo v = 1, 2, ⋯ si perviene ad una stima di probabilità p̂^(v)_j che ogni bit x_j sia pari ad uno utilizzando tutte le fonti informative [1007] [1007] Infatti questa stima non deve essere re-inviata a nessuno, per cui nel caso dell’esempio il nodo x₁ calcola p̃^(υ)₁ = k₂p⁽⁰⁾₁r₁₂r₁₄ con k₂ = 1(1 − p⁽⁰⁾₁)(1 − r₁₂)(1 − r₁₄) + p^(υ)₁r₁₂r₁₄., e da questa si ottiene una ipotesi di codeword x̃ operando per ogni bit una decisione hard mediante una soglia di probabilità pari a ¹⁄₂. Se x̃ soddisfa la condizione H ⋅ x̃^T = 0 allora è una codeword ammissibile, e la decodifica è terminata: in figura si mostra l’andamento

del numero di errori sul bit e del peso della sindrome al progredire delle iterazioni. Se invece anche dopo un loro ragionevole numero [1008] [1008] Tipicamente, tra dieci e trenta. Una simpatica animazione dell’evoluzione della decodifica può essere trovata presso http://www.inference.org.uk/mackay/codes/gifs/demo2.html sia per il caso bsc che awgn. la condizione non è mai verificata, significa che una eccessiva quantità di errori impedisce la decodifica corretta, e tale evenienza può essere segnalata agli stadi di elaborazione seguenti (particolare che non avviene per la decodifica turbo).

17.5.2.2 Attenti a quel ciclo

Il calcolo svolto sia dai nodi di controllo che da quelli -variabile implica che gli eventi a cui si riferiscono i messaggi ricevuti siano statisticamente indipendenti. Ma se il grafo associato alla matrice H presenta cicli di lunghezza ν, dopo l’iterazione numero ^ν⁄₂ l’ipotesi perde di validità, in quanto le stime di probabilità divengono dipendenti anche da quelle inviate dal nodo che le riceve.

In figura si evidenziano due cicli di lunghezza 4 presenti nel grafo di fig. 17.35, associati a quattro uni disposti agli angoli di una sottomatrice rettangolare di H. In fase di progetto della matrice di controllo tale circostanza va evitata, e dato che non è possibile non avere cicli, è bene vincolarne il numero e la lunghezza minima ad valore ritenuto adeguato a non degradare le prestazioni.

17.5.2.3 Implementazione Min-Sum

Il metodo esposto al § 17.5.2.1 comporta difficoltà legate a dover moltiplicare molti valori di probabilità, determinando instabilità numerica per dimensioni n anche di decine di migliaia. Si preferisce allora lavorare nel dominio della verosimiglianza logaritmica (llr), con un algoritmo del tutto simile a quello esposto, ma con alcune particolarità. Iniziamo con il definire la llr della pap di un bit x_j in perfetta analogia con la (21.119), ovvero

L(x_j ⁄ y_j) = L^c(y_j) + L(x_j)

La decodifica iterativa ha ora l’obiettivo di aumentare il modulo dalla llr a priori L(x_j) = ln p(x_j = 1)p(x_j = 0), inizialmente nullo, grazie all’apporto dell’informazione estrinseca proveniente dagli altri nodi.

Per quanto riguarda il contributo del canale L^c(y_j) = ln p(y_j ⁄ x_j = 1)p(y_j ⁄ x_j = 0)

nel caso awgn con mapping y = 2x − 1 + ε, in cui x ∈ {0, 1} e ε ∈ N(0, σ), si ha (vedi eq. (21.121)) L^c(y_j) = 2σ² y _j;
nel caso bsc con P_e = p risulta L^c(y_j) = ln 1 − pp se y_j = 1 ed L^c(y_j) = ln p1 − p quando y_j = 0.

In entrambi i casi si usa L^c(y_j) per inizializzare i messaggi verso i nodi di controllo, che ora non valgono più q_ji ma L(q_ji) = ln Pr{x_j = 1}1 − Pr{x_j = 1}.

Min

Per il calcolo della llr dei messaggi di risposta r_ji, il nodo c_i si auspica che la probabilità p_j = r_ji = Pr{x_j = 1} sia uguale a quella che gli altri bit che partecipano al controllo svolto da c_i presentino un numero dispari di uni, ossia

L(r_ji) = L⎛⎜⎝Pr⎧⎨⎩ⁿ⎲⎳_{j’ = 1

⊕, j’ ≠ j}x_j’h_ij’ = 1⎫⎬⎭⎞⎟⎠ = ln Pr{r_ji = 1}Pr{r_ji = 0}

Dopo una serie di sviluppi analitici di cui tralasciamo l’approfondimento [1009] [1009] Che può essere svolto incrociando le infomazioni presenti oltre che nel già citato W.E.Rayan, An introduction to ldpc code, anche in T.Strutz, Low-Density Parity-Check codes - An introduction presso

http://www1.hft-leipzig.de/strutz/Kanalcodierung/ldpc_introduction.pdf, con la modifica di B.Sklar, A Primer on Turbo Code Concepts, IEEE Comm. Mag. 1998 ad es. presso

http://wireless.ece.ufl.edu/eel6550/lit/sklar_primer.pdf

, sotto l’ipotesi di indipendenza statistica si arriva ad esprimere L(r_ji) in funzione approssimata della llr L(q_ji) dei q_ji da cui dipende, come

L(r_ji) ≈ ( − 1){∏_{j’ ≠ j} sgn(L(q_j’i))} ⋅ min_{j’ ≠ j}{|L(q_j’i)|}

Il risultato si interpreta notando che il modulo (l’affidabilità) della llr risultante L(r_ji) è determinato dal più piccolo dei moduli dei contributi |L(q_j’i)| (il meno affidabile), da cui l’appellativo di Min a questo passaggio. Il segno positivo di L(r_ji) indica poi che Pr{r_ji = 1} > Pr{r_ji = 0} (o viceversa se negativo), e si ottiene come prodotto dei segni di L(q_j’i), indicando così una parità dispari o pari.

Sum

I nodi-variabile aggiornano le stime di L(x_j) come

L(x_j) = L^c(y_j) + ⎲⎳_i L(r_ji)

da cui ottenere una ipotesi di codeword x̃ con elementi 1 o 0 a seconda se L(x_j)≷0. Qualora H ⋅ x̃^T = 0 la decodifica è terminata; altrimenti si calcolano le

L(q_ji) = L^c(y_j) + ⎲⎳_{i’ ≠ i} L(r_ji’)

(passo Sum) e si torna al passo Min.

17.5.2.4 Prestazioni

La natura probabilistica del metodo di decodifica non consente di ottenere una espressione in forma chiusa della P_e in funzione di ^E_b⁄_N₀, il cui grafico deve essere ottenuto mediante simulazione al computer ottenuta mediando su un gran numero di vettori ricevuti y: accade infatti che, sebbene il codice si comporti generalmente bene, per alcune configurazioni di partenza l’algoritmo di decodifica non riesca a convergere.

Di seguito sono riportate le prestazioni ottenute da un codice ldpc regolare con

w_c = 3 e w_r = 6, R_c = ¹⁄₂, per una segnalazione antipodale su canale awgn, con diverse scelte [1010] [1010] Figura tratta dal già citato T.Strutz, ottenuta con il software di R. M. Neal disponibile presso https://www.cs.toronto.edu/~radford/ftp/LDPC-2012-02-11/index.html della lunghezza del blocco n da 256 a 32768. A parte l’evidente guadagno rispetto alle prestazioni in assenza di codifica, i risultati possono essere confrontati con quelli di pag. 1 relativi al codice di Viterbi, e con il limite di Shannon (§ 17.3.4) che per un tasso R_c = ¹⁄₂ fissa un requisito minimo pari a ^E_b⁄_N₀ ≥ 0.188 dB, mancato dal miglior codice esaminato solamente per un dB e mezzo.

Una alternativa per la matrice H è quella che dà luogo ad un codice irregolare, contraddistinto da un numero di uni per riga w_r(i) e per colonna w_c(j) non costanti, e che in generale consegue prestazioni migliori di un codice regolare. In questo caso i bit x_j con w_c(j) più grande sono coinvolti in un maggior numero di vincoli e dunque la stima della loro probabilità diviene più affidabile; il miglioramento di verosimiglianza è quindi distribuito in modo più diffuso da parte dei nodi c_i con w_r(i) maggiore, in quanto collegati ad un maggior numero di nodi-variable. Tra i codici irregolari si menzionano quelli quasi-ciclici e quelli protografici [1011] [1011] Il cui grafo corrispondente è costruito a partire da prototipi di sottografo., le cui matrici H presentano una qualche struttura interna, che riduce la complessità del processo di co-decodifica.

Nel grafico di P_e(^E_b⁄_N₀) ottenuto dalle simulazioni si può distinguere la presenza di due regioni, la prima cosidetta di waterfall (cascata) in cui oltre un certo valore di ^E_b⁄_N₀ la P_e decade piuttosto bruscamente, a cui fa seguito una regione piattaforma (error floor) in cui la riduzione di P_e è molto più graduale, se non nulla. Questo comportamento è attribuibile a quasi-codeword ovvero sequenze x̃ la cui sindrome H ⋅ x̃^T presenta un numero ridotto di uni, e che determina una situazione di minimo locale per il processo di decodifica. In genere l’error floor si manifesta prima per i codici con andamento più ripido nella regione di waterfall (come quelli irregolari), sussistendo una situazione di compromesso tra le due esigenze.

Il numero di iterazioni necessario per arrivare alla decodifica corretta diminuisce all’aumentare di ^E_b⁄_N₀, della dimensione del blocco n, e del tasso R_c, ed è possibile tenerne conto nel fissare il numero massimo di iterazioni prima di dichiarare un fallimento.

Rispetto ai turbo codici gli ldpc hanno il vantaggio che

la decodifica può essere parallelizzata;
sono più adatti alle velocità di trasmissione elevate;
l’error floor si presenta per valori di P_e inferiori;
resistono meglio agli errori a pacchetto;
non è necessario alcun interleaver;
uno stesso codice ldpc è adatto per diversi tipi di canale.

Tra gli svantaggi si citano

una maggior complessità del codificatore;
la realizzazione hardware può essere grande e ingombrante;
un turbo codice si comporta meglio per lunghezze di blocco n più brevi e per tassi R_c minori.

17.5.2.5 Adozione

Il successo della codifica ldpc ha portato alla sua adozione nelle ultime generazioni di standard: dopo la tv satellitare dvb-s2 (2005) viene adottata anche per la diffusione terrestre (dvb-t2) e via cavo (dvb-c), secondo un schema concatenato con ldpc come codice interno e bch esterno in modo da poter gestire il fenomeno dell’error floor.

E’ inoltre adottata per i collegamenti a microonde Wi-MAX 802.16, per le reti wireless WiFi 802.11n, per collegamenti Ethernet 10GBase-T su cavo ritorto, per reti domestiche G.hn con distribuzione su linee elettriche, telefoniche e coassiali fino a 1 Gbit/s (ITU G.9960, 2009), nonchè nel sistema televisivo terrestre dtmb della repubblica popolare cinese, e nella telefonia 5g. [1012] [1012] Vedi ad es. An overview of channel coding for 5G NR cellular communications presso
doi:10.1017/ATSIP.2019.10

Prev Sezione 17.4: Codifica di canale Su Capitolo 17: Capacità e codifica di canale Capitolo 18: Caratterizzazione circuitale, rumore ed equalizzazione dati Next