Sezione 21.2: Il canale MIMO Su Capitolo 21: Sistemi multiantenna o MIMO Sezione 21.4: Capacità di canale con fading di Rayleigh 

21.3 Diversità spaziale

L’esistenza contemporanea (e sulla stessa banda di frequenze) di più canali radio, differenziati per gli elementi di H (21.210), offre innanzitutto l’opportunità di analizzare come sfruttare la diversità spaziale disponibile allo scopo di migliorare le prestazioni del collegamento, ovvero risparmiare potenza o migliorare la Pe, od un compromesso tra i due obiettivi. Discutiamo innanzitutto cosa si può fare quando solo uno dei due estremi del collegamento dispone di più di una antenna.

21.3.1 Ricevitore multi-antenna

Si tratta del caso indicato come simo (nT = 1) che studiamo nel contesto di una trasmissione punto-punto oppure broadcast, in cui una unica antenna trasmette un segnale che viene ricevuto mediante nR > 1 antenne, e dunque H è un vettore ad
figure f138.3.png
una colonna ed nR righe, ovvero H = (h1, h2, ⋯, hnR)T. Nelle condizioni di fading di Rayleigh piatto se la separazione tra le antenne è sufficiente[1190]  [1190] Nel caso di un telefono cellulare sono presenti numerosi riflettori nelle vicinanze del ricevitore, producendo nei downlink fading incorrelati per distanze tra le antenne dei mobili di circa mezza lunghezza d’onda. Viceversa nel caso della base station fissa con cui il cellulare comunica, i cammini multipli dell’uplink hanno quasi tutti origine nei pressi del mobile, riducendo la gamma di angoli di incidenza dei raggi ricevuti, che iniziano ad essere indipendenti per distanze di decine di lunghezze d’onda: pertanto alla base station sono necessarie antenne molto più lontane tra loro. il valore hi relativo a ciascuna antenna è incorrelato da quello associato alle altre ovvero E{hihj} = 0, e dunque statisticamente indipendente in virtù della gaussianità delle hi. Pertanto se per una antenna si manifesta una forte attenuazione, ciò probabilmente non accade per le altre.
Sussistono tre possibili modi di sfruttare le nR antenne di ricezione: preferire quella da cui si riceve più potenza, mediare equamente tra tutti i segnali ricevuti, oppure effettuare una somma pesata.

21.3.1.1 Selezione di diversità

Mostriamo innanzitutto come anche solo limitandosi a scegliere quale antenna utilizzare per la ricezione si riescano a conseguire risultati molto soddisfacenti. Consideriamo quindi un ricevitore per cui siano disponibili nR rami di diversità indipendenti ed affetti da fading di Rayleigh, su ognuno dei quali (per ogni utilizzo del canale) si riceve un segnale con inviluppo complesso (vedi (21.209))
(21.211) ri = his + ni
con i = 1, 2, ⋯, nR, in cui s è il valore complesso che individua un punto della costellazione adottata, trasmesso con potenza[1191]  [1191] Il valore Es individua l’energia per simbolo, e misura il valore di E{s2}. PT = Esfs. I valori ρi = |hi| sono v.a. di Rayleigh con d.d.p. p(ρ) = ρσ2h e− ρ22σ2h, uguale per tutti i rami i ma con valori incorrelati ovvero E{ρiρj} = 0 con i ≠ j, mentre ni ∈ CN{0, σ2n} è un campione dell’inviluppo complesso di un processo gaussiano bianco passabanda.
A differenza di un canale awgn, il rapporto SNR che compete alla (21.211) non è un valore deterministico, ma una v.a. che indichiamo come SNR istantaneo, per simbolo[1192]  [1192] Istantaneo perché dipende da hi che in linea di principio può variare da istante ad istante; per simbolo perché Esσ2n = PsPn 1fs.
(21.212) γi = |hi|2 E{s2}σ2n = |hi|2 Esσ2n
e che si distribuisce con la medesima d.d.p. di |hi|2, che è (vedi eq. (21.186)) una esponenziale; pertanto
p(γi) = 1Γ e− γiΓ
(con γi ≥ 0), dove Γ è l’SNR medio valutabile come
(21.213)
Γ = E{γi} = E{|hi|2} Esσ2n = 2σ2h Esσ2n
(vedi § 20.5.1) uguale per tutti i rami i nelle ipotesi poste. A questo punto abbiamo tutte le relazioni necessarie a valutare la probabilità che un singolo ramo abbia un γi inferiore ad un valore δ, pari a (vedi eq. (26.3) a pag. 1)
Pr{γi ≤ δ} = δ0 p(γi)dγi = 1 − δ 1Γ e− γiΓ dγi = 1 − e− δΓ
mentre la probabilità che tutti gli nR rami indipendenti presentino contemporaneamente γi < δ vale
Pr{γ1, γ2, ⋯, γM ≤ δ} = (1 − e− δΓ)nR
che indichiamo come PnR(δ), da cui otteniamo la probabilità che almeno uno dei rami consegua γi ≥ δ come
Pr{ γi ≥ δ,  ∀i} = 1 − PnR(δ) = 1 − (1 − e− δΓ)nR
Esempio Consideriamo un ricevitore con quattro rami di diversità, ognuno affetto da fading di Rayleigh, e con un medesimo SNR medio Γ. Determinare la probabilità che l’SNR istantaneo γi di ciascun ramo si riduca contemporaneamente di 10 dB sotto il valor medio Γ, ossia che tutti i γi siamo inferiori ad un valore δ tale che δΓ = 0.1, e confrontare il risultato con il caso di un ricevitore senza diversità. Risulta che
Pr{γ1, γ2, γ3, γ4 ≤ δ} = P4(δ) = (1 − e− 0.1)4 = 8.2 ⋅ 10 − 5
mentre per un sistema siso avremmo avuto
Pr{γi ≤ δ} = P1(δ) = 1 − e− 0.1 = 9.5 ⋅ 10 − 2
Considerando i 10 dB di differenza come il valore di un margine oltre il quale il collegamento diviene troppo rumoroso, l’uso di quattro rami di diversità corrisponde ad un miglioramento della probabilità di fuori servizio di più di mille volte!
L’approccio della selezione di diversità è facilmente realizzabile in quanto coinvolge solamente il ricevitore, dove viene comparata la potenza del segnale in arrivo sulle diverse antenne, e quindi il segnale più forte è inviato al ricevitore, ne più ne meno come nello schema anticipato al § 20.3.3.1. Dato che la stima del livello di potenza di ricezione per ciascun ramo si basa su di una media temporale, la decisione non avviene in modo prettamente istantaneo; d’altra parte, è sufficiente che avvenga con tempi inferiori al tempo di coerenza eq. (21.202).
E’ possibile mostrare[1193]  [1193]  Vedi D.G. Brennan, Linear Diversity Combining Techniques. Proc. IEEE, Vol. 91, N. 2, Feb 2003. che l’SNR medio ΓSD per il ramo di volta in volta selezionato migliora all’aumentare del numero di antenne, anche se per ogni antenna aggiuntiva il miglioramento è sempre minore, risultando
(21.214) ΓSD = ΓnRk = 11k
ovvero con un numero di 2, 3, 4 antenne si ottiene un fattore di miglioramento di 1.5, 1.83, 2.03... ma si può fare di meglio se vengono utilizzati tutti i rami in contemporanea, anziché uno solamente.

21.3.1.2 Combinazione di massimo rapporto - MRC

Riscriviamo la (21.211) espandendo il coefficiente hi come hi = |hi|e jφi, ovvero
(21.215) ri = |hi| e jφi s + ni
con |hi| v.a. di Rayleigh e φi uniforme. La tecnica che stiamo per affrontare si basa sul calcolo di una combinazione lineare
(21.216)  = nRi = 1|wi| e jφi ri
dei segnali ricevuti ri mediante coefficienti complessi wi = |wi|e −jφi ottenuti a partire da una stima[1194]  [1194] Valida per un intervallo temporale minore del tempo di coerenza del canale. dei valori hi. Per quanto riguarda la fase φi questa viene scelta pari a − φi, in modo da annullare il termine di fase in ri e porsi nelle condizioni di somma coerente, dato che inserendo la (21.215) in (21.216) si ottiene
(21.217)
 = i |wi|e −jφiri = i |wi|e −jφi(|hi|e jφis + ni) =   = i |wi||hi|s + i |wi|e −jφini = i |wi||hi|s + i |wi|ni
visto che la rotazione φi della v.a. complessa ni non ne cambia la natura[1195]  [1195] E’ proprio in base a questa considerazione che il vettore gaussiano complesso costituito da campioni dell’inviluppo complesso di un processo di rumore passa banda prende il nome di processo circolare..
La scelta dei valori |wi| avviene secondo il criterio di rendere massimo l’SNR momentaneo[1196]  [1196] Nel senso che dato che (come stiamo per vedere) γMR dipende dagli hi che sono v.a., è una v.a. anch’esso. Ma allo stesso tempo gli hi sono considerati costanti per tutto il tempo di coerenza, ed altrettanto accade a γMR. γMR di (21.217), da cui il nome di maximal ratio combining (mrc) della tecnica, in cui per ratio si intende l’SNR. A tale scopo osserviamo come alla componente di segnale di (21.217) competa una energia media (rispetto alla variabilità di s) E{(i|wi||hi|s)2} = Es(i|wi||hi|)2, mentre per la varianza del rumore si ottiene E{(i|wi|ni)2} = σ2n iw2i, essendo i campioni di rumore ni statisticamente indipendenti: pertanto l’SNR di (21.217) risulta pari a
(21.218) γMR = Esσ2n (nRi = 1|wi||hi|)2nRi = 1w2i = Esσ2n |wTmhm|2 wTmwm
dove con wm = (|w1|, ⋯, |wnR|)T si è indicato il vettore del modulo dei coefficienti w e con hm = (|h1|, ⋯, |hnR|)T quello del guadagno di ampiezza dei rami, in modo che la (21.218) sia espressa nei termini di prodotto scalare tra vettori. Con tale formalismo il massimo valore per γMR si ottiene applicando la disuguaglianza di Schwartz (§ 2.4.3) che asserisce
|wTmhm|2 ≤ ( hTmhm)(wTmwm)
con il segno di uguale solo quando wm = αhm, ovvero i vettori sono paralleli. Con tale scelta la (21.218) diviene
(21.219)
γMR = Esσ2n |αhTmhm|2α2 hTmhm = Esσ2n (nRi = 1|hi|2)2nRi = 1|hi|2 = Esσ2n nRi = 1|hi|2 = nRi = 1γi
in cui l’ultima eguaglianza si basa sulla (21.212). L’SNR complessivo è dunque pari alla somma degli SNR dei singoli rami, e può così conseguire valori accettabili anche se nessuno dei rami lo ottiene individualmente.
In virtù dell’ipotesi che i valori hi siano statisticamente indipendenti, dalla (21.219) otteniamo l’SNR medio ΓMR a partire dai Γi dei singoli rami (eq. (21.213)) come
(21.220) ΓMR = nRi = 1Γi
Se ogni ramo presenta il medesimo SNR medio Γi si può confrontare (21.220) con (21.214), ed osservare che ora ΓMR aumenta linearmente con il numero di antenne, ovvero migliora di 3 dB ad ogni raddoppio di nR. Se invece (essendo gli |hi| v.a. indipendenti) i Γi sono differenti tra loro il miglioramento è inferiore, ma ΓMR risulta comunque sempre migliore del miglior Γi.
Per poter essere operativi non resta che effettuare una scelta ragionata per il coefficiente di proporzionalità α introdotto dalla disuguaglianza di Schwartz, e dal punto di vista teorico di nessun impatto. Includendo anche il termine di rifasamento, nella pratica conviene scegliere dei pesi
(21.221) wi = h * inRi = 1|hi|2
in modo da rendere uno stimatore non polarizzato (§ 6.6.3): essendo infatti i termini ni a media nulla, il valore atteso della (21.217) assume la forma
(21.222)
E{} = i wihis = i h * ii |hi|2 his = i |hi|2i |hi|2 s = s
e dunque la tecnica mrc non altera la dimensione della costellazione A a cui s appartiene, e la decisione sul simbolo trasmesso può basarsi sul criterio di massima verosimiglianza
 = argmaxs  ∈ AProb{ ⁄ s}      ovvero      = argmins  ∈ A(s − i)2
dove la seconda espressione individua una minima distanza euclidea[1197]  [1197] Con l’accortezza che per grandezze complesse il quadrato si valuta come prodotto per il coniugato, ossia z2 = zz* = ({z})2 + ({z})2. conseguenza del passaggio ai logaritmi e della gaussianità di n.
Probabilità di errore
Con una procedura di media statistica analoga[1198]  [1198] Nel senso di pervenire ad una espressione di Pe(γMR) e poi calcolarne il valore atteso rispetto alla v.a. γMR, che ora non è più esponenziale, bensì chi quadro (§ 6.6.5) con 2nR gradi di libertà, essendo le hi v.a. gaussiane complesse. a quella illustrata al § 20.5.1 si può arrivare a valutare la Pbite nel caso di costellazione bpsk ed in funzione del numero di ricevitori nR e dell’SNR medio ricevuto Γ (lo stesso per tutte le antenne), che per valori di EbN0 ≥ 10 è bene approssimata come
(21.223)
Pbite,  MRC,  BPSK2nR − 1nR12 1 − Γ1 + ΓnR
da confrontare con l’espressione (21.208) ottenuta per un sistema di trasmissione siso, confronto possibile anche mediante la figura a lato, in cui oltre al caso del fading siso compare anche la curva di Pe per il caso awgn in cui non si verifica fading. Evidentemente il miglioramento è notevole!
Svolgiamo ora due ultime considerazioni a partire dalla (21.221). La prima è che nel caso di una potenza di rumore σ2n uguale su tutti i rami, si può dire che la combinazione lineare attuata dalla (21.216) da maggior peso ai rami con l’SNR più elevato, dato che questo dipende da |hi|2. La seconda considerazione è che la scelta (21.221) rivela una analogia tra questa tecnica e quella del filtro adattato (§ 7.6) che pure trova motivazione nella massimizzazione dell’SNR, ottenuta in quel caso grazie ad una risposta in frequenza che è il coniugato del segnale da rivelare. Il paragone non è casuale dato che come per il filtro adattato, a supporto della scelta w ∝ h* sussiste una argomentazione basata sulla disuguaglianza di Schwartz (§ 2.4.3)[1199]  [1199] Vedi ad es. il riferimento della nota 1139; per lo stesso risultato sussiste inoltre anche un’argomentazione basata sugli autovettori della matrice hh (l’apice indica il trasposto coniugato), vedi B. Holter, G.E. Oien, The Optimal Weights of a Maximum Ratio Combiner using an Eigenfilter Approach, Proc. 5th IEEE Nordic Signal Processing Symposium, Hurtigruten, 4-6 October 2002, reperibile presso https://www.ux.uis.no/norsig/norsig2002/Proceedings/papers/cr1099.pdf, e che esamina anche il caso in cui il rumore si presenti con potenze differenti sui diversi rami.; in altre parole, ciò che il filtro adattato compie nel dominio della frequenza, viene attuato dal ricevitore mrc nel dominio spaziale.

21.3.1.3 Combinazione equal gain

Torniamo all’ipotesi che rende massima la (21.220) ovvero quando i diversi rami subiscono un fading di intensità simile, cioè |hi| ≃ |h| ∀i. In tal caso i pesi wi ottimi per ottenere tramite la (21.216) hanno tutti lo stesso modulo[1200]  [1200] Rimane infatti la necessità di rifasare i rami per ottenere una somma coerente. pari a |wi| = 1nR|hi|, in modo che la (21.222) ora è espressa come
(21.224)
E{} = i |wi||hi| s = i 1nR|hi| |hi| s = nRnR s = s
e quindi ogni antenna riceve lo stesso SNR medio Γ, conseguendo un SNR complessivo
(21.225) ΓEG = nRΓ
ovvero nR volte quello di ogni singolo ramo. In tal modo il ricevitore risulta molto semplificato, al punto da preferire a volte l’uso di pesi tutti uguali[1201]  [1201] Dove per uguali si intende |wi| = 1nR senza riguardo per |hi|, causando nella (21.224) l’insorgenza di un fattore moltiplicativo, che può essere ignorato nel caso di una modulazione psk ovvero con costellazione circolare. anche in presenza di coefficienti hi diversi tra loro, nel qual caso il valore (21.225) non viene raggiunto. Tale scelta viene indicata come metodo equal gain, ed offre risultati solo di poco inferiori a quelli di massimo rapporto, e comunque migliori del metodo a selezione.

21.3.2 Trasmettitore multiantenna

figure f138.4.png
Ovviamente la presenza di una unica antenna ricevente impedisce di attuare strategie di scelta o di combinazione delle fonti di diversità spaziale disponibili. Con un numero nT > 1 di trasmittenti i simboli che giungono all’unico ricevente
(21.226) r = nTi = 1his + ni
risultano infatti già combinati. Ma come vedremo la conoscenza da parte del ricevente dei coefficienti complessi[1202]  [1202] Aleatori a componenti gaussiane a media nulla etc etc... hi (che costituiscono l’unica riga della matrice H definita al § 21.2) permette comunque di sfruttare la diversità spaziale. Il modo con cui ciò avviene si basa su di una particolare tecnica di codifica di canale, nota come codifica spazio-tempo (STC) in quanto l’informazione da trasmettere viene diluita (ridondata) oltre che nel tempo (la sola dimensione possibile per un caso siso[1203]  [1203] In realtà ad es. nella modulazione cofdm (§ 16.8.10) la ridondanza viene distribuita anche sulle diverse sottoportanti, dunque in frequenza. Ma ci torniamo al § 21.7.2.) anche sulle antenne (ovvero nello spazio), riuscendo a ottenere un guadagno di diversità.
Una seconda cosa degna di nota in questo passaggio è che in un canale bidirezionale[1204]  [1204] Qualora la trasmissione nelle due direzioni avvenga sulla stessa portante è necessario che le parti si alternino nei ruoli (time-duplex), mentre invece possono trasmettere e ricevere allo stesso tempo se si adottano frequenze differenti (frequency-duplex). trasmettitore e ricevitore si scambiano continuamente di ruolo, dunque se anche in modalità miso si riesce ad ottenere un miglioramento comparabile al caso simo, è sufficiente che solo una delle parti in comunicazione - tipicamente la stazione radio base o l’access point WiFi[1205]  [1205] Anche perché le ridotte dimensioni dei device mobili rendono problematico realizzare antenne sufficientemente distanziate. - sia dotata di più antenne.

21.3.2.1 Codice a traliccio spazio - tempo

Un primo approccio alla realizzazione di un STC si è basato sulla modulazione a traliccio (pag. 1) e per questo indicato come space time trellis code o STTC. In questa tecnica i simboli codificati sono ripartiti tra le antenne, mente dal lato ricevente la decodifica avviene eseguendo un algoritmo di Viterbi vettoriale. Oltre ad un guadagno di diversità proporzionale al numero delle antenne, il metodo offre anche un guadagno di codifica legato al numero di stati del codice a traliccio soggiacente (a spese della complessità di decodifica), cosa che non avviene con la tecnica STBC descritta appresso, ma che è attualmente favorita nonostante questa carenza, più che compensata dal vantaggio di poter svolgere la decodifica mediante operazioni assai più semplici. Scegliamo pertanto di non addentraci nello studio degli STTC.

21.3.2.2 Codice a blocco spazio - tempo

A differenza dei codici di canale esaminati al § 17.4, in cui le quantità in ingresso ed in uscita erano semplici bit, uno stbc opera a valle della codifica di simbolo (indicata anche come symbol mapper), che ad un blocco di M bit fa corrispondere un valore complesso si che individua un punto di costellazione A tra L = 2M.
figure f-STBC.png
Figure 21.6 Generazione di un codice a blocco spazio-tempo
Lo stbc osserva un numero k di tali simboli, e fa corrispondere ad essi una codeword che consiste in una matrice C i cui elementi cij ∈ A identificano i simboli trasmessi dall’antenna j = 1, ⋯, nT all’istante i = 1, 2, ⋯, T. Il tasso di codifica in questo caso è calcolato come il rapporto tra il numero k di simboli si ed il numero di istanti T impiegati per trasmetterli, ovvero
(21.227) Rc = kT

21.3.2.3 Codice di Alamouti

Esponiamo il metodo partendo dalla sua definizione iniziale dovuta ad Alamouti[1206]  [1206] S.M. Alamouti, A simple transmit diversity technique for wireless communications, IEEE Journal on Selected Areas in Communications, Oct 1998. Reperibile presso
https://mast.queensu.ca/~fady/Math800/papers/Alamouti_JSAC98.pdf
, relativa al caso di nT = 2 antenne di trasmissione, che in due istanti di simbolo consecutivi trasmettono un totale di quattro simboli di canale cij legati ai due di sorgente s1 ed s2 secondo lo schema[1207]  [1207] Dunque le codeword C sono costituite dai simboli di sorgente stessi, una sorta di codice a ripetizione, se non fosse che ora ci sono anche i coniugati, e quel segno cambiato... in effetti la scelta di tab. 21.1 è un caso particolare di una regola più generale, ovvero costruire gli elementi di C come combinazione lineare dei simboli si, e dei loro coniugati. illustrato in tabella 21.1. Le righe corrispondono ai

antenna 1 antenna 2
tempo t s1 s2
tempo t + Ts  − s * 2 s * 1
Table 21.1 Codice di Alamouti
due istanti di simbolo: durante il primo istante le antenne trasmettono rispettivamente s1 la prima ed s1 la seconda, mentre al secondo istante la prima trasmette  − s * 2 e la seconda s * 1. Pertanto il codice agisce attraverso le due dimensioni della tabella, in cui le righe individuano la diversità temporale, mentre le colonne quella spaziale. Il calcolo del tasso di codifica fornisce Rc = kT = 22 = 1, e dunque a differenza dei codici a blocco tradizionali non si verifica nessun aumento di banda. Vedremo che il codice di Alamouti è l’unico stbc a godere di tale proprietà, risultando in generale Rc < 1.
Ricezione
Applicando la (21.226) al segnale ricevuto nei due istanti, otteniamo
(21.228) r1  =    h1s1 + h2s2 + n1 r2  = − h1s * 2 + h2s * 1 + n2
dove ni è il solito rumore gaussiano complesso. Dalla seconda relazione si calcola
(21.229) r * 2  = − h * 1s2 + h * 2s1 + n * 2
e quindi, purché il ricevitore conosca i coefficienti h1 ed h2, i due valori r1 ed r * 2 sono combinati in modo simile a quanto visto per l’mrc, questa volta allo scopo di ottenere una stima 1 e 2 per entrambi i simboli di sorgente, calcolando
(21.230) 1  = h * 1r1 + h2r * 2 2  = h * 2r1 − h1r * 2
Sostituendo infatti le (21.228) e (21.229) in (21.230) si ottiene
1  = h * 1(h1s1 + h2s2 + n1) + h2( − h * 1s2 + h * 2s1 + n * 2) 2  = h * 2(h1s1 + h2s2 + n1) − h1( − h * 1s2 + h * 2s1 + n * 2)
da cui
(21.231)
1  = (|h1|2 + |h2|2)s1 + h * 1n1 + h2n * 2 2  = (|h1|2 + |h2|2)s2 + h * 2n1 − h1n * 2
dove i termini di interferenza tra simboli sono scomparsi, e si manifesta un rinforzo delle ampiezze dei simboli di sorgente pari alla somma dei quadrati dei guadagni di Rayleigh, come anche avveniva per l’mrc, e che indichiamo con α = |h1|2 + |h2|2.
Prestazioni
Se dividiamo le (21.231) per α otteniamo anche in questo caso delle stime non polarizzate dei simboli di sorgente
(21.232) 1  = 1α 1 = s1 + 1 2  = 1α 2 = s2 + 2
in cui 1 e 2 sono v.a. gaussiane complesse con parti reale ed immaginaria incorrelate, a media nulla e varianza[1208]  [1208] Svolgendo infatti i calcoli per una di esse, ad esempio n1̃ = 1α(h * 1n1 + h2n * 2), in virtù dell’incorrelazione tra n1 ed n2 si ottiene
σ2n1̃  = E{i * i} = 1α2E{(h * 1n1 + h2n * 2)(h1n * 1 + h * 2n2)} =   = 1α2 [|h1|2E{n1n * 1} + |h2|2E{n * 2n2} + h * 1h * 2E{n1n2} + h1h2E{n * 2n * 1}] =   = 1α2 [|h1|2σ2n1 + |h2|2σ2n2] = 1α2 [ασ2n] = σ2n1|h1|2 + |h2|2
σ2 = E{i * i} = σ2n(|h1|2 + |h2|2) in cui σ2n = E{nin * i} è la potenza del rumore in ingresso al ricevitore. Il criterio di decodifica è come di consueto quello di massima verosimiglianza, che si riduce alla regola di decisione
(21.233) si = argmins  ∈ A (s − i)2     con    i = 1, 2
ovvero ad ognuno dei due istanti i si decide per la ricezione del simbolo si (che figura nella costellazione A) più vicino[1209]  [1209] Si ribadisce che per grandezze complesse il modulo quadro si calcola come prodotto per il coniugato, dunque la (21.233) diviene (s − i)2 = (s − i)(s* −  * i) = ss* + i * i − s * i − is*, da valutare per ogni s ∈ A. al simbolo (valore complesso) normalizzato i espresso dalla (21.232), che possiamo riguardare come un valore di decodifica soft. In alternativa, se i simboli trasmessi (di sorgente) provengono da uno stadio di codifica di canale esterno per il quale è prevista una decodifica soft, i valori i possono essere passati a quest’ultima così come sono.
La probabilità con cui la regola (21.233) dà esito errato è naturalmente legata in modo inverso al rapporto SNR istantaneo γ per le variabili i (21.232) su cui si effettua la decisione, che risulta pari a
γAla = E{sis * i}σ2 = Esσ2n (|h1|2 + |h2|2)
fornendo un guadagno di diversità identico a quello di un ricevitore simo-mrc (eq. (21.219)), tranne che... molto spesso le specifiche relative alla massima potenza irradiata impongono di suddividere la stessa in parti uguali tra le antenne di trasmissione. Ciò significa che anche l’energia per simbolo Es della costellazione adottata risulta (con nT = 2)
figure f-ber-alam.png
dimezzata, cosicché il sistema miso-stbc con nT = 2 subisce una penalizzazione di 3 dB[1210]  [1210] Questi 3 dB di differenza sono da interpretare come un guadagno di array legato al disporre di due antenne di ricezione, per cui in pratica viene ricevuta il doppio della potenza che si riceverebbe con una sola antenna, mentre in trasmissione ciò non si verifica, per la limitazione sulla potenza massima trasmessa. rispetto alle prestazioni di simo-mrc con nR = 2.
Il legame esatto tra la Pe legata all’uso della (21.233) e l’SNR medio
Γ = E{γAla} = Esσ2n E{|h1|2 + |h2|2}
dipende dal tipo di modulazione, ma per il caso bpsk la figura a lato riporta il risultato di simulazioni messe a confronto con le curve (pag. 1) dei casi siso, simo ed awgn, in modo da poter apprezzare l’effetto della perdita di 3 dB prima indicata sul risultato finale, poca cosa rispetto al miglioramento comunque conseguito. La curva indicata in figura come mimo 2,2 si riferisce al caso che affrontiamo appresso.

21.3.2.4 Ricezione multiantenna di un codice di Alamouti

Eccoci dunque arrivati alla prima configurazione propriamente mimo: vediamo come ricevere una trasmissione miso-stbc mediante una schiera di nR antenne di ricezione, conseguendo un ordine di diversità massimo pari a 2nR, ossia quello ottenuto con due antenne di trasmissione moltiplicato per nR.
Il trasmettitore non modifica il suo operato, ed invia la codifica espressa in tabella 21.1 mediante le sue due antenne. Facciamo dapprima il caso di adottare nR = 2, ricevendo così un totale di quattro diversi segnali
(21.234) r11  = h11s1 + h12s2 + n1 r21  = h21s1 + h22s2 + n2 r12  = − h11s * 2 + h12s * 1 + n3 r22  = − h21s * 2 + h22s * 1 + n4
in cui rik è il segnale ricevuto dall’antenna i = 1, 2 all’istante k = 1, 2, ed hij è il coefficiente complesso del canale radio tra le antenne j e i. I valori rik delle (21.234) vengono quindi combinati per formare le grandezze di decisione
(21.235)
1  = h * 11r11 + h12r * 12 + h * 21r21 + h22r * 22 2  = h * 12r11 − h11r * 12 + h * 22r21 − h21r * 22
e sostituendo le (21.234) nelle (21.235) dopo alcuni passaggi si ottiene
(21.236)
1  = (|h11|2 + |h12|2 + |h21|2 + |h22|2)s1 + h * 11n1 + h12n * 3 + h * 21n2 + h22n * 4 2  = (|h11|2 + |h12|2 + |h21|2 + |h22|2)s2 + h * 12n1 − h11n * 3 + h * 22n2 − h21n * 4
riproducendo quindi la situazione già osservata alle (21.231), con la differenza che ora il rinforzo per le ampiezze dei simboli di sorgente vale α = |h11|2 + |h12|2 + |h21|2 + |h22|2, ottenendo un’ordine di diversità complessivo che è il prodotto degli ordini ai due estremi multiantenna.
Gli stessi risultati sono facilmente estensibili ad un numero nR > 2 di antenne riceventi, dato che ponendo le (21.234) nella forma
(21.237) ri1  =    hi1s1 + hi2s2 + ni1 ri2  = − hi1s * 2 + hi2s * 1 + ni2
con i = 1, 2, ⋯nR, le (21.235) si estendono come
(21.238) 1  = nRi = 1(h * i1ri1 + hi2r * i2) 2  = nRi = 1(h * i2ri1 − hi1r * i2)
ed al posto delle (21.236) otteniamo
(21.239)
1  = nRi = 1[(|hi1|2 + |hi2|2)s1 + h * i1ni1 + hi2n * i2] 2  = nRi = 1[(|hi1|2 + |hi2|2)s2 + h * i2ni1 − hi1n * i2]
Ortogonalità
Mostriamo come i risultati fin qui ottenuti siano una diretta conseguenza del fatto che le righe della matrice delle codeword C =  s1    s2  − s * 2    s * 1 di Alamouti sono ortogonali tra loro, ossia il prodotto scalare tra due diverse righe è nullo, e dunque
CC  =  s1    s2  − s * 2    s * 1 s * 1  − s2 s * 2   s1  =  s1s * 1 + s1s * 2     − s1s2 + s1s2  − s * 1s * 2 + s * 1s * 2 s2s * 2 + s1s * 1  =   =  |s1|2 + |s2|2 0 0 |s1|2 + |s2|2
in cui l’operatore è noto come Hermitiano ed esegue il coniugato della trasposta della matrice[1211]  [1211] Indicato anche come operatore aggiunto, mentre A è detta matrice aggiunta di A., equivalente per le matrici complesse dell’operazione di coniugazione valida per gli scalari. E’ stato dimostrato che il codice di Alamouti è l’unico stbc a simboli complessi con codeword ortogonali.
Esprimendo ora la (21.237) in forma matriciale come
ri1 r * i2  =  hi1 hi2 h * i2   − h * i1 s1 s2  +  ni1 n * i2  ovvero ri = Gi s + ni
osserviamo come anche la matrice Gi =  hi1 hi2 h * i2   − h * i1 sia ortogonale, per qualunque valore dei coefficienti h, e dunque GiGi = αiI2 in cui I2 è la matrice identità 2 × 2 ed αi = |hi1|2 + |hi2|2. Pre-moltiplicando il vettore ricevuto dalla i − esima antenna ri per Gi =  h * i1 hi2 h * i2   − hi1 , come avviene per le (21.230), otteniamo quindi
r̃i = Giri = GiGi s + Gini = αis + ñi
dove ñi è ancora gaussiano complesso a media nulla e componenti incorrelate. A questo punto la decisione di massima verosimiglianza per l’antenna i assume la forma
(21.240)
s = argmin s ∈ A2 (r̃i − αis)(r̃i − αis)*
ma essendo come osservato ñi = r̃i − αi s a componenti incorrelate, la (21.240) si scompone in due minimizzazioni indipendenti, come espresso dalle (21.233) e (21.239).

21.3.3 Prestazioni limite

Abbandoniamo gli sviluppi ottenuti per il codice di Alamouti per tornare al caso più generale, e definire uno stbc come una procedura per ottenere una codeword definita da una matrice ad elementi complessi
Cj =  cj1, 1  cj1, 2  ⋯  cj1, nT cj2, 1 cj2, 2 cj2, nT cjT, 1 cjT, 2 cjT, nT
con j = 1, 2, ⋯, 2kM in corrispondenza di ciascuna delle altrettante possibili sequenze di k simboli complessi a 2M valori, come descritto al § 21.3.2.2, da trasmettere da parte di nT antenne in T ≥ nT istanti e ricevere mediante nR antenne, cercando di individuare quali siano i fattori principali che concorrono alle prestazioni del codice, in termini di probabilità di errore.
A fronte di sviluppi analitici che tralasciamo[1212]  [1212] Che ho trovato accennati, con i dovuti rimandi, su E. Krouk, S. Semenov, Modulation and coding techniques in wireless communications, 2011 John Wiley & Sons Ltd., si dimostra che la probabilità di decidere erroneamente per la codeword Ci quando viene trasmessa Cj per valori elevati di SNR medio Γ non supera un valore
(21.241) Prob{Cj → Ci} ≤ 1(Gc Γ ⋅ 14)Gd
in cui Gd = rnR esprime il guadagno di diversità che dipende oltre che da nR anche dal rango[1213]  [1213] Il rango di una matrice quadrata A n × n è definito come il numero delle sue righe (o colonne) linearmente indipendenti, ma è anche uguale al numero di autovalori diversi da zero, dove gli autovalori sono gli zeri del polinomio caratteristico definito come det(A − λIn) r della matrice A = (Ci − Cj)(Ci − Cj), mentre Gc = rrn = 1 λn misura il guadagno del codice e dipende dagli autovalori λn diversi da zero della matrice A. Pertanto il limite superiore (21.241) per la Pe può essere ridotto aumentando sia Gc che Gd, e se per tutte le coppie di codeword i, j la matrice A è a rango pieno (pari ad nT), allora l’ordine di diversità conseguito dal codice è pari a nTnR.
Esempio Il simbolo vettoriale s = [s1, s2]T è codificato secondo Alamouti come C =  s1     s2  − s * 2     s * 1 , mentre un diverso input s’ = [s1, s2]T come C’ =  s1     s2  − s’*2     s’*1 , dunque C − C’ =  s1 − s1      s2 − s2  − s * 2 + s’*2      s * 1 − s’*1 il cui determinante vale |s1 − s1|2 + |s2 − s2|2 ≠ 0 per qualsiasi s ≠ s. Pertanto la matrice A ha sempre rango pieno[1214]  [1214] Infatti il determinante è anche pari al prodotto degli autovalori, e dunque il suo essere  ≠ 0 implica che non vi siano autovalori nulli., ed il codice offre un ordine di diversità pari a nTnR.
Prestazioni asintotiche
Prima di procedere svolgiamo una interessante considerazione sulla legge di dipendenza della Pe a simbolo da Gc e Gd, come espressa dalla (21.241), che per SNR elevato possiamo generalizzare come Pe ∝ (Gc Γ) − Gd o, esprimendo le grandezze in dB
10 log10 Pe ∝ 10 log10 (Gc Γ) − Gd = − Gd(GdBc + ΓdB)
che rappresentiamo
figure f-138-Pe-asint.png
alla figura a lato[1215]  [1215] Anziché mostrare la Pe in scala logaritmica come si fa di solito, per coerenza con l’espressione 10 log10 Pe ∝  = − Gd(GdBc + ΓdB) sulle ordinate è mostrato il log di Pe, ed essendo Pe < 1,  il suo log è negativo. in modo da meglio apprezzare come, mentre il guadagno di codifica GdBc determina una semplice traslazione a sinistra della curva di prestazione, il guadagno di diversità Gd ne modifica l’inclinazione, e dunque ha un effetto sempre più pronunciato all’aumentare dell’SNR.

21.3.4 Codici sub ottimi

Concludiamo la sezione sulla diversità spaziale citando le alternative che, utilizzando più di due antenne in trasmissione, conseguono un ordine di diversità pari a nTnR a spese di un tasso di codifica Rc = kT < 1, oppure conseguono Rc = 1 ma con un ordine di diversità ridotto.
Codice ortogonale reale quadrato
Un primo risultato da citare è che limitando il campo di applicazione a simboli reali (ovvero ad un modulazione l-ask) possono essere definiti stbc ortogonali[1216]  [1216] L’ortogonalità delle codeword è la proprietà che consente di conseguire la piena diversità spaziale e che permette la decodifica semplificata discussa precedentemente. con codeword quadrate ovvero nT = T pari a 2, 4 ed 8, ed in grado di offrire Rc = 1 e diversità nTnR, prestazioni che per simboli complessi sono invece conseguite esclusivamente dal codice di Alamouti con nT = 2. Un esempio di stbc che usa nT = 4 antenne per trasmettere k = 4 simboli reali in T = 4 istanti è indicato come C4 nello schema che segue:
C4 =  s1 s2 s3 s4  − s1 s2  − s3 s4  − s1 s2 s3  − s4  − s1  − s2 s3 s4     CT8 × 4 =  s1  − s1  − s1  − s1   s * 1  − s * 1  − s * 1  − s * 1 s2 s2 s2  − s2   s * 2 s * 2 s * 2  − s * 2 s3  − s3 s3 s3   s * 3  − s * 3 s * 3 s * 3 s4 s4  − s4 s4   s * 4 s * 4  − s * 4 s * 4
Codice complesso associato
Un secondo risultato è che è possibile ottenere un codice ortogonale complesso a partire da uno reale trasmettendo la stessa struttura di codeword ma ad elementi complessi, fatta seguire da altrettanti T istanti in cui viene trasmessa la codeword coniugata, come esemplificato dalla matrice C8 × 4 =   C4  C * 4 , sopra rappresentata trasposta per ragioni di spazio. Come evidente l’adozione di C8 × 4 comporta un raddoppio del numero di istanti necessari alla trasmissione, e dunque un dimezzamento di Rc; d’altra parte lo stesso raddoppio di T determina anche un miglioramento di 3 dB per l’SNR di decisione, in quanto uno stesso simbolo si viene ricevuto il doppio delle volte. D’altra parte le esigenze di tempo reale della trasmissione comportano che il raddoppio del numero di istanti T richieda il dimezzamento della loro durata, e quindi la ricezione di metà dell’energia per simbolo: tale peggioramento è compensato dal guadagno di 3 dB legato alla doppia trasmissione.
Codice reale non quadrato
E’ anche possibile realizzare stbc reali con codeword non quadrate ovvero con nT ≠ T, purché il numero di elementi TnT nella matrice del codice sia un multiplo intero del numero k di simboli da codificare; tali soluzioni esistono per qualunque nT, conseguono massima diversità e decodifica lineare, e quando utilizzano un numero di istanti T pari a quello k dei simboli da rappresentare esibiscono anche un tasso di codifica Rc = 1
Esempio
C4 × 3 =  s1 s2 s3  − s2 s1  − s4  − s3 s4 s1  − s4  − s3 s2
Citiamo il caso di un sbtc reale con nT = 3 e k = T = 4 mostrato a lato, che ripete ciascun simbolo tre volte e consegue Rc = 1; quando da questo se ne ricava un sbtc complesso concatenando la matrice con la coniugata, il tasso si riduce ad 12.
Ritardo minimo
Finché ci si limita a raddoppiare un codice reale per farne uno complesso come nell’esempio precedente, il tasso non può essere maggiore di 12; sono però stati scoperti codici complessi in grado di conseguire Rc = 34 che, a parità del numero nT di antenne, riducono il numero T di istanti necessari, conseguendo anche un minor ritardo di codifica.
Codici quasi-ortogonali
Anziché sacrificare il tasso Rc per l’ortogonalità, è possibile fare l’opposto e mantenere Rc = 1 assieme alla piena diversità (con nT > 2) mediante stbc quasi-ortogonali[1217]  [1217] Ovvero per i quali il prodotto CC non assume la forma αIT., penalizzati da una modesta perdita di prestazioni (Pe) ed una maggior complessità di decodifica.
 Sezione 21.2: Il canale MIMO Su Capitolo 21: Sistemi multiantenna o MIMO Sezione 21.4: Capacità di canale con fading di Rayleigh