21.4 Capacità di canale con fading di Rayleigh
Le tecniche di
valorizzazione della diversità spaziale fin qui discusse apportano un beneficio alla comunicazione che è stato quantificato come un aumento dell’
SNR per la variabile di decisione. Tale aumento può essere
capitalizzato aumentando il numero
M di bit (e di livelli
L = 2M) rappresentati da ciascun simbolo
si del messaggio da trasmettere, aumentando così la velocità di trasmissione, a parità di periodo di simbolo e di banda occupata. Il legame tra
SNR di un canale
awgn e la conseguente massima velocità di trasmissione è stato analizzato al §
17.3 ed espresso nei termini della
capacità C del canale; affrontiamo ora l’adattamento di tale formulazione al caso di canale affetto da fading di Rayleigh ed in presenza di più antenne trasmittenti e/o riceventi, descritto dalla relazione
come illustrato al §
21.2, con il vincolo di mantenere la potenza
Ps = E{s2} ⋅ fs emessa
collettivamente da tutte le
nT antenne trasmittenti limitata a
PT.
Per avere un termine di paragone rispetto al quale confrontare i risultati valutiamo per prima l’espressione di
C con
nT = nR = 1, nel cui caso la
(21.242) è una semplice relazione scalare (a valori complessi)
r = hs + n. L’espressione (eq.
(21.101)) della capacità
awgn C = B ⋅ log2 (1 + PTN0B) [bit/sec] viene riscritta come
in cui
ρ è l’
SNR che si sarebbe ricevuto in assenza di fading,
|h| ha una d.d.p. di Rayleigh dovuta al fading, ed il risultato viene espresso
per Hertz di banda occupata anziché in forma cumulativa, e dunque la
(21.243) ha il significato di massima
efficienza spettrale (pag.
1) conseguibile. La stessa
(21.243) può essere equivalentemente misurata in bit/simbolo o bit/uso del canale.
Capacità ergodica e garantita
Osserviamo che il valore
(21.243), come quelli che seguiranno, è in realtà una v.a., in quanto
h lo è. A partire dall’espressione
(21.243) si possono ricavare due
numeri: il primo si ottiene eseguendo il valore atteso di
C rispetto alla variabilità di
h, ottenendo un valore
medio indicato anche come capacità
ergodica. Il secondo è invece riferito ad un grado di servizio
g ed esprime il valore di capacità
superato nel
g% del tempo, ed in questo senso detta capacità
garantita (per il
g% del tempo). Ma ai fini di quel che segue sono presi in considerazione casi in cui
h non varia per tutta la durata del collegamento, in modo da permettere il confronto tra risultati.
In presenza di
nR antenne riceventi al §
21.3.1.2 si è analizzato come un ricevitore
mrc determini un aumento dell’
SNR di una quantità pari a
∑nRi = 1|hi|2, e difatti anche il valore teorico di capacità risulta pari a
in cui
hi è il guadagno complesso per l’
i − esima antenna. Notiamo che la dipendenza tra
nR e
CSIMO è di tipo
logaritmico, e dunque l’incremento di
CSIMO è via via minore all’aumentare di
nR.
Nel caso di
nT antenne trasmittenti, ma in assenza di conoscenza da parte del trasmettitore dei valori che compaiono nella matrice
H, ogni antenna utilizza un
nT − esimo della potenza totale di trasmissione, e la capacità risulta pari a
ovvero oltre all’incremento solamente logaritmico con
nT, si assiste anche alla progressiva riduzione dell’
SNR di ricezione, in virtù del vincolo sulla potenza totale di trasmissione che va suddivisa su tutte le
nT antenne.
21.4.1 Capacità del canale MIMO
Il calcolo della capacità in presenza di più antenne sia in trasmissione (
nT) che in ricezione (
nR) segue le linee guida indicate alla nota
1218, con l’obiettivo di rendere massima l’informazione mutua media
I(s;r) = h(r) − h(r ⁄ s)
tra i vettori dei simboli trasmessi
s e di quelli ricevuti
r in modo da ottenere
C = maxp(s){I(s;r)}. Dato che si suppone la matrice di canale
H perfettamente nota in ricezione la sua incertezza condizionata ad
s è nulla, dunque
h(r ⁄ s) = h(Hs + n ⁄ s) = h(n ⁄ s) = h(n)
in quanto
n ed
s sono statisticamente indipendenti, e quindi
L’entropia differenziale
h(n) del vettore gaussiano complesso
n è calcolata al §
21.9.1 come
h(n) = log(det(πeΣn)), dove
Σn = E{nn†} è la matrice di covarianza del rumore
n. Per massimizzare la
(21.246) occorre quindi massimizzare
h(r), il che avviene quando anche
r è un vettore gaussiano complesso, per il quale nuovamente
h(r) = log(det(πeΣr)), in cui la matrice di covarianza
Σr del vettore (a media nulla) ricevuto risulta pari a
Σr = E{rr†} = E{(Hs + n)(Hs + n)†} = E{Hs(Hs)†} + E{nn†} = = HE{ss†}H† + Σn = HΣsH† + Σn
data l’incorrelazione tra
s ed
n, ed avendo sostituito
(Hs)† = s†H†. Mettendo tutto assieme otteniamo dunque
in cui la capacità
mimo viene a dipendere dalla covarianza di sorgente
Σs, da quella di rumore
Σn, e dalla matrice di canale
H. Vediamo ora come diverse ipotesi su tali grandezze permettano di arrivare a risultati adatti ai singoli casi.
Rumore incorrelato tra antenne
La circostanza di avere un rumore
spazialmente bianco, che si verifica quando per le componenti
ni del vettore
n risulta
E{nin * j} = 0 con
i ≠ j oppure
σ2n se
i = j, può essere interpretata come una assenza di interferenti
in comune tra le antenne di ricezione. A ciò consegue una covarianza
del rumore nella forma
Σn = σ2nInR, ossia una matrice nulla tranne che sulla diagonale, dove vale
σ2n. In tal caso la
(21.247) diviene
Potenza trasmessa uniforme e simboli incorrelati
In generale il trasmettitore non è a conoscenza dei valori di
H, e l’unica cosa che può fare è trasmettere con la stessa potenza su tutte le
nT antenne. Allo stesso tempo è lecito considerare i simboli trasmessi incorrelati, ossia per due elementi
si,
sj di
s si ha
E{sisj} = 0 se
i ≠ j. Sotto tali condizioni la covarianza del segnale è pari a
Σs = EsnT InT ossia è tutta nulla tranne che sulla diagonale, dove vale un
nT − esimo dell’energia per simbolo
Es = E{s†s}. In queste circostanze la
(21.248) diviene
in cui
ρ = Esσ2n è l’
SNR per simbolo del segnale ricevuto da ciascuna delle
nR antenne a partire da
tutte le
nT trasmittenti.
Derivazione della capacità MISO e SIMO
Notiamo che la condizione di equipartizione di
PT è in comune alla configurazione
miso che conduce alla
(21.245), ma mentre in quel caso la capacità aumenta con legge logaritmica rispetto ad
nT, si dimostra che la
(21.249) aumenta
linearmente con
m = min(nT, nR). Osserviamo inoltre che
(21.249) diviene esattamente pari a
CMISO (eq.
(21.245)) quando
nR = 1, dato che in questa circostanza
H è un vettore riga, e dunque
HH† = ∑nTi = 1|hi|2. Per lo stesso motivo
(21.249) diviene pari a
CSIMO (eq.
(21.244)) quando
nT = 1.
Quando entrambi i lati del collegamento sono equipaggiati con più antenne la
(21.249) può essere riscritta in una forma che permette di individuare quali caratteristiche della matrice di canale
mimo H di dimensioni
nR × nT rendono il valore
CMIMO − EP più o meno grande. Andiamo a mostrare che ciò dipende dagli
autovalori non nulli λ1, λ2, ⋯, λm della matrice
nR × nR
W = HH†
simmetrica, semidefinita positiva e di rango
m ≤ min(nT, nR), che può quindi essere espressa (§
6.7.3) come
W = ΓΛ Γ† in cui
Λ è una matrice quadrata tutta nulla tranne per gli autovalori
λi sulla diagonale, e
Γ è una matrice unitaria con colonne pari agli autovettori di
W, posti nello stesso ordine con cui gli autovalori compaiono in
Λ. Partendo dalla
(21.249) scriviamo pertanto
in cui la terza eguaglianza deriva dall’identità riportata alla nota
1219, la quarta dall’essere
Γ unitaria, mentre alla quinta si è sviluppato il determinante come prodotto dei termini sulla diagonale. Discutiamo del risultato non appena ottenuto:
21.4.1.1 Trasmissione a potenza differenziata
Rimuoviamo ora l’ipotesi
Σs = EsnT InT adottata per giungere alle
(21.249) e
(21.250) ed investighiamo se esista una diversa matrice
Σs tale da rendere il termine
det [InR + 1σ2n HΣsH†] che compare nella
(21.248) maggiore di quanto ottenuto per la
(21.250), mantenendo il vincolo
tr(Σs) = ⎲⎳nTi = 1 E{sis * i} = Es ≤ PTfs
A questo scopo consideriamo per
H la sua
scomposizione ai valori singolari (SVD
)
H = U D V†
dove
D è una matrice
nR × nT tutta nulla tranne che per gli elementi sulla diagonale, noti come
valori singolari di
H, e pari alla
radice quadrata degli autovalori non nulli
λi (
i = 1, ⋯, m) di
HH† (ma anche di
H†H), ovvero
(D)ii = λ1⁄2i, mentre
U e
V sono matrici
unitarie di dimensione
nR × nR e
nT × nT rispettivamente, le cui colonne sono (per
U) gli autovettori di
HH†, e per
V gli autovettori di
H†H.
Con tali posizioni per l’argomento di
(21.249) otteniamo
dove all’ultima eguaglianza si è invocata l’identità di cui alla nota
1219 e ricordato che
U†U = InR. Evocando ora la
disuguaglianza di Hadamard, che recita
per una matrice A semidefinita positiva risulta det(A) ≤ ∏iaii, con il segno di uguale solo se A è diagonale
osserviamo come per massimizzare la
(21.251) occorra che
InR + 1⁄σ2n D V†ΣsV D† sia diagonale. A tale scopo eseguiamo il cambio di variabile
s̃ = V†s in modo da poter scrivere
Σs̃ = E{s̃s̃†} = E{V†ss†V} = V†ΣsV
ovvero
Σs = VΣs̃V†, e quindi riformulare la
(21.251) come
che è massimo quando
InR + 1σ2n D Σs̃D† è diagonale, ovvero quando
Σs̃ lo è. Ma l’elemento
i − esimo sulla diagonale di
Σs̃ è pari all’energia per simbolo
Esi trasmesso dall’
i − esima antenna: scriviamo dunque
Σs̃ = diag(Es1, Es2, ⋯, EsnT) in modo da ottenere dalle
(21.248),
(21.251) e
(21.252)
del tutto simile alla
(21.250), tranne che ora ogni antenna trasmittente può avere un diverso
SNR per simbolo, pari a
ρi = Es σ 2n . Notiamo che all’ultimo passaggio la sommatoria arriva fino al numero
m di autovalori non nulli, in quanto per quelli nulli il contributo sarebbe stato pari a
log2(1) = 0.
21.4.1.2 Codifica a riempimento d’acqua
A questo punto non rimane che individuare la distribuzione delle potenze di trasmissione
Pi = Esifs (e dunque dei corrispondenti
SNR per simbolo
ρi = Esi⁄σ2n) tale da rendere massima
(21.253), nel rispetto del vincolo che
∑nTi = 1ρi − Es σ 2n = 0 con
Es = E{s†s} e
PT = Esfs. Si tratta quindi di un
classico problema di
ottimizzazione vincolata, da affrontare con il metodo dei moltiplicatori di Lagrange (§
9.6.1): a questo scopo definiamo la funzione
Lagrangiana L con moltiplicatore
μ come
L = ⎲⎳mi = 1 log2 (1 + ρiλi) + μ(⎲⎳mi = 1 ρi − ρT)
avendo posto
ρT = Es σ 2n , ed eguagliamone a zero le derivate rispetto ai
ρi e rispetto a
μ:
∂∂ρiL = λi1 + ρiλi + μ = 0 i = 1, 2, ⋯, m ∂∂μL = ⎲⎳mi = 1 ρi − ρT = 0
da cui
dove la seconda riga è ancora il vincolo sulla potenza. Il valore del moltiplicatore
μ si ottiene sommando
(21.254) su tutti gli
i e tenendo conto del vincolo, ovvero
in modo che dalla
(21.254) si ottenga
che come è facile verificare rispetta il vincolo, mentre la limitazione
ρi ≥ 0 ha un evidente significato fisico.
Ricordando la discussione svolta a riguardo della
(21.250), i termini
λi rappresentano i guadagni di Rayleigh dei
canali virtuali di tipo
siso di cui risulta costituito il canale
mimo. La soluzione
(21.256) è detta
a riempimento d’acqua perché, potendo essere scritta anche come
ρi + 1λi = α, impone che la somma
ρi + 1λi sia
la stessa per ogni canale, aumentando quindi la potenza (ossia l’
SNR per simbolo
ρi) laddove
1λi è minore, ovvero
λi è maggiore, ossia quando il canale virtuale
i è più
affidabile. Il senso di tale strategia è quello di affidarsi in misura maggiore ai canali migliori, e non sprecare potenza su quelli peggiori.
Sostituendo i valori forniti dalla
(21.256) per
ρi nella
(21.253) otteniamo infine
dove
ℬ è l’insieme degli indici
i per cui
1λi ≥ α = 1m ⎛⎝∑mi = 11λi + ρT⎞⎠.
Architettura di trasmissione
Dopo questa analisi così particolare, mostriamo come la stessa
svd della matrice
H = UDV† possa essere
di guida per la realizzazione di un sistema di trasmissione
mimo in grado di
approcciare la velocità per simbolo espressa dalla
(21.257). Per riuscirvi è necessario che il lato trasmittente conosca gli autovalori non nulli
λi di
HH†, la matrice
V, e la potenza di rumore
σ2n in ricezione.
A partire dalla potenza
PT a disposizione, il trasmittente valuta l’
SNR per simbolo
ρT = 1σ2n PTfs = Esσ2n = E{s†s}σ2n
da utilizzare nella
(21.255) per calcolare il valore
α, e da questo ottiene i valori
ρi come prescritto dalla
(21.256). Le ampiezze dei simboli
si da inviare alle antenne
non spente sono quindi (più o meno) amplificati in modo da ottenere
E{sis * i}σ2n = ρi come calcolato, ed il vettore di simboli
sWF così ottenuto viene moltiplicato per la matrice
V fornendo il nuovo vettore
s̃ = V sWF, i cui elementi
s̃i sono usati per generare il segnale dati che modula la portante del segnale trasmesso
realmente dalle antenne.
Dall’altro lato del collegamento (vedi fig.
21.10-a)) viene ora ricevuto il vettore
r̃ = Hs̃ + n, ma al suo posto il ricevitore prende in considerazione il prodotto di
r̃ per la matrice
U†, ottenendo così un nuovo vettore di simboli
r = U†r̃ = U†Hs̃ + U†n = U†UD V†VsWF + U†n = = D sWF + ñ
e dato che
D = diag (λ1⁄21, λ1⁄22, ⋯, λ1⁄2m) ciò equivale a ricevere
m segnali
indipendenti
ri = λ1⁄2isWFi + ñi i = 1, 2, ⋯, m
in cui
ñi ha esattamente le stesse caratteristiche statistiche (media nulla e varianza
σ2n) del valore
ni, in virtù dell’essere
U† una matrice unitaria. Pertanto in questo modo il ricevitore
vede direttamente gli
m canali virtuali, tutti di tipo
siso.
Esempio Per un canale
mimo con
H = ⎡⎢⎣ .1 .3 .7 .5 .4 .1 .2 .6 .8 ⎤⎥⎦ si ottiene una
svd H = UDV† pari a
H = ⎡⎢⎢⎢⎣ − .555 .3764 − .7418 − .3338 − .9176 − .2158 − .7619 .1278 .6349 ⎤⎥⎥⎥⎦⎡⎢⎢⎢⎣ 1.3333 0 0 0 0.5129 0 0 0.0965 ⎤⎥⎥⎥⎦⎡⎢⎢⎢⎣ − .2811 − .7713 − .5710 − .5679 − .3459 .7469 − .7736 .5342 − .3408 ⎤⎥⎥⎥⎦
. Notiamo che i canali virtuali presentano guadagni molto differenti, ed in particolare il terzo (
λ1⁄23 = 0.0965, dunque
λ3 ≃ 0.009) produrrà un contributo alla capacità
(21.257) trascurabile, ed in base alla
(21.256) si vedrà allocata una potenza di molto ridotta.
Considerazioni applicative
La diseguale distribuzione della potenza disponibile tra le antenne di trasmissione permette di raggiungere velocità più elevate di quanto possibile per una distribuzione uniforme, ma richiede la conoscenza da parte del trasmettitore di informazioni relative al canale mimo, dette channel status information (csi), che devono essere stimate dal lato ricevente. Nel caso di una trasmissione half-duplex in cui le parti si scambiano alternativamente di ruolo utilizzando la medesima frequenza portante può essere sfruttata la reciprocità della matrice H, e dunque ognuna delle due parti effettua la stima per proprio conto. Ciò non è possibile qualora la trasmissione sia di tipo full-duplex, rendendo necessario comunicare la csi da ricevente a trasmittente, con due inconvenienti: il primo è che per evitare l’impegno di una eccessiva banda a ritroso tale informazione deve necessariamente essere quantizzata, introducendo errori che possono inficiare i benefici legati alla conoscenza della csi da parte del trasmittente; il secondo è che in caso di mobilità la velocità di variazione del canale mimo può essere troppo elevata rispetto ai tempi necessari alla stima della csi ed alla sua trasmissione, con il rischio di introdurre errori anche per questo motivo.
Rispetto al miglioramento di prestazioni, come già osservato esso dipende dalla particolare realizzazione della matrice H, dal suo rango, e dalla distribuzione degli autovalori. Il miglioramento inoltre diminuisce all’aumentare dell’SNR di ricezione, sino a (di fatto) annullarsi per SNR > 30 dB. Per bassi valori di SNR il miglioramento è invece sensibile, fino a più che raddoppiare il valore di capacità per SNR < 0 dB.