jointly optimal sensing and resource allocation for overlay cognitive radios

1

S

Jointly Optimal Sensing and

Resource AllocationOverlay Cognitive Radio Networks

Luis Miguel López Ramos

2

Índice

Introducción. Objetivos

Modelado del sistema y planteamiento del problema

Solución del problema Asignación de potencia Acceso óptimo Detección óptima del PU. Programación dinámica

Resultados

3

Modelo de CR celular

Secondary Network

Primary Network

Cognitive Radio: Estrategias para aprovechar el espectro inutilizado

4

CR: Underlay vs. Overlay

Objetivo CR: limitar la interferencia del usuario secundario (SU) al usuario primario (PU)

Underlay CR: mantener la potencia instantánea de las transmisiones del SU por debajo de cierto umbral

Overlay CR: el SU transmite con toda la potencia disponible, pero sólo en los slots en que el PU está inactivo El SU necesita conocer en qué slots el canal

está libre

5

Motivación

Los algoritmos de asignación dinámica de recursos contribuyen a mejorar la eficiencia de los sistemas de comunicaciones móviles. [Hayes 67]

En los últimos 5-10 años se han beneficiado del uso de herramientas de optimización avanzadas

Los mecanismos de asignación de recursos permiten aprovechar al máximo el canal, controlando unos recursos, o variables a optimizar, en función del estado del canal, cumpliendo una serie de restricciones

6

En sistemas en los que la capacidad de detección es limitada, el sensado se puede considerar una variable más a asignar

El diseño de la asignación de recursos y el esquema de detección deben realizarse de forma conjunta

Antecedentes: [Kim 11], [Wang 10], [Zhao 08]

Motivación

7

Diseño conjunto de los esquemas de sensado, asignación de potencia y acceso al canal

La estrategia para resolver el problema tendrá dos fases:1. Diseñar de forma óptima la asignación de potencia

+ acceso (RA) para cualquier esquema de detección dado

2. Basándonos en la RA óptima obtenida en la fase 1, diseñar el esquema de sensado óptimo

Objetivo

8

zk = 0

Modelo del sistema

Red primaria: Correlación temporal

Modelo de ocupación de Gilbert-Elliot

Independencia entre canales

Requiere que la probabilidad de ser interferido por la red secundaria sea menor que un umbral

No colabora con la red secundaria Errores en la detección de la

presencia del usuario primario: PMD, PFA

Conocimiento probabilístico de la SIPN (State Information of the Primary Network)

zk = 1

PFA

PMD

1 – PFA

1 – PMD

PFA = Pr{zk=1|ak=0}PMD = Pr{zk=0|ak=1}

9

Modelo del sistema

Red secundaria: M usuarios, K canales Sistema celular con acceso ortogonal. Capacidad para adaptar scheduling, potencia y modulación Rayleigh Fading, i.i.d. se conoce de forma determinista al

inicio de cada slot de tiempo Conocimiento perfecto de la SISN (State Information of the

Secondary Network)

La BS realiza la tarea de sensar el canal para detectar la presencia del PU Sensar el canal k tiene un coste ξk

10

SIPN vs. SISN

Time (ms)

Time (ms)

11

Time (ms)

Time (ms)

SIPN vs. SISN

12

Modelo del sistema (II)

13

Formulación del problema

Variables a optimizar: potencia pkm, acceso (scheduling) wk

m, sensado sk (wk

m y sk pueden verse como binarias –indicadores-)

Otras variables: variables de estado i={h,a}, tasa Ckm (función de

pkm e i)

i varía con el tiempo pkm, Ck

m, wkm, sk, varían con el tiempo

Objetivo: max. tasa de transmisión:

Restricciones:

Potencia media por usuario

Prob. de interferencia al PU

Ortogonalidad

Coste de sensado (detección)

14

Asignación de potencia

La asignación de recursos es un problema convexo, utilizamos dualidad para resolverlo.

Dados un esquema de detección y acceso fijos, la asignación de potencia óptima es:

Nos permite definir un LQI (Link Quality Indicator) para (m,k):

Depende del canal SI y del multiplicador (QoS)

15

Acceso óptimo

Sin tener en cuenta la restricción de prob. de interferencia, el acceso óptimo:

Teniendo en cuenta la restricción de prob. de interferencia (la asignación de potencia no cambia):

Pero ak (ocupación del primario en el canal k ) no se conoce perfectamente…

Winner-takes-all !

16

Acceso óptimo

SIPN imperfecta

Si definimos

b[n]=[Pr(ak[n]=0); Pr(ak[n]=1)] se calcula recursivamente Predicción / corrección Predicción: basada en modelo de Gilbert-Elliot Corrección: a partir de medidas del sensor para los instantes en

los que efectivamente se ha sensado

17

Variables duales

Existen distintos esquemas para calcular los multiplicadores de Lagrange (variables duales).

En nuestro caso: actualización online de los multiplicadores mediante gradiente estocástico:

Ventajas del gradiente estocástico: baja complejidad, adaptativo, …μes un tamaño de paso. Existe un trade-off entre: velocidad de convergencia y pérdida de optimalidad

18

Sensado óptimo

Hasta ahora: sensado dado Ahora: optimizamos sensado

La info. resultante del sensado en el instante n: Es útil para instantes posteriores (correlación temporal de la

SIPN) Si no se sensa, la SIPN se va desactualizando (más

incertidumbre)

Errores en el sensado; no sensamos siempre conocimiento probabilístico del estado de ocupación (belief )

Existe un trade-off entre coste de detección (conocido) y beneficio esperado en instantes posteriores (a estimar) Requiere el uso de Programación Dinámica (DP)

19

Programación dinámica (DP)

Técnicas para resolver problemas en los que las decisiones en un instante tienen repercusión en el futuro El algoritmo de Viterbi es un ejemplo clásico de DP Procesos de decisión de Markov (MDP) Nuestro problema de detección es similar a un MDP

parcialmente observable (POMDP)

Problemas exponencialmente complejos (intratables computacionalmente) Algoritmos aproximados [Bertsekas, Powell]

20

Hallando la política de sensado

Función objetivo: Valor esperado Antes horizonte infinito, ahora finito Factor de descuento γ Utilizamos la solución óptima obtenida anteriormente (Rk

m)

Para hacerlo más fácil solución para un usuario y un canal:

Función de valor:

Presente Futuro

Sensado Lagrangiano RA

21

Multiusuario, multicanal

Extensión a varios usuarios: El acceso de los SU es ortogonal Winner-takes-all Equivale a dar acceso a un solo usuario cuyo LQI se

distribuye como el máximo de los LQI de los usuarios reales

Extensión a varios canales: Inmediata si asumimos que no existe correlación entre la

SIPN de varios canales Calcular una política de sensado independiente para cada

canal

22

Resultados

23

Resultados

Regiones de decisión:

Sensor S1(baja calidad):

Sensor S2(alta calidad):

24

Conclusiones

Diseño conjunto de RA y Sensado: dos fases

Sistema de CR SI heterogénea

Para explotar la correlación temporal DP

Trabajo futuro: Correlación de la ocupación entre usuarios primarios Restricciones de sensado más complejas Algoritmos de baja complejidad para calcular Vn(b)

Extensión a sistemas underlay

25

Gracias por vuestra atención

jointly optimal sensing and resource allocation for overlay cognitive radios

Technology

s errores en

s dados

s restricciones

s requiere

s en los ltimos

pu s ortogonalidad s

s potencia media por

pu s sensar