jointly optimal sensing and resource allocation for overlay cognitive radios
TRANSCRIPT
1
S
Jointly Optimal Sensing and
Resource AllocationOverlay Cognitive Radio Networks
Luis Miguel López Ramos
2
Índice
Introducción. Objetivos
Modelado del sistema y planteamiento del problema
Solución del problema Asignación de potencia Acceso óptimo Detección óptima del PU. Programación dinámica
Resultados
3
Modelo de CR celular
Secondary Network
Primary Network
Cognitive Radio: Estrategias para aprovechar el espectro inutilizado
4
CR: Underlay vs. Overlay
Objetivo CR: limitar la interferencia del usuario secundario (SU) al usuario primario (PU)
Underlay CR: mantener la potencia instantánea de las transmisiones del SU por debajo de cierto umbral
Overlay CR: el SU transmite con toda la potencia disponible, pero sólo en los slots en que el PU está inactivo El SU necesita conocer en qué slots el canal
está libre
5
Motivación
Los algoritmos de asignación dinámica de recursos contribuyen a mejorar la eficiencia de los sistemas de comunicaciones móviles. [Hayes 67]
En los últimos 5-10 años se han beneficiado del uso de herramientas de optimización avanzadas
Los mecanismos de asignación de recursos permiten aprovechar al máximo el canal, controlando unos recursos, o variables a optimizar, en función del estado del canal, cumpliendo una serie de restricciones
6
En sistemas en los que la capacidad de detección es limitada, el sensado se puede considerar una variable más a asignar
El diseño de la asignación de recursos y el esquema de detección deben realizarse de forma conjunta
Antecedentes: [Kim 11], [Wang 10], [Zhao 08]
Motivación
7
Diseño conjunto de los esquemas de sensado, asignación de potencia y acceso al canal
La estrategia para resolver el problema tendrá dos fases:1. Diseñar de forma óptima la asignación de potencia
+ acceso (RA) para cualquier esquema de detección dado
2. Basándonos en la RA óptima obtenida en la fase 1, diseñar el esquema de sensado óptimo
Objetivo
8
zk = 0
Modelo del sistema
Red primaria: Correlación temporal
Modelo de ocupación de Gilbert-Elliot
Independencia entre canales
Requiere que la probabilidad de ser interferido por la red secundaria sea menor que un umbral
No colabora con la red secundaria Errores en la detección de la
presencia del usuario primario: PMD, PFA
Conocimiento probabilístico de la SIPN (State Information of the Primary Network)
zk = 1
PFA
PMD
1 – PFA
1 – PMD
PFA = Pr{zk=1|ak=0}PMD = Pr{zk=0|ak=1}
9
Modelo del sistema
Red secundaria: M usuarios, K canales Sistema celular con acceso ortogonal. Capacidad para adaptar scheduling, potencia y modulación Rayleigh Fading, i.i.d. se conoce de forma determinista al
inicio de cada slot de tiempo Conocimiento perfecto de la SISN (State Information of the
Secondary Network)
La BS realiza la tarea de sensar el canal para detectar la presencia del PU Sensar el canal k tiene un coste ξk
10
SIPN vs. SISN
Time (ms)
Time (ms)
11
Time (ms)
Time (ms)
SIPN vs. SISN
12
Modelo del sistema (II)
13
Formulación del problema
Variables a optimizar: potencia pkm, acceso (scheduling) wk
m, sensado sk (wk
m y sk pueden verse como binarias –indicadores-)
Otras variables: variables de estado i={h,a}, tasa Ckm (función de
pkm e i)
i varía con el tiempo pkm, Ck
m, wkm, sk, varían con el tiempo
Objetivo: max. tasa de transmisión:
Restricciones:
Potencia media por usuario
Prob. de interferencia al PU
Ortogonalidad
Coste de sensado (detección)
14
Asignación de potencia
La asignación de recursos es un problema convexo, utilizamos dualidad para resolverlo.
Dados un esquema de detección y acceso fijos, la asignación de potencia óptima es:
Nos permite definir un LQI (Link Quality Indicator) para (m,k):
Depende del canal SI y del multiplicador (QoS)
15
Acceso óptimo
Sin tener en cuenta la restricción de prob. de interferencia, el acceso óptimo:
Teniendo en cuenta la restricción de prob. de interferencia (la asignación de potencia no cambia):
Pero ak (ocupación del primario en el canal k ) no se conoce perfectamente…
Winner-takes-all !
16
Acceso óptimo
SIPN imperfecta
Si definimos
b[n]=[Pr(ak[n]=0); Pr(ak[n]=1)] se calcula recursivamente Predicción / corrección Predicción: basada en modelo de Gilbert-Elliot Corrección: a partir de medidas del sensor para los instantes en
los que efectivamente se ha sensado
17
Variables duales
Existen distintos esquemas para calcular los multiplicadores de Lagrange (variables duales).
En nuestro caso: actualización online de los multiplicadores mediante gradiente estocástico:
Ventajas del gradiente estocástico: baja complejidad, adaptativo, …μes un tamaño de paso. Existe un trade-off entre: velocidad de convergencia y pérdida de optimalidad
18
Sensado óptimo
Hasta ahora: sensado dado Ahora: optimizamos sensado
La info. resultante del sensado en el instante n: Es útil para instantes posteriores (correlación temporal de la
SIPN) Si no se sensa, la SIPN se va desactualizando (más
incertidumbre)
Errores en el sensado; no sensamos siempre conocimiento probabilístico del estado de ocupación (belief )
Existe un trade-off entre coste de detección (conocido) y beneficio esperado en instantes posteriores (a estimar) Requiere el uso de Programación Dinámica (DP)
19
Programación dinámica (DP)
Técnicas para resolver problemas en los que las decisiones en un instante tienen repercusión en el futuro El algoritmo de Viterbi es un ejemplo clásico de DP Procesos de decisión de Markov (MDP) Nuestro problema de detección es similar a un MDP
parcialmente observable (POMDP)
Problemas exponencialmente complejos (intratables computacionalmente) Algoritmos aproximados [Bertsekas, Powell]
20
Hallando la política de sensado
Función objetivo: Valor esperado Antes horizonte infinito, ahora finito Factor de descuento γ Utilizamos la solución óptima obtenida anteriormente (Rk
m)
Para hacerlo más fácil solución para un usuario y un canal:
Función de valor:
Presente Futuro
Sensado Lagrangiano RA
21
Multiusuario, multicanal
Extensión a varios usuarios: El acceso de los SU es ortogonal Winner-takes-all Equivale a dar acceso a un solo usuario cuyo LQI se
distribuye como el máximo de los LQI de los usuarios reales
Extensión a varios canales: Inmediata si asumimos que no existe correlación entre la
SIPN de varios canales Calcular una política de sensado independiente para cada
canal
22
Resultados
23
Resultados
Regiones de decisión:
Sensor S1(baja calidad):
Sensor S2(alta calidad):
24
Conclusiones
Diseño conjunto de RA y Sensado: dos fases
Sistema de CR SI heterogénea
Para explotar la correlación temporal DP
Trabajo futuro: Correlación de la ocupación entre usuarios primarios Restricciones de sensado más complejas Algoritmos de baja complejidad para calcular Vn(b)
Extensión a sistemas underlay
25
Gracias por vuestra atención