g. goch, s. simon1 g. goch und s. simon modellierung kohärenter streulicht- messprozesse für...
TRANSCRIPT
G. Goch, S. Simon 1
G. Goch und S. Simon
Modellierung kohärenter Streulicht-Messprozesse für deterministische Nanostrukturen und stochastische
Oberflächendefekte
Hochschule Bremen Fachgebiet Mess-, Steuerungs- und Regelungstechnik
G. Goch, S. Simon 2
Gliederung
1. Einleitung - Ziel: Neue Entwurfsmethodik für Streulicht-Messprozesse basierend auf Computer-Simulationen
2. Modellierungsansatz für Streulicht, Oberflächen, Aufbau
3. Algorithmenentwurf, Simulation Herausforderung: Rechenzeit ~ PC: Tage bis Monate
4. Gewählter Lösungsansatz für das Hardware/Software-System (HW/SW-System) 5. Zusammenfassung
G. Goch, S. Simon 3
Streulichtmessverfahren
Optische Verfahren für die Oberflächen-Charakterisierung
Angle Resolved Scattering
Reflexionsmessung
Total Integrated Scattering
Diffuseness Measurement
Konventionelle Streulichtverfahren
Speckle-Verfahren
winkelabhängig
Speckle-Korrelation
Specklemuster-Beleuchtung
Speckle-Kontrast
wellenlängenabhängig
Speckle-Korrelation
wellenlängenabhängig
G. Goch, S. Simon 4
Polychromatisches Streulichtmess-Verfahren für Rauheitsmessungen
PolychromatischeLichtquelle(Laser / LED)
Raue Oberfläche
Linse
Strahlteiler
f
Rauheitsabhängige Speckle-Elongation
Speckle-Muster
CCD-Kamera
Chip
G. Goch, S. Simon 5
Computer-Simulation von Streulichtmessprozessen
Computer-Simulationen
Mess-Objekte, (Messaufbau)
Wochen, Monate
Stunden!, Tage
Simula-tionen
Neue Auswerteverfahren
Neue Oberflächentypen: Strukturen u. Mikrotopographien:
PolychromatischeLichtquelle(Laser / LED)
Raue Oberfläche
Linse
Strahlteiler
f
Speckle-MusterCCD-
Kamera
Chip
G. Goch, S. Simon 6
Entwurfsmethodik für Streulicht-Messprozesse
Experiment(Messtechnik)
Theorie(Optik, Signal-verarbeitung)
DFG-Projekt
Computer-Simulationen
G. Goch, S. Simon 7
FilterungSkalierung
Simulationsmodell - Oberflächenmodell
Oberflächenmodell(Höhe in nm)
Zufallswerte (normalverteilt)
x-Position
y-Position
0
5
x-Position
y-Position
3000
0
G. Goch, S. Simon 8
Simulationsmodell - Streufeldmodell
xdxy
),( yxh
Beleuchtung
1
0
Amplitudenverteilung S0(x,y)
)b/ya/x-(0
2222
ey)(x,S a , b: Durchmesser des Leuchtflecks
G. Goch, S. Simon 9
Simulationsmodell - Streufeldmodell
xdxy
),( yxh
Op
tisch
e A
chse Specklebild
φγ
Gangunterschied derTeilwellen:
),(2
sin
sin
yxh
dyy
dxxl
G. Goch, S. Simon 10
Simulationsmodell - Streufeldmodell
xdxy
),( yxh
Op
tisch
e A
chse Specklebild
φγ
Phasendifferenz derTeilwellen:
l 2
G. Goch, S. Simon 11
Simulationsmodell - Streufeldmodell
xdxy
),( yxh
Op
tisch
e A
chse Specklebild
φγ
Elektisches Feldin einem Pixel:
ny
y
nx
x
jeyxS
E
1 10 ),(
),(
nx,ny: Anzahl FE
G. Goch, S. Simon 12
Simulationsmodell - Streufeldmodell
xdxy
),( yxh
Op
tisch
e A
chse Specklebild
φγ
Bestrahlungstärkein einem Pixel:
2),(~),( EI
G. Goch, S. Simon 13
BerechnungsaufwandBerechnungsaufwand für: • Flächenelemente: 100x100 FE• Bildgröße: 768x576 Pixel• Anzahl der Bilder: 3 (Wellenlängen)
GOP0001OP10~
2443576768100OP#12
/2
SINCOSMULADD
Bildgröße Anzahl λ
AnzahlverschiedenerOperationen
FE
mit Pentium 4 / 3GHz (0,5 GOPS) 33 min
FE: FlächenElementOP: OPerations
GOP: GigaOPerationsGOPS: GigaOPerations per Second
G. Goch, S. Simon 14
Berechnungsaufwand
Mit Anzahl der FE / Kante steigt der Rechenaufwand quadratisch
Anzahl FE Simulationszeit
100 x 1001000 x 1000
10000 x 10000
für Test:minimal:
gewünscht:
0,5 h2 d
200 d
G. Goch, S. Simon 15
Hardware-Beschleunigung FPGAs = Field Programmable Gate ArrayQuantitativer
Leistungssprung:• 430 MioTransistoren (Pentium4 ~ 55Mio)
QualitativerLeistungssprung:• Plattform FPGAs: 440 Multiplizierer+ 4 P-Kerne + RAM
Parallelität:
Realisierung auf Addierer-Ebene
G. Goch, S. Simon 16
Hardware
System
Operationen / FE / PixelZeit / FE / Pixel
in ns
Bearbeitungszeit / Bild
Kosten
/Ta
use
nd
€ADD MUL COS 100x100 FE
1e3x1e3 FE
1e4x1e4 FE
Pentium
4 / 3 GH
z
MatLab4
(0,58)
4
(0,37)
2
(0,006)351 78 min 5,4 d 1,5 y
0,5
…
1
C
(FP)
4
(0,44)
4
(0,17)
2
(0,023)120 27 min 1,8 d 184 d
C
(INT)
82
(1,16)
4
(0,17)94 21 min 1,4 d 144 d
PC-Cluster
278 PCsC (INT)
82
(322)
4
(47)0,34 4,5 s 8 min 12,5 h
~ 100CPU,MB
,RAM
FPGA XC2VP100
52
(165)
4
(165)0,34 4,5 s 8 min 12,5 h 10
Rechenzeitevalution
Faktor 300…1000
G. Goch, S. Simon 17
Hardware
System
Zeit /ns FE / Pixel
Bearbeitungszeit / BildKosten/ Tausend
€100x100 FE 1e3x1e3 FE 1e4x1e4 FE
Pentium
4 / 3 GH
z
MatLab 351 78 min 5,4 d 1,5 y
0,5
…
1
C
(FP)120 27 min 1,8 d 184 d
C
(INT)94 21 min 1,4 d 144 d
PC-Cluster
278 PCsC (INT)
0,34 4,5 s 8 min 12,5 h~ 100
CPU,MB,RAM
FPGA XC2VP100
0,34 4,5 s 8 min 12,5 h 10
Rechenzeitevalution
Faktor 300…1000
G. Goch, S. Simon 18
Modelle und Bildgenerierung
PC
Übertragbarkeit des Systems
FPGA – Karte
• Einfacherer Systemaufbau im Vergleich zu PC-Clustern
• Einfache Systemreplikation:Frei zugängliches Simulationswerkzeug für die Wissenschaftzum Entwurf durch Systemsimulation von Messanordungen.
FPGA(XC2VP100)
SW
HW
G. Goch, S. Simon 19
MatLabPC
(3GHz,P4)
FPGA
Virtex 2
FPGA
Virtex 4
Speed[GMACS] 0,21 0,26 30 256
Zukünftige Performance
GMACS = Giga multiply and accumulate operations per second
AngekündigtIm Testeinsatz
Hardware-System mit 10 FPGAs : 2.560 GMACS
G. Goch, S. Simon 20
Zusammenfassung: Interdisziplinäres Projekt
Approximationen
AlgorithmenModelleOptik,Physik
Digitale Signalverarbeitung
Messtechnik Technische Inf. / Elektrotechnik
FPGA-Plattform-Architekturen
(Beschleunigungs-Faktor 300..1000)
- Optimierte Architekturen von Co-Prozessor-Arrays- Konzepte zur Datenkommuni- kation für die hohe Bandbreiten in Mehr-Prozessorsystemen
Software
- Neue Entwurfs- Methodik für Streulicht-Messpro- zesse basierend auf Simulationen.
Ergebnisse:
Prozessor-Architekturen
Ergebnisse:- HW/SW-Plattform
zur Simulation optischer Systeme,
verfügbar für andereForschergruppen.