praktiske erfaringer med cray...

9
Omtale af mikrodatamater En række af de mikrodatamater, som specielt har interesse for UNI-C's brugere, og som er opstiIlet i centerets demonstrationslokale for mikroda- tamater , har igennem tiden været om- talt her i Kontakt (tidligere RECKU- NYT). Her følger en oversigt over, hvilke numre, der har været tale om: Sperry PC Apple Macintosh RC Partner Olivetti M24 Scandis IBM PC og AT NCR 4i 12 : RECKU NYT 139. : RECKU NYT 139. : RECKU NYT 140. : RECKU NYT 141. : RECKU NYT 143. : RECKU NYT 146. : RECKU NYT 147. Per Andersen lIlL Mikrodatamatvagten etableret igen Efter en periode, hvor mikrodatamat-gruppen ikke har haft den daglige vagt i vores demon- strationslokale og telefonvagt, er denne ord- ning nu etableret igen. Fremover vil der hver dag mellem 15.00 og 16.00 være en person fra mikrodatamat-grup- pen til stede i demonstrationslokalet med mi- krodatamater på I. sal. Vagten vil være i stand til at gi ve »førstehjælp« i form af kort vejled- ning til de enkelte maskiner. Desuden vil der hos vagten kunne træffes aftale om konsulen- tassistanee fra faggruppens medlemmer. Ligeledes er telefonvagten igen etableret. Det bet yder , at telefoniske henvendeh,er til mikrodatamat-gruppen bedes foretaget daglig mellem kl. 15.00 og 16.30. Per Andersen KONTAKT - nr. 2 - april 1986 PRAKTISKE ERFARINGER MED CRAY VEKTORPROCESSORER Forfatteren peger også mulige danske løsninger Dette indlæg fra lie.scient. Ole Holm Nielsen, Nordisk /nstitut for Teoretisk Atomfysik (NORD/TA), indgår i rækken af artikler om vektorprocessorer Som et indlæg i overvejelserne om dansk anskaffelse af vektor-bereg- nings faciliteter berettes her om kon- krete erfaringer med anvendelse af CRA Y vektorprocessorer. Det er hå- bet at mine problemer og erfaringer kan bidrage til en detaljeret vurdering af hvorledes vektorprocessorer bør implementeres som en generei facilitet i Danmark. Ligeledes håber jeg at potentielIe og nuværende CRAY- brugere i Danmark kan hente nyttige oplysninger herfra. l ca. halvandet år har jeg benyttet vektorprocessorer i mit arbejde, som består i teoretisk beskrivelse af faste stoffers fysik ved hjælp af numerisk løsning af den såkaldte Schrødinger- ligning. Dette arbejdsfelt har i de sid- ste 10 år udviklet væsentligt mere avancerede teoretiske såvel som nu- meriske metoder, som muliggør be- skrivelse af nye aspekter ved. faste stoffer. Kravene til EDB-kapacitet er vokset i takt hermed, således at man har bevæget sig fra at benytte de tra- ditionelIe regnecentre over maskiner af typen VAX-1l1780, og nu står i den situation at tidens hurtigste ma- skiner, vektorprocessorerne, ofte er KONTAKT nr. 2 - april 1986 nødvendige for at kunne frembringe nye forskningsresultater. Dette ma- nifesterer sig ved at mange skaffer sig adgang til sådanne faciliteter. Jeg vil således anslå at omkring 750/0 af mine kolleger i Europa og USA benytter sig af CRAY vektorprocessorer, mens nogle få har »attached processors« forbundet med en VAX, eller har ad- gang til en Control Data Cyber 205. Mine erfaringer stammer dels fra en CRAY -1 installer et hos SAAB- SCANIA i Linkoping, dels fra en CRAY -1 Sved Bcole Polytechnique nær Paris. I begge tilfælde opnåedes adgangen ved samarbejdsprojekter med kolleger i de respektive lande. Jeg skal opdele erfaringerne i den fy- siske adgangsmulighed og i de ind- høstede erfaringer ved at benytte en CRA Y vektorprocessor. . Fysisk adgangsmulighed Den svenske CRAY -1 er tilgængelig via det svenske naturvidenskabelige forskningsråds (NFR) aftale med SAAB-SCANIA, hvor maskinen i perioder kan benyttes til civil forsk- ning, mens hovedparten af tiden an- vendes til klassificerede formål. 13

Upload: phamxuyen

Post on 26-Dec-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: PRAKTISKE ERFARINGER MED CRAY …folk.ntnu.no/klv/IT-historie-ntnu/IT-historien-1980-tallet/Cray/... · SCANIA i Linkoping, dels fra en CRAY -1 Sved Bcole Polytechnique nær Paris

Omtale af mikrodatamater

En række af de mikrodatamater, som specielt har interesse for UNI-C's brugere, og som er opstiIlet i centerets demonstrationslokale for mikroda­tamater , har igennem tiden været om­talt her i Kontakt (tidligere RECKU­NYT). Her følger en oversigt over, hvilke numre, der har været tale om:

Sperry PC Apple Macintosh RC Partner Olivetti M24 Scandis IBM PC og AT NCR 4i

12

: RECKU NYT 139. : RECKU NYT 139. : RECKU NYT 140. : RECKU NYT 141. : RECKU NYT 143. : RECKU NYT 146. : RECKU NYT 147.

Per Andersen

lIlL

Mikrodatamatvagten etableret igen

Efter en periode, hvor mikrodatamat-gruppen ikke har haft den daglige vagt i vores demon­strationslokale og telefonvagt, er denne ord­ning nu etableret igen.

Fremover vil der hver dag mellem 15.00 og 16.00 være en person fra mikrodatamat-grup­pen til stede i demonstrationslokalet med mi­krodatamater på I. sal. Vagten vil være i stand til at gi ve »førstehjælp« i form af kort vejled­ning til de enkelte maskiner. Desuden vil der hos vagten kunne træffes aftale om konsulen­tassistanee fra faggruppens medlemmer.

Ligeledes er telefonvagten igen etableret. Det bet yder , at telefoniske henvendeh,er til mikrodatamat-gruppen bedes foretaget daglig mellem kl. 15.00 og 16.30.

Per Andersen

KONTAKT - nr. 2 - april 1986

PRAKTISKE ERFARINGER MED CRAY VEKTORPROCESSORER Forfatteren peger også på mulige danske løsninger

Dette indlæg fra lie.scient. Ole Holm Nielsen, Nordisk /nstitut for Teoretisk Atomfysik (NORD/TA), indgår i rækken af artikler om vektorprocessorer

Som et indlæg i overvejelserne om dansk anskaffelse af vektor-bereg­nings faciliteter berettes her om kon­krete erfaringer med anvendelse af CRA Y vektorprocessorer. Det er hå­bet at mine problemer og erfaringer kan bidrage til en detaljeret vurdering af hvorledes vektorprocessorer bør implementeres som en generei facilitet i Danmark. Ligeledes håber jeg at potentielIe og nuværende CRAY­brugere i Danmark kan hente nyttige oplysninger herfra.

l ca. halvandet år har jeg benyttet vektorprocessorer i mit arbejde, som består i teoretisk beskrivelse af faste stoffers fysik ved hjælp af numerisk løsning af den såkaldte Schrødinger­ligning. Dette arbejdsfelt har i de sid­ste 10 år udviklet væsentligt mere avancerede teoretiske såvel som nu­meriske metoder, som muliggør be­skrivelse af nye aspekter ved. faste stoffer. Kravene til EDB-kapacitet er vokset i takt hermed, således at man har bevæget sig fra at benytte de tra­ditionelIe regnecentre over maskiner af typen V AX-1l1780, og nu står i den situation at tidens hurtigste ma­skiner, vektorprocessorerne, ofte er

KONTAKT nr. 2 - april 1986

nødvendige for at kunne frembringe nye forskningsresultater. Dette ma­nifesterer sig ved at mange skaffer sig adgang til sådanne faciliteter. Jeg vil således anslå at omkring 750/0 af mine kolleger i Europa og USA benytter sig af CRAY vektorprocessorer, mens nogle få har »attached processors« forbundet med en V AX, eller har ad­gang til en Control Data Cyber 205.

Mine erfaringer stammer dels fra en CRAY -1 installer et hos SAAB­SCANIA i Linkoping, dels fra en CRAY -1 Sved Bcole Polytechnique nær Paris. I begge tilfælde opnåedes adgangen ved samarbejdsprojekter med kolleger i de respektive lande. Jeg skal opdele erfaringerne i den fy­siske adgangsmulighed og i de ind­høstede erfaringer ved at benytte en CRA Y vektorprocessor. .

Fysisk adgangsmulighed

Den svenske CRAY -1 er tilgængelig via det svenske naturvidenskabelige forskningsråds (NFR) aftale med SAAB-SCANIA, hvor maskinen i perioder kan benyttes til civil forsk­ning, mens hovedparten af tiden an­vendes til klassificerede formål.

13

Page 2: PRAKTISKE ERFARINGER MED CRAY …folk.ntnu.no/klv/IT-historie-ntnu/IT-historien-1980-tallet/Cray/... · SCANIA i Linkoping, dels fra en CRAY -1 Sved Bcole Polytechnique nær Paris

CRAY'en har som frontends et antal VAX-111780, hvoraf en benyttes til NFR-projekter. Kombinationen af VAX'ens brugervenlighed, CRAY'­ens regnekraft og den fornuftige grænseflade mellem de to maskiner gør dette system til det mest slagkraf­tige som jeg til dato har benyttet til udførelse af store videnskabelige be­regninger. Terminaler til NFR's VAX findes i særlige rum ved de svenske universiteter, hvortil sikkerhedspro­cedurer mod misbrug er udtænkt. Således er adgang til CRAY fra Dan­mark ikke tilladt. Adgang til CRAY fra VAX'en er kun mulig i 15 + 30+ 15 minutter (!) hver dag, samt fra 23-07 på hverdagsnætter og ca. 15-07 i weekender. Desværre er adskillige af de opstillede terminaler af forældet type, og kommunikation med 1200175 baud modemer hæm­mer yderligere brugeren. Udskrifter kan tilsendes med post, og modtages 2-4 dage efter kørslen.

Det lykkedes mig kun i begrænset omfang at udføre beregninger på den­ne maskine, grundet de omtalte sik­kerhedsmæssige restriktioner . For det første er det umuligt at udføre pro­duktionskørsler fordelt over mange måneder, når arbejdet kræver kend­skab til forudgående resultater førend nye kørsler kan påbegyndes, og når fx en times adgang til V AX nødvendig­gør at det meste af en arbejdsdag til­bringes med at rejse til/fra Sverige. For det andet er det overordentlig vanskeligt at foretage programæn­dringer, fx for bedre at udnytte vek-

14

tor-faciliteter eller for at rette fejl, når CRAY reelt kun er tilgængelig om natten og i weekends.

Den franske CRAY-IS har vist sig langt mere fordelagtig at anvende i praksis, idet ingen restriktioner på­lægges de godkendte brugere. Som frontend benytter jeg et regnecenter med IBM-MVS styresystem, hvortil adgang sker ved telefonopkald til de offentlige datanetværk (en X.25 for­bindelse mellem P&T's DATAPAK og det franske TRANSPAC) direkte fra en mikrocomputer ved mit kon­tor. Driftssikkerheden har vist sig særdeles god, og transmissionshastig­heden 1200 baud er tilstrækkelig til produktionskørsler og begrænset programudvikling.

CRAY er tilgængelig døgnet rundt, bortset fra et par timer hvor de franske vejrprognoser udarbejdes. Batch-kørsler på 10-60 CPU sekunder afvikles normalt omgående, mens kørsler på 5-10 minutter og derover afvikles aften og nat. Udskrifter kan vises interaktivt, og kan sendes med post i løbet af 4-5 dage. Idecember 1985 blev det iøvrigt muligt at udvek­sle filer mellem den franske fron­tend-maskine og danske regnecentre (fx UNI -C) via EARN-nettet, omend tilslutningen i Paris endnu ikke fun­gerer pålideligt. EARN vil givet for­bedre muligheden for at hjemtage ud­skrifter og udsende opdaterede pro­grammer betydeligt. Jeg mener dog at man ikke kan undvære muligheden for interaktiv forbindelse med CRAY'ens frontend, idet fejlretning

KO' <T - nr. 2 - april 1986

\1

og programændringer fordrer en høj grad af interaktion. Desuden har frontend-maskinen endnu ikke nogen mulighed for »remote job entry« til/ fra CRAY.

På denne CRAY -1 S har jeg udført omfattende beregninger. Produk­tionskørsler kan analyseres hver mor­gen, og nye kan stilles i kø i dagens løb, ligesom evt. problemer omgåen­de kan løses ved korte prøvekørsler. Denne arbejdsmåde er ret effektiv set som mængden af produktionskørsler pr. investeret mandtime. Naturligvis er det betydeligt mere effektivt at ar­bejde i fysisk nærhed af CRAY, hvor høj datatransmissions-hastighed og omgående adgang til større udskrifter er mulig. Derfor må jeg med mellem­rum foretage rejser til Frankrig, når større ændringer og tilføjelser til programmerne skal installeres. Denne rejseaktivitet mener jeg er et uund­værligt led i langdistance-anvendelse af EDB-faciliteter, sålænge man ikke råder over forbindelser med høj hastighed.

Praktiske erfaringer med CRAY

Jeg skal nu vende mig til at beskrive erfaringer med at afvikle store viden­skabelige kørsler på en CRAY ma­skine. CRAY'en er kendetegnet ved en særdeles høj regnehastighed. An­tallet af flydende-tals regninger (med 64 bit, eller ca. 14 eifre) pr. sekund kaldes FLOPS, og er typisk 1-4 mil­lioner ved sædvanlig skalar-regning, 4-50 millioner ved vektor-regning, og 50-160 millioner i såkaldt super-vek-

KONTAKT - nr. 2 ril 1.986

tor regning (reference 1). Den nye CRAY-2 med fire CPU-enheder har til sammenligning en øvre teoretisk hastighed på 1.2 milliarder FLOPS (reference 2). Således er der store ge­vinster at hente for programmer som hovedsagelig regner på vektorer, eller som kan bringes til det. Forøgelser i hastighed på 5-10 over skalar-regning er mulig ved omhyggelig struk­turering af løkker, og i nogle tilfælde kan yderligere en faktor 1.5-3 nås ved super-vektorisering (»unrolling 00-loops«, reference l). Denne hastig­heds-forøgelse sker vel at mærke uden at man er nødt til at program­mere i assembler eller kalde særlige vektor-rutiner, omend dette er mu­ligt, men i standard FORTRAN-77 el­ler PASCAL. Særlige kommentarer i program-kildeteksten (»compiler directives«) fortæller oversætteren om mulige vektor-løkker udover de som automatisk vektoriseres.

Internt arbejder CRAY med et an­tal vektor-registre indeholdende 64 ord a 64 bit, og selv korte løkker med mindre end 64 gennemløb giver en gevinst, idet 500/0 af maximal hastig­hed opnås ved løkker af længden 10 (reference 3). Til sammenligning er det tilsvarende tal for en Cyber 205 omkring 100, hvorfor kun algoritmer med meget lange løkker vil være i stand til at udnytte denne mas kine op­timalt. Mine egne algoritmer gav på CRAY en faktor 3 i hastighedsforø­gelse uden nævneværdig indsats, og ialt en faktor 5 efter indførelse af yderligere vektor-løkker. Derimod

15

Page 3: PRAKTISKE ERFARINGER MED CRAY …folk.ntnu.no/klv/IT-historie-ntnu/IT-historien-1980-tallet/Cray/... · SCANIA i Linkoping, dels fra en CRAY -1 Sved Bcole Polytechnique nær Paris

kunne mine algoritmer ikke udnytte muligheden for super-vektorisering.

CRAY maskiner har, for at sikre størst mulig hastighed, intet virtuelt lager, og har ofte et fysisk lager på 1 million 64-bit ord. Til nogle anven­delser bliver lagerets størrelse en fla­skehals eller direkte en begrænsning, hvorfor mange nye CRAY-installa­tioner ofte har anskaffet 2, 4 eller flere millioner ord. Den ultimative løsning er indført med CRAY-2 som har et lager på 256 millioner ord, om­end i en langsommere teknologi end ved CRAY -1, hvorved virtuelt lager må formodes at være overflødiggjort.

En vigtig faktor i anvendelse af vektorprocessorer er styresystemets funktionalitet, og (måske lidt over­raskende) i hvilken grad oversætterne fungerer korrekt. CRAY's styresy­stem COS ligner til forveksling en del­mængde af Control Data's NOS, og har ganske få faciliteter så som fil­håndtering, biblioteker og oversæt­tere. Systemet er ganske velegnet til batch-kørsler og er let at lære. Inter­aktiv kørsel er kun del vist muligt (og kun med V AX som frontend) under COS systemet, som ikke er særligt velegnet hertil. Her kan indskydes at Livermore laboratorierne i USA be­nytter deres eget Cray Time Sharing System interaktivt, og at CRAY-2 leveres med det. velkendte interaktive UNIX styresystem.

CRA Y's FORTRAN-77 oversæt­ter overholder den fulde ANSI-stan­dard. Den har relativt få fejl i forhold til andre FORTRAN-oversættere, og

16

generer derfor normalt ikke brugeren med unødvendig fejlfinding og »Iap­peløsninger«. De kolleger som benyt­ter Cyber 205 og visse attached pro­cessors (FPS-I64, MAP-6420) fortæl­ler om en væsentligt værre situation mht. ANSI-standarden og fejlfrihe­den. For mit eget vedkommende var det smertefrit at overflytte program­mer fra en V AX til CRAY, idet de eneste ændringer i FORTRAN-koden knyttede sig til fil-navne og deslige.

Konklusion

Jeg mener at CRAY vektorproces­sorer er særdeles velegnede til bereg­ninger hvis mest tidsforbrugende dele kan formuleres i vektor-løkker af længde større end ca. 10. I praksis vil de fleste programmer være skrevet i sproget FORTRAN-77. Det er p.t. nødvendigt at afvikle kørsler i batch, hvorfor fx grafisk fremvisning af re­sultater kun kan ske ved efterbehand­ling. Denne begrænsning er forsvun­det med indførelsen af CRAY-2 un­der UNIX styresystemet.

Til slut nogle kommentarer om den danske situation: Jeg mener at vektorprocessorer er nødvendige værktøjer for en ikke uvæsentlig del af dansk forskning og erhvervsliv, og konstaterer at de fleste europæiske lande samt USA stiller sådanne faci­liteter til rådighed. I øjeblikket er det relativt omstændeligt at anvende vek­torprocessorer i Danmark, og det vil­le være ønskeligt om man anskaffede en CRAY vektorprocessor. Som en overgangsløsning kunne man forestil-

Kr '.I.KT - nr. 2 - april 1986

le sig en aftale med en udenlandsk CRAY-facilitet om adgang og en hur­tig kommunikations-forbindelse, fx med en V AX frontend-maskine pla­ceret i Danmark.

H vad angår »attached proces­sors« koblet til fx en V AX mener jeg at disse endnu ikke er tilstrækkeligt fejlfrie og fleksible til at være et alter­nativ til en CRAY, bortset fra situa­tioner hvor en fastlagt algoritme sjæl­dent ændres, og aldrig skal flyttes til en anden maskine. Dette er imidlertid en atypisk situation i et forsknings­miljø. Ligeledes mener jeg at en CRAY bør foretrækkes fremfor en Cyber 205.

Sammenfattende vil jeg lægge vægt på en høj grad af fejlfrihed ved CRAY-maskiner, at det ikke er nød­vendigt at skræddersy sine program­mer specielt til CRAY (der kan benyt­tes standard FORTRAN-77 med »compiler directives«), og fordi høj effektivitet opnås selv med ganske korte vektorer.

Refereneer: J. J. Dongarra og S. C. Eisenstat, ACM transactions on Mathematical Software, Vol. 10, pp. 219-230 (1984). Brochurer »The CRAY 2 Computer Sy­stem« og »The CRAY X-MP« fra CRAY Research Inc., 1333 Northland Drive, Mendota Heights; MN 55120, USA. R. W. Hockney og C. R. Jesshope, »Parallel Computers«, Adam Hilger Ltd, Bristol, (1981).

Ole Holm Nielsen NORD/TA

KONTAKT - nr. 2 -. il 1986

Danmarks Statistiks tidsserie­databank

Danmarks Statistiks tidsseriedatabank (DSTB) bliver omlagt i slutningen af april måned.

Denne længe ventede revision medfører bla., at alle tidsserierne skifter navne. Den nye måde at opbygge serienavnene på medfører at centret kan forbedre on-line faciliteterne. lige­som der bliver flere karakteristika for de enkel­te serier.

Omlægningen er planlagt til at ske ca. 15. april. I en periode vil både den nye og den gam­le databank blive opdateret, således at bruger­ne får tid til at omlægge deres kørselssetup og programmer.

Alle DSTB abonnenter får skriftlig besked med en endelig plan for omlægningen.

Karsten Vest Nielsen

SPSS/PC+ Det mest udbyggede sratistiksystem til statistisk analyse og rapporrskrivning ril IBM PC/XT/A T og

kompatible mikrodatamlIter

TABLES

SPSS/PC+ ADVANCED STA TISTICS

PRISOPlYSNINGER lexel. momsl: SPSStPC+ hovedmodul: kr. 9.000.-

Tabeller: kr. 3.000.-

Avanceret statistik: kr. 3.000.-

DANMARKS EDØ-CENTER FOR FORSKNING OG UDOAHNElSE

Vermundsgede 5 2100 København ø tlf.: 1011 83 9511

17

Page 4: PRAKTISKE ERFARINGER MED CRAY …folk.ntnu.no/klv/IT-historie-ntnu/IT-historien-1980-tallet/Cray/... · SCANIA i Linkoping, dels fra en CRAY -1 Sved Bcole Polytechnique nær Paris

,......"

Sign-on forenkles Ny simpel SIGN-ON procedure på de drejede 300- og 1200 baud asynkrone terminallinier

Fra mandag den 9. juni 1986 kl. 9.00, vil centrets drejede asynkrone linier på henholdsvis 300- og 1200 baud blive overflyttet til SPERR Y' s nyeste kommunikationssystem, Communi­cation Delivery 2.

Dette bevirker bl.a. at den tidligere ret så besværlige SIGN-ON proce­dure ændres, og at en mærkbar hastighedsforbedring på linierne op­nås.

SIGN-ON proceduren bliver herefter følgende: l. Efter etablering af modemforbin­delsen:

TRYK: CR.

2. Svaret fra SPERR Y-systemet på CR vil være: ENTER USERID/PASSWORD

CLEARANCE LEVEL

Ovenstående gælder for telefonnum­rene: 83 83 48 + 83 8055 = 1200 baud 83 9000 + 83 73 33 = 300 baud.

Til sidst skal det blot nævnes, at så­fremt man efter den 9. juni 1986 an­vender den idag gældende SIGN-ON procedure, kan en af følgende system­meddelelser fremkomme:

a. TERMINAL SESSION - ALREADY ACTIVE

b. * * NETWORK SIGN-ON FAllED:

12

VERIFY TERMINAL-ID AND REEN­TER * *

c. * *NETWORK + SIGN-ON FAllED: SIGN-ON COMMAND EXPEC-TED* *

Til disse meddelelser svares med: CR­og ENTER USERID/PASSWORD CLEARANCE LEVEL vil fremkom­me på terminalen.

Ole Schack

SPSSX lokal dokumentation op­dateret

Der er lavet en opdateret og udvidet udgave af hæftet SPSSX Local and Update Documenta­tion. Hæftet indeholder dokumentation for de Sperry-afhængige dele af SPSSx, dvs kald af programmet, filbehandling og ændringer i di­verse SPSSx faciliteter, herunder en beskrivelse af hvorledes et SPSS" Crosstabs job kan sættes op til laserprinteren, så »gitteret« i tabellen får fuldt optrukne linier, en detalje, der giver væ­sentligt pænere tabeller.

Endvidere er hæftet udvidet med en be­skrivelse af de fejl, der indtil videre er fundet i SPSS" version 1.0 . Specielt er der omtalt en al­vorlig fejl, der får SPPS" til at læse systemfiler generet af SPSS (release 9) forkert. Komando­erne Match files og Add files er ligeledes fejl­behæftede, og der gives løsninger til at undgå fejlene.

Dokumentationen kan rekvireres ved hen­vendelse til ekspeditonen.

Jesper Lund

KONTAKT· nr. 3 . maj 1986

T DANSK VEKTORPROCESSOR BØR FØLGES OP AF EKSPERTISE I NUMERISK ANALYSE Forsker i astrofysik peger på fordele ved ))mini-supercomputere«

Dette indlæg fra fil.dr. Åke Nordlund, Astronomisk Observatorium, indgår i rækken of artikler om vektorprossorer

Dette indlæg er en forkortet version af undertegnedes svar på en enquete fra Statens Naturvidenskabelige Forskningsråd, vedrørende »DAN­SKE FORSKERGRUPPERS BE­HOV FOR REGNEKRAFTIGT UD­STYR«. Det er mit håb, at de erfarin­ger fra og synspunkter på forskellige typer af »supercomputers« som jeg her gør rede for, kan bidrage til et fornuftigt valg af anlægstype ved en kommende dansk satsning på sådant »regnekraftigt udstyr«.

Mit forskningsfelt (astronomi og astrofysik) har traditionelt været præget af intensiv brug af datama­skiner (den første datamaskine ved Københavns Universitet var vist nok en Gier-maskine på Astronomisk Ob­servatorium), og min egen forsk­ningsspecialitet (numerisk simulering af hydro- og magnetohydrodynami­ske fænomener i solens og andre stjerners atmosfærer) fører til kon­struktion af modeller af tidsforløb i tre dimensioner . Numerisk behand­ling af sådanne modeller er uundgåe-

KONTAKT· nr. 3 . maj 1986

Iigt meget tidskrævende, da selv en marginal opløsning i hver af de tre dimensioner fører til et meget stort antal frihedsgrader, og da en simu­lering også omfatter mange tidstrin, svarer et enkelt »eksperiment« (simu­lering) til adskillige timers CRA Y-I CPU tid. Igennem de sidste 6 - 7 år har jeg derfor i perioder været en flit­tig bruger af forskellige CRAY -l an­læg (Daresbury, MUnchen, Boulder, Linkoping). Jeg har haft stort viden­skabeligt udbytte af disse anlæg, men har også høstet en del frustrerende er­faringer, af årsager som nok er af principiel interesse for det valg af an­lægstype man nu er ved at træffe her i Danmark.

Dette valg står mellem tre hovedtyper af anlæg: l. Anlæg af typen »array-« eller

»attached-« processor, fx FPS, SPERRY EAGLE, IBM Vector Facility.

2. Traditionelle »supercompu-ters«, fx CRAY, CDC, Fujitsu

13

Page 5: PRAKTISKE ERFARINGER MED CRAY …folk.ntnu.no/klv/IT-historie-ntnu/IT-historien-1980-tallet/Cray/... · SCANIA i Linkoping, dels fra en CRAY -1 Sved Bcole Polytechnique nær Paris

3. . En ny type »mml-supercompu-ter«, fx Alliant, Convex, ...

Erfaringer fra traditionelle super­computere

De to første typer af anlæg kan være vidt forskellige med hensyn til egen­skaber hos den centraie komponent i systemet (»vektor-processoren«), og der kan være forskelIe set fra bru­gerens synspunkt; fx speeielle subru­tine kald (FPS), forældede styresy­stemer (CRAY JCL), etc. Disse to (konventionelle) typer af anlæg fører dog til en, fra brugerens synspunkt, næsten identisk organisering aj arbej­det, og her ligger de store ulemper, som jeg gerne vil pege på.

Et anlæg af type 1. eller 2. består af en eller flere »vektor-processorer«, evt. med eget pladelager, en eller flere »frontend-maskiner« med pladela­ger, et baggrunds- (masse-) lager, og et antal (fjerne) bruger-maskiner, koblede til supercomputeranlægget med et netværk. Brugeren »ser« et lokalt operativsystem (V AX/SPER­RY /IBM/UNIX), hvorfra man kan sende batch-jobs til afvikling (net­send). Jobkommandoer i batch-job­bet (CRAY JCL) sendes via netværk til frontend og herfra til CRAY. Job­bet går ind i en af flere køer Gobklas­ser). Når jobbet starter, hentes data­set fra baggrundslager til pladelager (kort levetid på pladelager), mindre dataset hentes via netværk fra lokal maskine, jobbet eksekveres, print dataset sendes til frontend til videre

14

foranstaltning (papir, mikrofilm, 35mm film, retur til brugermaski­ne, ... ), plot dataset sendes til plotter, eller gemmes som metakode, log da­taset sendes til brugermaskine. Disse dataset har forskellige navnekonven­tioner på forskellige dele af systemet, og der skal skrives skrives skrives JCL og huskes huskes huskes forskel­lige filnavne.

Selv det mindste job (JCL ER­ROR) tager adskillige sekunder (op til minutter) tur/retur ved minimal be­lastning (overhead i køer, fron­tend, ... ). Mere typisk er der fyldt op i køer (tit på grund af flaskehals i periferudstyr, fx baggrundslagertra­fik). Dvs at den normale program­merings-cyklus (tænke - skrive - tæn­ke - syntaks fejl - tænke - linkfejl -tænke - eksekveringsfejl - tænke -usynlige fejl - tænke .. ) tager alt for lang tid, betydeligt længere tid end på en interaktiv maskine. Der er også en kæde af ting, der skal virke (lokal maskine, netværk, frontend, super­computer, baggrundslager), dette be­tyder at sandsynligheder for at sy­stemet som helhed virker i en hel dag kun er måske 50070, selv om den er 90% for hver af de indgående dele.

Interaktiv vektorgrafik og raster­grafik, der er overordentlig vigtig ved test og udvikling af nye metoder, er ikke mulig, og for brugere på afstand er også almidelig (pen-plot) grafik besværlig.

Et stort apparat (biblioteker, job­organisation, data-håndtering, gra­fik, ... ) hører til et normalt forsk-

KONTAKT nr. 3 maj 1986

ningsprojekt. System-eksperter og »management« har ofte ikke forståel­se for, hvor maskine- og system-af­hængig dette apparat er (selv om ind­gående FORTRAN-77 software er helt transportabel), og hvor stor en produktivitets gevinst der kan opnås ved homogene omgivelser og en høj grad af interaktivitet.

Systemet er også (som per natur­lov) altid overbelastet, og først når det gør rigtigt ondt bliver presset stort nok til at indkøbe en ny maskine. I løbet af kort tid er så denne også overbelastet (på NCAR var CRAY nr. to overbelastet fra starten!).

En ny type supercomputer

Der er i lø bet af de sid ste par år kom­met en række maskiner aI' en ny type på markedet; eksempelvis Alliant, Con v ex, American Supercomputers, Gould, Scientific Computing Systems ... Denne type (»mini-«) supereom­puter er typisk opbygget efter samme grundprincipper som en konventionel supercomputer (speciel hardware for vektorregninger, »pipelining«, etc.), men baseres på »off-the-shelf« kom­ponenter. Dette medfører et drastisk reduceret kølebehov (luftkøling, få kW) og en drastisk reduceret pris, men alligevel vektorregningskapacitet af størrelsesorden en halv CRAY -1 S.

Disse maskiner har mange fælles træk: UNIX operativ system, VAX kompatibel FORTRAN oversætter, (de sigter på samme markeds-niche), men som et konkret eksempel skal her nævnes Alliant FX/8, der måske også er den aller mest interessante af disse

KONTAKT nr. 3 maj 1986

maskiner. Interessen for disse ma­skiner er meget stor på USA marke­det.

Alliant FX/8 er en multi CPU maskine, der bruger en avanceret parallei arkitektur. Maskinen kan på et vilkårligt tidspunkt software-kon­figureres til at køre de otte proees­sorer uafhængigt, parallelt, eller i en passende blanding med fx 4 uafhæn­gige, 4 i paralleI. Typisk vil der være tale om at køre alle proeessorer uaf­hængige ved høj belastning (mange brugere), da man så enkelt kan opnå fuld belastning af alle otte CPUer. Ved lav belastning (få brugere) køres flere proeessorer parallelt, hvilket giver mulighed for at sprede en op­gave over flere proeessorer , og herved igen opnå fuld belastning. Dette er muligt (og sker uden indgreb fra brugerens side) takket være en FOR­TRAN kompiler der kan ud nytte flere proeessorer , fx til multidimensional matrixregning, og til rekursive bereg­ninger af typen

F(l,l) == F(l,I)/F(l-l,2) F(l,2) = F(I,2)-F(l,l)*F(I-l,3)

(løsning af tri-diagonalt ligningssy­stem). Denne type af problem er me­get almindelig, men kan ikke vek­toriseres på en konventionel vektor­maskine.

De fleste andre maskiner af denne type, bruger UNIX operativsystem og er dedikeret interaktive maskiner. Den interaktive kommunikation med brugeren håndteres af speeielle pro­cessorer , og belaster ikke de aritmeti­ske enheder.

15

. t

I

Page 6: PRAKTISKE ERFARINGER MED CRAY …folk.ntnu.no/klv/IT-historie-ntnu/IT-historien-1980-tallet/Cray/... · SCANIA i Linkoping, dels fra en CRAY -1 Sved Bcole Polytechnique nær Paris

Sammenligning at de tre hovedtyper at maskiner

Egenskab A IBM 3090

Mflop/M$ll 12/5

= 2.4

Industristandard NE]

operativ system 51

VAX FORTRAN NEJ kompatibel 21

\ lan lid bygges NEJ grad\i~ ~)

Kan op:,tilles NEJ ho.'> brugeren ~)

Dri fhi k kerhed ' ) afhængig ar vært,datamat

Lokalitets- kræver

beho\ værtsdatamat

Kommentarer til tabel:

I) Mjlop/M$. Disse tal cr baserede pa Peljormance of Various Computers Using Standard Li­near Equation Sojiware in a Fortran Environment, Jack 1. Dongarra, Argonne, Tech. Mem. No. 23, og approksima­tive listepri.ser i $.

16

Det skal bemærkes, at koncen­tration al' denne produktivitet til cen maskine (fx CRAY /XMP) ikke er en fordel, da den enkelte

TYPE

B C valg CRA Y-XMP-12 Alliant FX/8

24/8 6.2/0.62 C

= 3 =10

NEJ JA C

NEJ JA C

NEI JA C

NEJ JA C

højteknologi,k, redundans, C dyrt underhold modulær,

off-,hel f

omfattende ringe C lok. in vest. lok. imest.

bruger sa istedet skal konkurrere mcd flere brugere, p[, en mask i­ne der er mindre lettilgængelig og mindre interaktiv. Det skal også bemærkes, at selv i test med »alle midler tilladte« (ma­skinkode programmering) opnår en Alliant FX/8 større produk­tivitet end en CRAY /XMP; CRA Y /XMP-4 (med 4 proces­sorer) 715124 = 29 Mflopl M$, Allianl FX/8 (med 8 proees­sorer) 22/0.62 = 35 Mflop/ M$.

2) VAX FORTRAN. Da dissc ma-

KONTAKT nr. 3 mal 1986

med flere brugere, på en maski­ne der er mindre lettilgængelig og mindre interaktiv. Det skal også bemærkes, at selv i test med »alle midler tilladte« (ma­skinkode programmering) opnår en Alliant FX/8 større produk­tivitet end en CRA y IXMP; CRAY IXMP-4 (med 4 proees­sorer) 715124 = 29 Mflopl M$, Alliant FX/8 (med 8 proees­sorer) 22/0.62 = 35 Mflopl M$.

2) V AX FOR TRAN. Da disse ma­skiner sig ter på at erstatte mange af de V AX 7XX systemer, der nu er håbløst overbelastede, er V AX FORTRAN (do while etc.) standard. Dette bet yder at en stor mængde danske program­mer udviklede på V AX installa­tioner , der ellers skulle omskri­ves (til mindre læselig FOR­TRAN) for at udnytte det reg­ne-kraftige anlæg (fx CRAY IXMP), umiddelbart kan bruges.

3) Drijtsikkerhed. Mange af del­systemerne i en Alliant er (man­ge-)doblede, og ved driftforstyr­relser kan fejlende komponenter forbi-kobles med software. Sy­stemet er opbygget med få og selvdiagnosticerende delkom­ponenter. Hvis, i sjældne tilfæl­de, en node i netværket fejler totalt, kan andre noder overtage arbejdet.

4) Udbygning, ud flytning. En AI­liant FX/8 med een CPU koster

KONTAKT nr. 3 maj 1986

270.000$, inkl. disk og tapes ta­tion. Hver yderligere CPU ko­ster ca. 40.000$. Med disse pri­ser kan man foretage en syste­matisk forøgelse af CPU kapa­eiteten i takt med voksende be­hov.

5) Operativsystem. I denne forbin­delse har operativsystemet UNIX en række distinkte forde­le:

UNIX er industristandard, og findes på alt fra IBM PCI AT til CRAY -2. Herved møder brugeren det samme system på alle niveauer.

UNIX har et hierarkisk filsy­stem, der gør det nemt og na­turligt for brugeren at organi­sere filer efter projekt, delpro­jekt, programpakke, bibliotek, korrespondance, artikler, rap­porter, etc. Dette er ikke muligt med et »fladt« filsystem aftype SPERRYelIer IBM.

UNIX er et meget kraftfuldt in­teraktivt operativsystem, med en mængde værktøjer til pro­gramudviklingl vedligeholdel­se, der forhøjer den enkelte forskers produktivitet.

Kommando »pipelines« og in­put/ output redirect gør det nemt og naturligt at opbygge programsystemer modulært.

Fuldskærmseditorer (vi, emacs, ... ) der er klart overleg-

17

,

I

Page 7: PRAKTISKE ERFARINGER MED CRAY …folk.ntnu.no/klv/IT-historie-ntnu/IT-historien-1980-tallet/Cray/... · SCANIA i Linkoping, dels fra en CRAY -1 Sved Bcole Polytechnique nær Paris

ne andre systemer (IBM XE­DIT, SPERRY CTS).

Der findes et stort antal kraft­fulde arbejdsstationer, der bruger UNIX eller UNIX lig­nende operativsystemer (SUN, Apollo, Hewlett Packard, Zi­log, Cromemco, .. ). Mange in­stitutter og industrier bruger al­lerede sådanne systemer til CAD/CAM og lignende op­gaver. Sådanne arbejdsstatio­ner vil umiddelbart kunne til­sluttes netværket.

Ved valget af nye maskiner til netværket af regne-kraftige an­læg er man meget frit stillet. Som nævnt ovenfor bruger de fleste af de nye »mini-super­computere« UNIX, ligesom CRAY-2 (og CRAY-3). Også eksisterende »mainframes« (SPERRY, IBM) kan køre UNIX (samtidigt med det nor­male operativsystem), og kan herved tilbyde et homogen brugermiljø.

Konkluderende bemærkninger

Der er ingen tvivl om, at Danmark behøver en kraftig satsning på »reg­nekraftigt udstyr«, og at den relativt sene udvikling på dette område inde­bærer et handicap i forhold til andre industrilande. Der bør foretages en koordineret investering i et netværk af regnekraftigt udstyr .

Det er meget vigtigt at en sådan in­vestering i »hardware« følges op af en

18

ordentlig investering i »ekspertise«. Her hentyder jeg ikke alene til eksper­tise i brugen af de specifike egenska­ber hos vektorprocessorer (en typisk FORTRAN kyndig forsker vil i løbet af få dage have lært hvilke principper der er afgørende for en effektiv vek­torisering af et givet stykke program­meI). Langt vigtigere er at få udbyg­get en ekspertise i generei og problem­orienteret numerisk analyse (et fag der må siges at have været sørgeligt forsømt fx ved Københavns Univer­sitet).

Ironisk nok giver den forsinkede danske satsning os nu en unik chanee til at springe et trin i udviklingen over; den ny generation af »mini-su­percomputere« har afgørende fordele overfor den traditionelle type af su­percomputere og er desuden kompa­tibel med næste generation af »front-linie« supercomputere (CRAY-2, CRAY-3).

Det er af største vægt, at man undgår, at brugeren konfronteres med flere lag af forskellige st yre- og filsystemer, men at man i stedet mø­der et homogent og kraftfuldt styre­system med høj grad af interaktivitet og med fornøden støtte af interaktivt grafisk udstyr. Et netværk af den nye type af »mini-supercomputere«, med UNIX operativsystem som fælles brugerflade, er her det naturlige valg.

I forhold til det der ellers sker på computer markedet idag (»mus« styrede PC'er og arbejdsstationer med avanceret CAD/CAM grafik ud­styr), er den centraie batch-orien-

KONT AKT nr. 3 - maj 1986

terede supercomputer en anakronis­me.

Åke Nordlund Astronomisk Observatorium

Ny version af PHOTODOC PHO * TO. DOC erstattes at ver­sion 7R4 den 3. juni

Versionen har indtil nu kørt som PHO * TO.DOC/7R4 og indeholder de faciliteter, der er beskrevet i Pho­todoc manualens udg. 6. Herudover er der kommet et græsk tegnsæt i Times ordinær, gruppe kode »0«. In­teresserede kan få en tabelover tegn­sættet ved henvendelse til centrets ekspedition.

ADVARSEL!

Den ny version giver en anden om­brydning end den gamle, og man kan derfor ikke med held udføre en del af en sætteopgave med den gamle ver­sion, og en anden del med den nye. ForskelIene kan være helt op til 3 li­nier pr. side. Den gamle version er stadig tilgængelig som PHO * TO.DOC/7Rl.

Henrik Rue

KONTAKT - nr. 3 mai 1986

Kommunikationssy­stemet CD-2 indkøres Alle med taste linier berøres

Centret annoncerede i sensommeren 1985 i det daværende RECKU NYT nr. 144 den igangværende indkøring og idriftsættelse af SPERRY's nyeste kommunikationssystem, Communi­cation Delivery 2 (CD-2), og siden i samme organ nr. 145 om de vanske­ligheder, projektet var løbet ind i. Samtidig lovede vi at vende tilbage til sagen, når problemerne var løst.

Problemerne er i den mellemliggen­de periode løst, hvilket bet yder, at centret nu for alvor kan gå igang med en over flytning fra de idag kendte kommunikationssystemer til CD-2.

Rent praktisk viloverflytningen foregå ved, at alle brugere, der idag har faste forbindelser til centret, vil blive kontaktet i løbet af de kommen­de måneder for nærmere orientering.

For MICROMUX-brugere gælder at det Micromux-programmel, der idag er installeret skal udskiftes med en ny version. Selve udskiftningen foretages af UNI-C, ligesom udgif­terne i forbindelse hermed bekostes af UNI-C.

Ole Schack

19

Page 8: PRAKTISKE ERFARINGER MED CRAY …folk.ntnu.no/klv/IT-historie-ntnu/IT-historien-1980-tallet/Cray/... · SCANIA i Linkoping, dels fra en CRAY -1 Sved Bcole Polytechnique nær Paris

Efterårets kurser Nye UN/- C kurser

Et nyt fælles kursusprogram for hele UNI - C er på trapperne. Det forven­tes udsendt i begyndelsen af juli.

Det er et omfattende program in­deholdende kurser på hovedanlæg­gene CDC, IBM og Sperry samt mi­krodatamaterne Partner og IBM PC og gælder for efterårssæsonen 1986.

Nyheder

Af nye kursusemner kan nævnes Pa­scalog dBaseIII workshops, hvor del­tagerne får mulighed for at arbejde med egne opgaver. Bemærk iøvrigt, at både dBase og Dantekst kurserne afholdes med nye forbedrede udgaver af dette program mel i forhold til sid­ste sæson.

Andre spændende nyheder er kur­ser i SPSS/PC + og MS/PC-DOS.

Administrative ændringer

Som det vil fremgå af programmet, er der foretaget justeringer omkring til­melding, afmelding og betaling af kursusgebyr .

Det har endnu ikke været praktisk muligt at oprette fælles indbetaling og administration for centret som hel­hed. Vi håber, at vi med næste kur­susprogram, der udkommer sidst på året, har klaret dette problem.

Det bet yder , at vi må bede bruger­ne være opmærksomme på, at kur­susgebyret sendes til den region, hvis

6

kursus brugeren ønsker at deltage i. Vi glæder os til at byde nye og gam­

le kursister velkommen til en ny kur­sussæson. Den starter den 1. septem­ber.

~ 7\6)'/)) y{fl

-m --=~ ~c:;'"

A1ariann Slot

EARN brochure

Der er udgivet en brochure om EARN som introduktion til det EDB-net Danmark blev tilslut­tet for godt et år siden.

EARN giver· indtil videre uden beta· ling . mulighed for at sende filer mel· lem over tusind universiteter og forsk· ningscentre i Europa, USA og Canada, foruden formentlig endnu flere insti· tutioner tilsluttet andre net.

Der er i øjeblikket tilsluttet 9 knu· depunkter i Danmark, og de udveksler for tiden omkring 10.000 filer per måned med udlandet.

Brochuren kan fås ved hen­vendelse til UNI-C, ekspedi­tionen.

KONTAKT . nr. 4 . juni 1986

-'

i>

ERFARINGER MED BRUG AF SUPERDAT AMATER Krav til vektorprocessorer

Dette indlæg fra lektor, cand. scient. Axel Hunding, Medicinsk-kemisk Institut, Panum Instituttet, indgår i rækken af artikler om vektorpro~ess~rer

. 75070 af koden, vII glve beskedne Interessen for den faktisk udnytt.ehge hastighedsgevinster. Udføres 50070 af ydeevne af superdatamater er stlgen- koden skalært og resten (meget hur-de. Mange brugere af EDB har hørt tigt) paralleltlvektorielt, opnås højst om sådanne maskiners topydelse, der en faktor 2 i gevinst over ren skalær oftest ligger i område: 100-5.00 afvikling. MFLOPS (million fl?atmg po~nt Adskillige superdatamater har en operations per sec.). Til sammenhg- skalær hastighed i området 8-15 ning yder den populære V AX 11/700 MFLOPS. I praksis er det derfor af-FPA ca. 0.5 MFLOPS, Sperry gørende, at store dele af den valgte al-1100/90 ca. 4 MFLOPS OG IBM goritme kan køres paralleltlvektori-3081 Dca. 3 MFLOPS. elt.

Det er imidlertid vigtigt at under- Eksempler på problemer, der ikke strege, at den hastighedsforøgelse de egner sig til de nuværende superda-fleste brugere vil få på en superda- tamater, er ikke-lineær optimering tamat bestemt ikke står i noget e~kelt (datafitning), numerisk integration, forhold til de respektive ma~kmers løsning af (små systemer af) alminde-formelle topydelse. I dette l?dlæg lige differentialligninger med mange skal nogle almindelige internatIOnaie tidsskridt, programmer med relativ erfaringer omtales ve~~ørende. brug meget ind- og udlæsning af data (ad-af superdatamater. TIlhge er mklu- ministrativ EDB) m.m. Hastigheds-deret nogle af mine egne erfaringer forøgelsen ud over skalær-hastighe-med brug af CRAY X-MP /22 ved den er omtalt for en rækkeanvendel-Jiilich via EARN. ses områder i en artikel af l.S. Duff i

Internationale erfaringer med su- ovennævnte reference. Den er typisk perdatamater kan findes i litte~a- 2-5 for områder som vejrforudsigel-turen, fx fg.!!l.J?.!1tational __ rl.!~ICS ser, aerodynamik, atomenergi, og COlllI!!.!!nL~_~12~: Som ho- teoretisk fysik, omend enkelte pro--vechegel gælder, at problemer, der blemer kan opnå væsentligt større kun kan programmeres. til. parallell gevinster. Det svarer til opnåede vektoriserbar udførelse l mmdre end hastigheder på ca. 20-50 MFLOPS.

KONTAKT nr. 4 . juni 1986 7

Page 9: PRAKTISKE ERFARINGER MED CRAY …folk.ntnu.no/klv/IT-historie-ntnu/IT-historien-1980-tallet/Cray/... · SCANIA i Linkoping, dels fra en CRAY -1 Sved Bcole Polytechnique nær Paris

Ofte benyttede matrix programmer (fra fx NAG-biblioteket) kan special­kodes til at give 20-65 MFLOPS (CRAY-IS), 65-125 (CRAY X-MP) og 25-85 (Cyber 205) for matricer af dimension 200.

Ud fra disse tal er det ikke rimeligt at forvente en gevinst på meget mere end højst en faktor 2-3 over skalæraf­vikling, hvis en bruger forsøger at køre et tidligere ud viklet program på en superdatamat. Internationalt har det imidlertid vist sig, at betydeligt højere gevinster kan opnås, hvis brugeren har et godt kendskab til al­ternative algoritmer (hvoraf nogle måske i langt højere grad vektori­serer), samt kender de fleste af de faldgruber , uhensigtsmæssig pro­grammering kan opvise. Det første kræver fortrolighed med numerisk matematiske metoder og der er bety­delig aktivitet internationalt omkring emnet. Det sidste kan relativt hurtigt læres ud fra optimeringsvejledninger, tilpasset de enkelte maskiners arki­tektur.

Program Nr.

MFLOPS

2 3 456

(CRAY IX-MP): 153 77 96 41 9 8

Som det ses er der stor variation af den udnyttelse af maskinens ydeevne, der kan opnås. Flere internationalt foretagne sammenligninger mellem forskellige maskiners ydeevne er gen­nemført med programmer, der ligger i den langsomme del af skalaen. Det er

8

Af simple regler kan nævnes, at man om muligt bør tilsigte, at både addi­tions- og multiplikations-piperne er i arbejde samtidig (ehaining), hvilket lettes, hvis der refereres mindst muligt til data i memory, samtidig med at sløjferne (DO-l 00 ps) indeholder man­ge operationer. Simple sløjfer, hvor loop indeks løber over første array-in­deks med en tilvækst på een er at foretrække (for at undgå 'bank-eon­fliets'). Betingede sætninger bør und­gås i loops, men i en række tilfælde kan de med fordel omskrives, således at vektorisering opnås. Med et rime­ligt kendskab til sådanne simple regler kan man godt opnå særdies høje reg­nehastigheder med rene FORTRAN­programmer (et af vore produktions­programmer kører med 194 MFLOPS på CRAY X-MP). Det· afhænger imidlertid også af problemets natur, og af den valgte algoritme, hvilket kan ses af de standard test-kørsler, der ofte refereres til i litteraturen når forskellige maskiner skal sammenlig­nes (Livermore-programmerne):

7 8 9 10 I1 12 13 14

168 % 163 66 3 77 5 7

således her mere maskinernes relative skalær-hastighed, der sammenlignes, end deres brugbarhed som egentlige superdatamater . Fx angiver mange fabrikanter af prisbillige 'attaehed processors', at deres maskine er næ­sten lige så hurtig som en Cray-I S på

KONTAKT - nr. 4 - juni 1986

et givet testprogram. Undersøger man imidlertid de faktisk opnåede regne­hastigheder , vil man se, at der i begge tilfælde ikke opnået mere end 10-20 MFLOPS. En vigtig grund til, at 'at­taehed proeessors' som hovedregel ik­ke i praksis opnår de helt store ydelser er, at memory ikke er konstrueret til at føde CPU 'en med en hastighed der er væsentligt større end skalær-enhe­dens. Der er således en 'flaskehals' i systemet (for lille båndbredde for overs førsel af data til/fra CPU'en). Selv i CRAY -I serien er båndbredden relativ snæver i forhold til CPU'ens topydelse, et forhold der er afhjulpet på CRAY X-MP.

Det er tidligere nævnt her i bladet, at Jiilieh-eentrets CRAY X-MP kan anvendes fra UNI-C via EARN. Er­faringerne er, at eentret sjældent er nede, og at kørsler (på 5 min eller mindre, med ca. I M lagerkrav) ligger i kø 1-2 timer med mellemprioritet (ca. 1.10 kr/CPU-sek). Selve EARN kan undertiden være nede (hoved sa­gelig fordi en af de hjemlige nodes er nede), men ellers kan der transmit­teres med net-hastighed tilsyneladen­de uden væsentlig forsinkelse. I prak­sis er det således muligt at afvikle 3-4 kørsler på en arbejdsdag, selv om out­put fra den forrige kørsel skal vur­deres før næste afsendes. Til sammen­ligning vil en enkelt sådan kørsel først være afviklet efter 2-4 døgn på fx en lokal VAX 111750FPA.

På disse betingelser er det klart, at konkurreneen med udenlandske for­skere vil blive kraftigt skærpet i takt

KONTAKT - nr. 4 - juni 1986

med, at flere og flere opnår adgang til superdatamater. Hvis danske forskere ikke får let og billig adgang til sådan­ne anlæg, vil vi ikke kunne deltage i den videre udvikling på et konkurren­eedygtigt niveau.

Axel Hunding Medicinsk-kemisk Institut

Før hed det NEUCC-RECKU

Publikation nr 43, der beskriver transmissions­systemet mellem UNI.C's afdelinger i Lyngby og København er nu kommet i en ny udgave med titlen

IBM(MVS) - SPERRY TRANSMISSIONSSYSTE~IET

Jan P. Sørensen

9