3.tekst i hipertekst

16
TEKST I HIPERTEKST Tekst ... ili dokument je "informacija namenjena ljudskom sporazumevanju koja može biti prikazana u dvodimenzionalnom obliku... Tekst se sastoji od grafičkih elemenata kao što su karakteri, geometrijski ili fotografski elementi ili njihove kombinacije, koji čine sadržaj dokumenta." (ISO-definicija) U svakom tekstu se razlikuju dve osnovne formalne strukture: logička struktura ili logički izgled (engl. logical layout) opisuje organizaciju sadržaja teksta. Tipični elementi logičke strukture su jedinice kao što su naslovi ili, pak, pasusi. grafička struktur a ili grafička izgled (engl. graphical layout) opisuje organizaciju teksta u "štampanom" obliku. Tipični elementi grafičke strukture su jedinice kao što su strana ili red. Logička struktura ne zavisi od grafičke strukture dokumenta. Hipertekst ... ili web-dokument je, pojednostavljeno, tekst koji sadrže veze ili uputnice (engl. link) ka drugim dokumentima ili na samog sebe. Preciznije, hipertekst je skup stranica (engl. page), u obliku datoteka, međusobno povezanih vezama koje su insertovane u stranice. Ove uputnice se obično vide kao veze (hiperveze) na koje se može kliknuti (od engl. to click). Za razliku od običnog teksta, koji se čita linearno (sleva na desno, odozgo naniže), hipertekst se čita prateći hiper-veze u tekstu, dakle, ne nužno na linearan način. Navigator ... ili razgledač (engl. browser) je interpretator jezika za prikazivanje hipertekstuelnih dokumenata: on omogućava njihov vizuelni prikaz na ekranu. Jezici za opisivanje dokumenta 1

Upload: asmir-kopic

Post on 16-Dec-2015

4 views

Category:

Documents


0 download

DESCRIPTION

Tekst, Hipertext

TRANSCRIPT

TEKST I HIPERTEKSTTekst ... ili dokument je "informacija namenjena ljudskom sporazumevanju koja moe biti prikazana u dvodimenzionalnom obliku... Tekst se sastoji od grafikih elemenata kao to su karakteri, geometrijski ili fotografski elementi ili njihove kombinacije, koji ine sadraj dokumenta." (ISO-definicija)U svakom tekstu se razlikuju dve osnovne formalne strukture: logika struktura ili logiki izgled (engl. logical layout) opisuje organizaciju sadraja teksta. Tipini elementi logike strukture su jedinice kao to su naslovi ili, pak, pasusi. grafika struktura ili grafika izgled (engl. graphical layout) opisuje organizaciju teksta u "tampanom" obliku. Tipini elementi grafike strukture su jedinice kao to su strana ili red. Logika struktura ne zavisi od grafike strukture dokumenta. Hipertekst ... ili web-dokument je, pojednostavljeno, tekst koji sadre veze ili uputnice (engl. link) ka drugim dokumentima ili na samog sebe. Preciznije, hipertekst je skup stranica (engl. page), u obliku datoteka, meusobno povezanih vezama koje su insertovane u stranice. Ove uputnice se obino vide kao veze (hiperveze) na koje se moe kliknuti (od engl. to click). Za razliku od obinog teksta, koji se ita linearno (sleva na desno, odozgo nanie), hipertekst se ita pratei hiper-veze u tekstu, dakle, ne nuno na linearan nain. Navigator... ili razgleda (engl. browser) je interpretator jezika za prikazivanje hipertekstuelnih dokumenata: on omoguava njihov vizuelni prikaz na ekranu. Jezici za opisivanje dokumenta... su jezici koji omoguavaju da se precizno opie izgled i sadraj jednog teksta. Od posebnog su znaaja: SGML (Standard General Markup Language), TeX i LaTeX (za matematike tekstove), PostScript (jezik laserskih tampaa), RTF (Rich Text Format), ... Jezici za opisivanje hiperteksta... su jezici koji omoguavaju da se precizno opie hipertekstuelna struktura jednog teksta (uputnice na druge tekstove, itd). Ovi jezici doputaju da se eksplicitno opie logika struktura teksta i razliiti tipovi veza u tekstu. Veze mogu biti unutranje (kada veza upuuje na drugi deo istog teksta), spoljanje (kada veza upuuje na neki drugi teksta) i izvrne (kada se unutar teksta aktivira veza na neku izvrnu proceduru). Najznaajniji jezici ove vrste su: SGML, HTML (HyperText Markup Language), pojednostavljena verzija SGML-a, XHTML (Expandable HTML) i XML (Extensible Markup Language, "kompromis" izmeu preterane sloenosti SGML-a i jednostavnosti HTML-a; njegova standardizacija je u toku). Jezik HTMLIzvorne datoteke ... sa dokumentom opisanim u HTML-u imaju obino sufiks (ili ekstenziju).html ili .htm, a nalaze se u odreenom direktorijumu servera vezanog na Internet, to ih ini dostupnim (vidljivim) na web-u. Unos i vizuelni prikaz (vizuelizacija) pomou posebnog naina obrade teksta u uobiajenim editorima teksta ili pomou posebnog programa za obradu teksta (npr. kao Netscape Composer ili DreamWeaver). Vizuelni prikaz se ostvaruje uz pomo navigatora (npr. opcija "Open Page" u programu Netscape) Prevodioci Tekst u HTML-u moe se proizvesti i pomou programa za konverziju teksta iz odreenog formata u HTML-format. Na primer, iz RTF-formata u HTML (rtf2html) iz LaTeX-formata u HTML (latex2html) Ovakvi programi nas obino suoavaju sa pitanjem verzije HTML-a i sa problemima reprodukcje mogunosti jednog jezika u drugomOsnovni pojmovi Jezik HTML se zasniva na eksplicitnom obeleavanju logike strukture dokumenta. Obeleavanje se vri pomou etiketa (engl. tag) koje opisuju elemente logike strukture teksta. Tekst dobija svoj grafiki izgled u zavisnosti od navigatora koji je upotrebljen za njegovu vizuelizaciju. U zavisnosti od svojstava navigatora i njegove konfiguracije, jedan dokument obeleen u HTML-u moe imati razliite grafike izglede.

Tagovi (etikete) ... se navode izmeu uglastih zagrada < i >. U ovim zagradama se navode opisi pojedinih elemenata strukture teksta. Tagovi se u HTML-u mogu razvrstati na prosti tagovi ili markeri za opisivanje jednostavnih elemenata logike strukture. Oblika su: sloeni tagovi ili ograivai su zagrade oblika y kojima je opisan izgled dela teksta y. atributi sloenih obeleja oblika: y koji pruaju dodatne informacije, obino o grafikom izgledu, dela teksta y; Tagovi su neosteljivi na razliku izmeu malih i velikih slova (engl. case-insensitive). Strukturiranje teksta Mininalna struktura HTML-dokumenta ... obuhvata tagove: , - zagrade HTML-teksta; , - zagrade zaglavlja, sadri meta-definicije HTML-dokumenta; , - zagrade za naziv HTML-dokumenta i , - zagrade teksta obeleenog dokumenta. Dodatna opcija omoguava da se obelei komentar u HTML-obeleenom tekstu koji se nee videti u vizuelizaciji dokumenta. Na primer: Obeleavanje istaknutih delova logike strukture teksta se vri ograivaima ili tagovima: Naslovi (engl. headers) se kodiraju prema relativnoj dubini ciframa od 1 do 6. Tagovi za naslov ima opti oblik: Naslov nivoa n gde n uzima vrednosti od 1 do 6. Odeljak (engl. division) se opsuje zagradama ... . Ovaj tag moe imati atribut za pozicioniranje ALIGN sa vrednostima CENTER, RIGHT ili LEFT. Pasus (engl. paragraph) se obeleava zagradama ... . Ukoliko u ravnom tekstu sledi pasus za pasusom, tag se moe izostaviti. I ovaj tag moe imati atribut za pozicioniranje ALIGN sa istim vrednostima kao tag . Novi red (engl. break) se obeleava tagom
. Ovo je prosto obeleje: ne postoji tag . Podvlaka (engl. rule) se obeleava tagom sa opcionim atributima NOSHADE, ALIGNE, SIZE (debljina linije u pikselima), i WIDTH (duina linije u pikselima ili procentualno). Unapred formatiran tekst (engl. preformatted) se obeleava tagom ..., a na izlazu se dobija tekst u fontu fiksne irine. Unutar ovog elementa karakteri za blanko, novi red i tabulator postaju znaajni, vie se ne ignoriu. Ovaj element korist atribut WIDTH (maksimalan broj karaktera u redu). U okviru ovog elementa mogu se koristiti hipertekstualne veze, ostale elemente treba izbegavati. Dui navodi se obeleavaju tagom ..., a na izlazu se se prikazuju u zasebnom bloku na ekranu. Obeleavanje elemenata teksta Opis grafikih karakteraPrikaz grafikih karaktera se u HTML-u definie na vie nivoa. U odeljku zaglavlja () se definie kodna strana koja se koristi za prikaz grafikih karaktera (npr. ISO-8859-1 za zapadno-evropsku latinicu, ISO-8859-2 za istono-evropske latinice). Zadavanje kodne strane se vri pomou meta-zaglavlja META oblika: Za dijakritike karaktere u srpskoj latinici koriste se sledei kodovi prema ISO-8859-2: Veiko slovokod 8859-2Malo slovokod 8859-2

200232

198230

208248

169185

174190

Karakteri irilinog pisma se mogu kodirati prema standardu ISO 8859-5.Postoje i drugi sistemi kodiranja od kojih je posebno znaajan UNICODE u kome se koriste dva bajta za kodiranje jednog karaktera. Ovaj standard je restrikcija na dva bajta standarda ISO 10646 u kome se jedan karakter kodira sa etiri bajta. Dijakritiki latinini karakteri se mogu uneti i kao sekvence UNICODE-u prema sledeoj tabeli: Veliko slovoUnicodeMalo slovoUnicode

Karakteri koji se koriste u zapisvanju tagova kodiraju se na poseban nain: KarakterKodiranjeNaziv

&&"ampersand"

>>vee

uzorak izlaza : uzorak izlaza Doslovni prenos teksta (verbatim) se ostvaruje tagovima ... . Ovaj tag obezbeuje da se izvorni tekst prenese doslovno, bez ikakve interpretacije. Fiziki stil karaktera Normalan slog:Ubi bene, ibi patria.

Crni slog:Ubi bene, ibi patria.

Kurzivni slog:Ubi bene, ibi patria.

Podcrtavanje:Ubi bene, ibi patria.

Teleprinterski slog:Ubi bene, ibi patria.

Precrtavanje:Ubi bene, ibi patria.

Blinkovanje:Ubi bene, ibi patria.

Velika slova:Ubi bene, ibi patria.

Mala slova:Ubi bene, ibi patria.

Indeksi:Ubi bene, ibi patria.

V A T R O M E T B O J A RASTEM RASTEM RASTEM RASTEM RASTEM RASTEM RASTEMVolim, Volim, Volim, Volim da budem raznovrstan! WYSIWIGZa obradu teksta kaemo da je WYSIWIG (skr. od engl. What You See Is What You Get) ako se ono to vidimo na ekranu verno reprodukuje na papiru. MS-WORD je tipini predstavnik ove vrste programa za obradu teksta. Za razliku od njega, HTML nije WYSIWIG: dok unosimo tagove, ne vidimo kako e bii realizovane ni na ekranu, ni na papiru. ListeListe u jeziku HTML su navoenje, popisivanje onih delova teksta, koji se ne mogu svesti na prethodno opisane elemente logike strukture (pasus, odeljak, i sl). Razlikuju se tri vrste lista (ili popisa): opisne, numerisane i neureene liste. Kod lista, grafiki izgled se ne odreuje automatski kao to se, na primer, automatski odreuje grafika interpretacija obeleenih karakterskih niski. Opisne liste... opisuju logiku strukturu koja odgovara listi pojmova koji se definiu. Otuda se opisne liste nazivaju i definicione liste. Ovakva lista se opisuje sledeim tagovima:

odrednica 1 opis odrednice 1

odrednica 2 opis odrednice 2

Hiper-vezeHiper-veza (engl. hyperlink) uspostavlja hipertekstuelnu strukturu dokumenta zapisanog u HTML-u tako to omoguava da se povee neki fragment tekueg teksta sa nekim drugim delom tog ili, pak, nekog drugog teksta. Tekstovi koji se povezuju hipertekstuelnim vezma se mogu nalaziti na istom ili na razliitim raunarima. Hiper-veza se moe zamisliti kao luk koji povezuje neka dva vora obeleena, na primer, sa 1 i 2 u jednom grafu:

Hiper-veza predstavlja mogunost da se itanje teksta iz vora 1 nastavi u voru 2. Ovakva hiper-veza se enkodira pomou sidra (engl. anchor) koje povezuje fragment teksta u voru 1 sa adresom vora 2. Opta etiketa za sidro je oblika ... . Enkodiranje ovakve informacije podrazumeva da se u voru 1 opiu: fizika pozicija na lokaciji u tom voru sa koje se prelazi na tekst u voru 2 i fizika lokacija na kojoj se nalazi tekst u voru 2. Ove dve pozicije se nazivaju, redom, polazno i dolazno sidro. Polazno sidro oznaava u tekstu onu poziciju sa koje se prelazi na neki drugi tekst i kodira se pomou atributa HREF: pozicija u voru 1 sa koje se prelazi na vor 2 Navigator obino interpretira polazno sidro u HTML-dokumentu kao fragment teksta na koji se moe "kliknuti", grafiki istaknut podvlaenjem i drugom bojom slova od boje slova samog teksta. Dolazno sidro je ili adresa neke datoteke ili tag koji obeleava deo teksta. Enkodira se pomou atributa NAME: tekst u voru 2 na koji se prelazi iz vora 1 Atribut NAME nije obavezan. Ukoliko se on izostavi, navigator se pozicionira na poetak dokumenta u voru 2, a inae na naznaenu poziciju.AdresiranjeAdresiranje se temelji na pojmu uniformnog lokatora resursa (skr. URL, od engl. Uniform Resource Locator), koji omoguava da se precizno imenuje adresa vora 2, ma gde on bio fiziki lociran. U opisivanju adrese koja upuuje na vor 2 razlikujemo vie sluajeva u zavisnosti od toga koliki je deo URL-a poznat u tom trenutku. 1. Ako se pozicija vora 2 nalazi u okviru istog dokumenta kao i vor 1 (tj. ako se vor 1 i vor 2 nalaze u istoj datoteci), tada se adresiranje vri na sledei nain: u polaznom tekstu se navodi tag (polazno sidro): tekst na koji se moe "kliknuti" u dolaznom tekstu se navodi tag (dolazno sidro): dolazni tekst 2. Ako je pozicija vora 2 u nekom dokumentu (datoteci) izvan onog dokumenta koji sadri vor 1, ali se obe nalaze na istom serveru, onda se adresiranje vri navoenjem relevantnog dela puta koji je potreban da bi se iz vora 1 definisao put do vora 2. Neka je, na primer, www.fakultet.bg.ac.rs ime servera na kome se nalaze oba hipertekstuelna vora. Neka su direktorijumi organizovani kao na donjoj slici i neka X sadri datoteke a i b, Y datoteku c, a Z datoteku d.

Tada pod apsolutnom adresom datoteke c podrazumevamo adresu http://www.fakultet.bg.ac.yu/X/Y/c. Apsolutnom adresom je odreen jednoznano URL datoteke c. Ali unutar jednog servera se mogu definisati i relativne adrese datoteka. Na primer, Za tekst u datoteci a, adresa datoteke b je b; adresa datoteke c je Y/c; adresa datoteke d je Y/Z/d; Za tekst u datoteci c, adresa datoteke a je ../a (simbol .. oznaava neposredno nadreeni direktorijum); adresa datoteke d je Z/d; Za tekst u datoteci d, adresa datoteke a je ../../a; adresa datoteke c je ../c; Referisanje na vor 2 iz vora 1 vri se tada sledeim tagpvima u okviru istog servera: u polaznom tekstu se navodi tag (polazno sidro): tekst na koji se moe "kliknuti" Efekat je da e se prei sa pozicije polaznog sidra u voru 1 na poetak datoteke (dokumenta) ija je adresa navedena pod atributom HREF.Sadraj atributa HREF moe da bude i elektronska adresa koja se specifikuje na sledei nain: HREF="mailto:ime@domain". Izborom ove veze polaska otvara se prozor za pisanje poruke elektronske pote u kome je destinaciona adresa ve postavljena na ime@domain. Da bi ovo funkcionisalo, potrebno je da budu postavljeni odgovarajui parametri navigatora (prelistaa).SlikeSlike (fotografije, crtei, skice,...) ... u digitalizovanom obliku, sauvana u nekoj datoteci, esto su sastavni deo teksta (v. definiciju teksta). Za uvanje slika koristi se vie konvencija. Od znaaja je da navigator moe protumaiti format u kome je slika sauvana. Najee se koriste formati JPEG i GIF. Ukljuivanje slika u tekstSlike se u tekstu navode koristei tag IMG (image) koja ima obavezni atribut SRC (source). Oblik u kome se navodi ovaj tag je: URL se odreuje na nain opisan u prethodnoj taki. Na primer, da bi se prikazala slika iz datoteke ije je ime kralj_ibi.gif, a koja se nalazi na tekuem direktorijumu dokumenta zapisanog u HTML-u potrebno je navesti: Kada navigator bude interpetirao dokument, u njemu e se, pod dejstvom ovog taga, pojaviti slika sadrana u datoteci kralj_ibi.gif. Slici moe biti dodeljeno i ime preko atributa ALT.Atributi taga IMGTag IMG moe imati razliite atribute koji omoguavaju da se precizno opiu poloaj, dimenzije i odnos slike prema drugim delovima teksta. Atribut za poravnavanje slike u odnosu na margine ALIGN ... moe imati vrednosti za vertikalno poravnavanje: TOP, MIDDLE, BOTTOM za horizontalno poravnjavanje: LEFT, CENTER, RIGHT Primer 2. Atributi za dimenzionisanje slike su WIDTH (irina) i HEIGHT (visina). Atributi koji opisuju poloaj slike su HSPACE i VSPACE Atribut koji opisuje irinu okvira slike BORDER Atribut koji umesto slike daje naziv slike ALT

Primer 3. Slike-vezeSlika u dokumentu moe predstavljati i polazno sidro u hiper-vezi. Kaemo da je takva slika slika-veza. Dolazna adresa se tada navodi kao kod hiper-veze, a umesto teksta na koji se moe "kliknuti" navodi se etiketa IMG. etiketa IMG slike na koju se moe "kliknuti" Spoljanje slike, zvuk, animacijaSlika u dokumentu moe predstavljati i polazno sidro u hiper-vezi koja vodi ka drugoj slici, zvunom ili video-zapisu. U tom sluaju dokument koji se referie nije HTML dokument, ve to moe biti GIF, JPG, AU ili MOV dokument. Mapa slikeJedna slika moe biti podeljena na zone na takav nain da svaka zona predstavlja polazno sidro nekog dokumenta. Ova mogunost se temelji na pridruivanju slici jedne mape preko koje se odreuju koordinate pojedinih zona. Koordinatni poetak mape je gornji levi ugao slike, a koordinate se izraavaju u broju piksela od koordinatnog poetka. Na primer, donji desni ugao crvenog kvadrata na slici ima koordinate (120,100). Zone se odreuju pomou atributa USEMAP etikete IMG: Mapa se opisuje pomou sloenog taga MAP. Unutar taga MAP, za opis pojedinanih zona koristi se prosto obeleje AREA, iji su atributi SHAPE, HREF i COORDS: .............................................................. Atribut oblika zone SHAPE moe imati vrednosti: RECT za zonu pravougaonog oblika. Tada se navode koordinate gornjeg levog i donjeg desnog ugla pravougaonika u pikselima. CIRCLE za zonu krunog oblika. Tada se navode kordinate centra i poluprenik u pikselima. POLY za zonu poligonalnog oblika. Tada se navode koordinate temena poligonalne linije u pikselima. Koordinate zone se mogu odrediti pomou nekog programa za obradu slike (npr. Paint). Boje i pozadineUpotreba boja je prvenstveno vezana za atribute taga BODY. Prilikom navoenja ovog taga mogu se definisati boje sledeih elemenata u tekstu: Boja pozadine (engl. background), koja predstavlja boju "papira". Boju pozadine odreuje vrednost atributa BGCOLOR. Osnovna boja slova upotrebljenih u dokumentu opisuje se vrednostima atributa TEXT. Tokom sastavljanja dokumenta osnovna boja slova, opisana atributom TEXT se moe promeniti pomou atributa COLOR taga .

Primer 1. Boja hipertekstuelnih veza se odreuje na osnovu donja tri atributa prema statusu veze: Boja neposeene hipertekstuelne veze (pre nego to se na nju "klikne") je odreena atributom LINK; Boja ve poseene hipertekstuelne veze (posle povratka u dokument iz koga se "kliknulo") je odreena atributom VLINK; Boja hipertekstuelne veze u trenutku kada se na nju "klikne" je odreena atributom ALINK. Primer 2. Postavljanje slike u pozadinu dokumenta (slike preko koje moe da se pie) se ostvaruje dodelom adrese slike preko atributa BACKGROUND.

Primer 3. Boje se odreuju sa RGB-palete. Vrednost atributa boje ima opti oblik "#cczzpp" gde su cc, zz i pp redom heksadecimalne vrednosti za intenzitet crvene, zelene i plave boje. Svaka od ovih vrednosti moe biti broj izmeu 0 i 255 (u dekadnom brojnom sistemu) ili izmeu 0 i FF (u heksadecimalnom brojnom sistemu). Boje se mogu odrediti navoenjem naziva boje na engleskom umesto kombinacijom heksadecimalnih cifara prema tabeli koju je data na strani SGIR (Service Gnral Informatique et rseaux, Universit Ren Descartes, Paris). U sluaju da se prilikom navoenja taga BODY izostave opisani atributi, navigator im dodeljuje predefinisane vrednosti.

11