Internet

Abstract

Der redegøres kort for de dele af internettets historie og teknik der har betydning for forståelse af nettets virkemåde. Opbygningen af adresser på internet gennemgåes med særlig vægt på World Wide Web (WWW) og email. Derefter gennemgåes de forskellige services som internettet stiller til rådighed. Afslutningsvis gives eksempler på hvorledes nettet kan anvendes.

Baggrund

Internettets virkemåde er påvirket af både historiske og tekniske årsager. Lidt baggrundsviden om nettets historie og teknik kan gøre det nemmere at forstå nettets mærkværdigheder og giver indblik i dets stærke og svage sider.

Historien: et produkt af den kolde krig

Internettet er et produkt af det teknologikapløb, der var en del af den kolde krig. Da USSR i 1957 opsendte Sputnik svarede det amerikanske forsvarsministerium igen ved at oprette Advanced Research Projects Agency (ARPA). ARPA skulle give USA en førerposition indenfor videnskab og teknologi.

Under ARPA udviklede Poul Baran ideerne til et distribueret netværk. Den vigtigste bevæggrund for den decentrale struktur var ønsket om, at der ikke måtte være et uundværligt led i nettet. Under den kolde krig var frygten for, at en fjenden skulle bombe centrale kommunikationscomputere udbredt. Det var derfor naturligt at etablere et netværk uden central styring. De computere, der skal deltage i et sådant decentralt netværk, kaldes værtsmaskiner (hosts) og stiller i et eller andet omfang ressourcer til rådighed for brugere af nettet. Der er altså tale om enkeltstående computere, der kan kommunikere med hinanden.

I 1969 oprettes internettets forløber ARPANET. De 4 første værtsmaskiner var hos University of California Los Angeles (UCLA), Stanford Research Institute (Ikke at forveksle med Stanford University)., University of California Santa Barbara (UCSB) og University of Utah. To år senere (i 1971) er ARPANET oppe på 23 værtsmaskiner og flere kendte steder er blandt de nytilkomne blandt andet RAND, Massachusetts Institute of Technology (MIT), Harvard, Stanford og NASA.

I 1973 etableres de første forbindelser udenfor USA. Disse gik til University College of London (England) og Royal Radar Establishment (Norge).

I 1982 benyttes ordet Internet første gang i forbindelse med nogle tekniske ændringer (Transmission Control Protocol (TCP) og Internet Protocol (IP) indføres på ARPANET. Disse protokoller blev taget i brug den 1. januar 1983. De bruges fortsat på Internet.). ARPANET når i 1982 op på 235 værtsmaskiner.

I 1983 opdeles ARPANET i ARPANET og MILNET. De militære dele fortsætter i det mere lukkede MILNET og det amerikanske civile forskningsråd National Science Foundation (NSF) får ansvaret for den civile del. I 1984 passerer antallet af værtsmaskiner 1.000. I 1986 ændres nettets navn fra ARPANET til Internet. I 1987 passerer antallet af værtsmaskiner 10.000 og i 1989 passerer det 100.000.

En af internettets mest populære services World Wide Web (WWW) introduceres af det fælleseuropæiske kernefysiske laboratorium CERN i Schweiz i 1991. Hvad der egentlig var tiltænkt at være et internt informationssystem viste sig at være anvendeligt på hele internettet. 1991 var også året hvor Internettet blev frigivet til kommerciel brug.

I 1992 når antallet af værtsmaskiner 1 million og ved nettets 25 års jubilæum i 1994 er antallet af værtsmaskiner tæt på 4 millioner.

Primo 1997 er antallet af værtsmaskiner nået over 16 millioner.

Teknik: Ingen central styring

Internet har ingen ejere og ingen ledelse. Internet er et internationalt netværk af computere. Omkostningerne ved driften afholdes af de primære brugere: højere læreanstalter, regeringer samt de kommercielle internetudbydere.

Uanset forandringerne fra det militærprægede ARPANET til dagens mere kommercielle Internet er den grundlæggende ide om at ingen del af nettet må være uundværlig for helheden stort set bibeholdt. Det betyder blandt andet, at der ikke kan være en overordnet kontrolfunktion eller et samlet register over brugere eller information.

Herved opstår et af Internettets helt store praktiske problemer. Når en masse information er tilgængelig på en masse forskellige maskiner, ville det være praktisk med en samlet fortegnelse. Det er på grund af den decentrale struktur ikke muligt at lave en komplet fortegnelse.

Der findes i stedet søgemaskiner på internettet. Disse søgemaskiner indsamler så meget information som muligt og lader brugerne foretage søgninger i det. Selv om de på grund af nettets struktur aldrig kan blive komplette, er de en meget stor hjælp for brugerne.

Den decentrale struktur er også en enorm styrke. Internettet anses af mange for et af de mest effektive våben mod censur. Nettets struktur bevirker, at selv om myndighederne visse steder i verden spærrer for materiale de finder uacceptabelt, så betragter nettet disse spærringer som fejl. Internettet søger at korrigere for denne fejl ved at sende materialet en anden vej. På den måde kan data der skal overføres fra Danmark til mellemøsten godt gå over USA eller Australien. Grundtanken er, at selv om der er fejl (censur betragtes af Internettet som fejl), skal signalet igennem på en eller anden måde, hvilket er et enormt problem for udøvere af censur. De amerikanske myndigheder, som på en del områder er noget mindre frisindede end vi er i Skandinavien, har således også problemer med at censurere det Internet, som de selv har skabt.

Uanset typen af information man vil finde eller stille til rådighed på Internettet, så er det nødvendigt at vide lidt om Internettets navnestruktur, da det ellers er stort set umuligt at finde rundt.

Internettets navnestruktur

En internetadresse kaldes også en Uniform Ressource Locator (URL). De fleste af de URL-er man ser i dagligdagen (både aviser og TV omhandler efterhånden næsten dagligt internet) henviser enten til sider på World Wide Web (WWW) eller til en elektronisk postkasse.

Navne på WWW

På URL-en http://www.havskov.dk/slaegtsforskning-person.aspx?id=105 findes en side om min oldefar. URL-en kan opdeles i flere dele og bliver derved nemmere at forstå. I dette eksempel skal URL-en forståes således:

1: Protokollen 2: Computerens navn 3: Kataloget på computeren 4: Filens navn 5: Paramtere
http:// www.havskov.dk / slaegtsforskning-person.aspx id=105

De enkelte elementer i URL-en har følgende betydning:

  • Protokollen specificerer hvorledes din computer og informationsudbyderens computer skal tale sammen. HTTP står for HyperText Transport Protocol, og er den protokol, der anvendes på World Wide Web. Andre muligheder er: ftp, gopher, news, telnet og mailto. Når man indtaster adresser i en webbrowser kan man normalt undlade at skrive http://, idet det er standardprotokollen i de fleste browsere.
  • Computerens navn angives for at internettet kan lede vores forespørgsel videre til den rigtige computer. Navnestrukturen er et af de få steder, hvor internettet er hierarkisk. Computerens navn (her www.havskov.dk) skal læses bagfra. Endelsen dk betyder at vi befinder os i hovedgruppen (top-level domainet) dk, hvilket betyder Danmark. Vi kan også se at vi befinder os i gruppen (domainet) havskov. Den computer som vi henvender os til hedder www. Det er meget anvendt at kalde den computer, der indeholder oplysninger til brug på World Wide Web, for www. Det gør jeg også, idet min maskine hedder www.havskov.dk. Det kan læses som computeren www i gruppen havskov i hovedgruppen dk. Eftersom Internet er opfundet i USA, er det kun udenfor USA, at man bruger landekoder som hovedgrupper. I USA benyttes hovedgrupperne gov (regeringen på nær militæret), mil (det amerikanske militær), edu (uddannelsesinstitutioner), com (kommercielle virksomheder) og org (ikke kommercielle organisationer). Internationalt orienterede virksomheder udenfor USA vælger dog ofte hovedgruppen com i stedet for deres landekode (et eksempel herpå er www.lego.com).
  • Kataloget (I Windows kaldes kataloger for mapper eller folders) angiver hvor på computeren den ønskede fil findes. I eksemplet ovenfor hedder kataloget genealogi. Som udgangspunkt kan der ikke indgå danske bogstaver i URL-er, men der er dog iværksat tiltag der muliggør det. Jeg vil ikke anbefale danske bogstaver i URL-er.
  • Filnavnet angiver hvilken fil i det pågældende katalog der ønskes.
  • Paramtre angiver oplysninger som skal overføres til den webserveren. Det samme filnavn kan vise forskellige sider, alt efter hvilke parametre der sendes med. Det er ikke alle sider der benytter parametre, men det kan være en måde at undgå at lave for mange filer på.

I mit eksempel er det en ret lang URL der bliver resultatet. Man kan dog også bare angive http://www.havskov.dk/. Derved henvises til den pågældende computer, men ikke til en bestemet fil (et bestemt dokument). Det er så op til informationsudbyderens computer at sende standarddokumentet. Et standarddokument indeholder ofte klikbare henvisninger (links) til de øvrige dokumenter.

At URL'en for Stanford University er http://www.stanford.edu/ passer ind i den beskrevne systematik. Efter systematikken burde http://www.monash.au være URL-en for Monash University i Australien. Det er desværre ikke sådan. De engelsktalende lande vil gerne efterligne den amerikanske måde, hvor man kan se hvilken type institution der gemmer sig bag URL-en. Derfor indskydes et niveau mere således at adressen http://www.monash.edu.au/ er den korrekte for Monash University. I England bruges ac for academic, og London School of Econimics' homepage findes derfor på URL-en http://www.lse.ac.uk/. Hvorledes der underopdeles i de enkelte lande er helt op til landet selv.

Det er vigtigt at erindre, at det er op til indehaveren af gruppenavnet at bestemme computernavnet. Jeg kunne kalde min WWW-server for xyz.havskov.dk, men det ville ikke give mening. WWW-adresser kan, når de er skrevet komplet, genkendes på at de starter med http://. I de mest udbredte browsere behøver brugeren ikke skrive http:// når man vil se den pågældende side. I dag er det så almindeligt at henvise til en WWW-side at såfremt ens computernavn starter med "www." så oplyser man blot navnet "www.navn.doamin".

Mailadresser

En anden meget væsentlig type internetadresser er mail-adresser. De kan kendes på at de altid indeholder et @. En mailadresse er opbygget af et brugernavn, et @ og en identifikation af mailserveren. Strukturen er brugernavn@computernavn.hovedgruppe. Min mailadresse er peter@havskov.dk. Det ser umiddelbart ud som om jeg har glemt computernavnet, men jeg har simpelhen registreret i DNS (Internettets "telefonbog") hvilken computer der står for al mail til havskov.dk. Således opnår jeg en kort og rimelig enkel email-adresse.

Andre adresser

Et eksempel på en internetadresse der ikke hører i en af ovennævnte kategorier kan være ftp://ftp.dante.de/ som blandt andet indeholder gratis software. Her benyttes ftp-protokollen. En FTP-adresse kan godt kontaktes af de moderne www-browsere (de programmer man kigger på WWW med), men man bør huske ftp://.

Services

Services på internettet opdeles normalt efter hvilke protokoller de benytter. I forbindelse med gennemgangen af navnestrukturen blev www-adresser og email-adresser gennemgået og det passer fint med, at disse 2 services idag er de vigtigste på nettet. Andre services har dog også betydning, så for fuldstændighedens skyld skal de alle nævnes her. For ikke at gøre det for teknisk bruges de populære begreber i stedet for de tekniske (og mere præcise) begreber:

FTP

FTP står for File Transfer Protocol. Protokollen har været anvendt længe og benyttes til at overføre filer fra en maskine på internettet til en anden. Eftersom http-protokollen også kan overføre filer, har den vundet indpas på steder, hvor der tidligere blev brugt ftp. Det er muligt at lave brugervenlige programmer der benytter ftp, men da de http-baserede programmer var blandt de første brugervenlige programmer har ftp fået et lidt teknisk rygte.

Mail

Email er sammen med WWW de helt store hit på Internet. Email er både hurtigt og billigt. En email vil normalt ikke bruge mere end et lille minut om at nå til Australien eller USA.

Efterhånden som email-programmerne er blevet mere brugervenlige, må email siges at være for alle. Email giver mulighed for at vedhæfte filer. Det betyder at man kan sende filer uanset type (tekstbehandling, regneark, billeder m.v.) som "bilag" til en email. Det kan i nogle email-systemer virke lidt teknisk, men har man behov for at udveksle data med andre, er det en effektiv løsning.

WWW

World Wide Web (WWW) benytter HyperText Transfer Protocol (HTTP). Teknikken blev frigivet i 1991. Selv om protokollen hentyder til hypertext kan den overføre andre typer filer end hypertekst og har derfor delvis fortrængt ftp.

WWW er den service, der har gjort Internettet tilgængeligt for alle. Det smarte er, at man utrolig nemt kan følge henvisninger til bestemte dokumenter også selv om det er på en helt anden computer. Normalt kan man klikke på den tekst der er blå og understreget og i en del tilfælde også figurer og knapper.

Et godt startsted på dansk er de emneopdelte sider hos http://www.jubii.dk/ og de kan være til stor nytte for begyndere på nettet, idet de giver henvisninger til en nogle populære danske sider som er gode at øve sig på.

News

Nyhedsgrupper er steder på internettet hvor der foregår diskussioner. De enkelte indlæg gemmes på såkaldte nyhedsservere. Diskussion er emneopdelt og der findes omkring 20.000 grupper. Det er dog ikke alle nyhedsservere der har alle grupper.

Indlæg i nyhedsgrupper kan både være svar på andres indlæg og nye indlæg. De fleste af de programmer, der bruges til at læse nyheder med, kan sortere de enkelte beskeder således, at det er nemt at se hvilke indlæg der er svar på hvad.

Newsgrupper bruges både af brugere, der hjælper hinanden og folk, der debatterer elektronisk.

På WWW findes, på adressen http://groups.google.com/, et arkiv over indlæg i news-grupper. På den måde supplerer de enkelte services hinanden.

Telnet

Telnet kan populært betragtes som en "forlængelse af tastatur- og skærmkabel". Du bruger internettet til at videresende dine tastetryk og modtager skærmbilleder retur. Der er mange anvendelsesmuligheder. Protokollen anvendes stadig og nye brugere af Internettet vil på et tidspunkt støde på den. En del af de ting, der tidligere kun var tilgængelige via Telnet, bliver med tiden tilgængelige via WWW. Normalt er WWW-adgangen noget mere brugervenlig, så den bør foretrækkes hvor det er muligt.

Gopher

GOPHER er en protokol der blev lanceret omkring 1990. Den var tænkt som et mere brugervenligt og menustyret alternativ til FTP. Da WWW og http-protokollen også tilbød disse faciliteter har Gopher aldrig vundet stor udbredelse. Nye internetbrugere behøver ikke bruge tid på den.

IRC

Internet Relay Chat (IRC) er ikke en ny protokol, men har været anvendt i tekstbaserede programmer hvor brugerne skrev til hinanden.

Diskussionen foregår i såkaldte ikke eksisterende (virtuelle) rum. Der findes en del grafiske programmer som også benytter IRC protokollen.

Windows Messenger / ICQ

Windows Messenger og ICQ er nyere programmer og protokoller som kan alt hvad IRC kan og meget mere.

Windows Messenger er meget udbredt af den simple grund af det følger med Windows. ICQ er meget udbredt idet det blev udbredt før Windows Messenger rigtigt slog an.

Disse nyere programmer benytter ikke officielle internetstandarder, men de 2 her næsvnte programmer er så udbredte, at de må betragtes som de etablerede de facto standarder.

Litteratur

Zakon, R. H. (1997).
Hobbes' Internet Timeline v7.0. http://www.zakon.org/robert/internet/timeline/.