Mis on ühtne ressursiotsija?

Ühtne ressursiotsija, mida tuntakse ka akronüümi URL-ina, on vahend objekti asukoha ja juurdepääsumeetodi määramiseks Internetis. See sisaldab skeemi või protokolli nime, mis kirjeldab, kuidas objektile juurde pääseda. See sisaldab ka võrgu asukohta koos valikuliste päringu ja fragmentide identifikaatoritega. Väga levinud URL-i kasutamine on brauseri suunamine veebisaidile.

Algne ühtse ressursiotsija kontseptsioon arenes välja 1990. aastate alguses. Request For Comments (RFC) 1630 oli esimene URL-i standard, mille Internet Engineering Task Force (IETF) andis välja 1994. aastal. Nime ilma seotud asukoha või juurdepääsumeetodita hakati nimetama ühtseks ressursinimeks (URN). Neid kahte mõistet kombineerides sündis mõiste Uniform Resource Identifier (URI). URI võib olla URN-i identiteet, URL-aadress või mõlemad. See võib isegi viidata objektile, mis ei ole üldse võrgupõhine.

Tehnilistes ringkondades kasutatakse terminit Uniform Resource Locator enam harva – eelistatakse URI-d. URL on siiski üldsuse ja ajakirjanduse seas populaarne nimi. Uusim URI spetsifikatsioon, mis avaldati 2009. aastal kui RFC 3986, selgitab URL-i, URN-i ja URI mõisteid.

Ühtne ressursiotsija koosneb kahest osast. Esiteks on URI-skeemi nimi, millele järgneb koolon. Skeem määrab ressursile juurdepääsuks kasutatava protokolli või muu meetodi. Internet Assigned Numbers Authority (IANA) haldab pikka registreeritud URI-skeemide loendit. Hüperteksti transpordiprotokoll (HTTP), turvaline HTTP (HTTPS) ja failiedastusprotokoll (FTP) on ilmselt levinumad. Kasutatakse ka palju registreerimata skeeme.

Ühtse ressursiotsija teine ​​osa on skeemispetsiifiline ja võib sisaldada mitut komponenti. See HTTP URL-i osa algab sageli www-ga. millele järgneb domeeninimi. Domeeninime asemel võib kasutada numbrilist Interneti-protokolli (IP) aadressi. Nimele võib järgneda tee konkreetse objektini. Samuti võib esineda päringustring, objektis oleva fragmendi pealkirja nimi või mõlemad.

Veebilehe URL-i brauserisse tippimisel on skeem ja osa domeeninimest sageli valikulised. Kui see välja jäetakse, siis „http://” või „http://www”. tavaliselt eeldab veebibrauser. Tee, päring või fragment võib sisaldada ka piiratud arvu erimärke kuueteistkümnendsüsteemis. Tühik – %20 – on kõige sagedamini kasutatav. Rahvusvaheline ressursiidentifikaator (IRI) võimaldab kasutada ka Unicode’i märke.
Rohkem kui üks kordumatu Uniform Resource Locator võib kirjeldada sama objekti teed. Otsingumootorid saavad kasutada protsessi, mida nimetatakse URL-i normaliseerimiseks, et teha kindlaks, kas mitu URL-i viitavad tegelikult samale asjale. Seda teevad ka veebibrauserid ja indeksoijad. URL võib osutada ka objektile, mida ei leita – see kolis või ei olnud alguses olemas.