Capire gli URL




Ogni documento nel Web possiede un indirizzo univoco. Questo indirizzo è conosciuto come Uniform Resource Locator (URL).

Alcuni tag HTML/XHTML come ad esempio un link, un immagine o un form possono avere come valore di alcuni attributi un URL. Per indicare la locazione di una risorsa nella rete viene sempre utilizzata la stessa sintassi, per questo motivo è chiamata Uniform Resource Locator.

Elementi di un URL

Un URL è formato da diverse parti, ognuna delle quali offre diverse informazioni al browser per raggiungere una determinata pagina. Capire un URL è molto semplice, guardando l'esempio seguente si nota che esso è composto da 3 parti principali: lo schema, l' indirizzo dell' host ed il percorso del file. Analizzeremo adesso ognuno di essi:

https://www.tutorialspoint.com/index.htm

Lo Schema

Lo schema identifica il tipo di protocollo e l' URL a cui vuoi indirizzare, e quindi come dev' essere ricevuta la risorsa. Per esempio, molti web browser usano l' Hypertext Transfer Protocol (HTTP) per scambiare informazioni con il web server, e per questa ragione in genere un URL inizia con http://.

Ci sono altri schemi disponibili che si possono utilizzare in base alle esigenze:

SchemaDescrizione
http://Hypertext Transfer Protocol (HTTP) è utilizzato per richiedere una pagina al Web Server e riceverla dal Web Server al browser.
https://Secure Hypertext Transfer Protocol (HTTPS) encripta i dati scambiati dal browser al Web Server utilizzando un certificato digitale.
ftp://File Transfer Protocol è un protocollo utilizzato per trasferire file. Mentre il protocollo HTTP è molto popolare per visualizzare i siti Web grazie all' integrazione con i browser, il protocollo FTP è altrettanto utilizzato per trasferire file nella rete e per caricare file nel web server.
file://Utilizzato per indicare che un file si trova in un hard disk locale o in una rete LAN codivisa.

L' Indirizzo Host

L' indirizzo Host indica dov'è ospitato un sito web, può essere un indirizzo IP (4 set di numeri compresi tra 0 e 258, per esempio 68.178.157.132) o più comunemente il nome del dominio come ad esempio www.tutorialspoint.com. Nota che "www" non fa parte del nome del dominio, tuttavia è spesso utilizzato nell' indirizzo host.

Il Percorso del File

Il percorso del file inizia sempre con uno slash forward, e può essere formato da una o più cartelle. Ogni cartella viene separata da uno slash forward e il percorso termina con il nome del file. Nell' esempio seguente index.htm è un file che si trova all' interno della cartella html:

https://www.tutorialspoint.com/html/index.htm

Altre Componenti di un URL

Utilizzare le credenziali permette di indicare username e password per i siti web che lo richiedono. Le credenziali vanno inserite prima dell' indirizzo dell' host, e sono separate dall'indirizzo tramite una @. Da notare che username e password sono separate dai due punti. L' URL seguente mostra come indicare username admin e password admin123:

https://admin:admin123@tutorialspoint.com/admin/index.htm

Con questo URL appena mostrato, se le credenziali fossero corrette avresti potuto autenticarti come amministratore ed avere accesso al file index.htm.

Si può utilizzare un URL telnet per connettersi ad un server:

telnet://user:password@tutorialspoint.com:port/

Un altra informazione importante è il Numero della Porta. Di default il Server HTTP gira nella porta numero 80. Ma se il server gira su un altra porta è possibila indicarla come segue, supponiamo che il server gira nella porta 8080:

https://www.tutorialspoint.com:8080/index.htm

Fragment identifiers possono essere utilizzati dopo il nome del file per indicare una specifica parte di pagina in cui il browser dovrà andare automaticamente. L'esempio seguente punta automaticamente alla parte superiore della pagina html_text_links.htm.

https://www.tutorialspoint.com/html/html_text_links.htm#top

Tramite gli URL si possono fornire alcune informazioni al server. A volte utilizzando un form di ricerca il browser può aggiungere informazioni aggiuntive all' URL per passare informazioni dal browser al server, come segue:

https://www.tutorialspoint.com/cgi-bin/search.cgi?searchTerm=HTML

In cui, searchTerm=HTMLviene passato al server dove lo script search.cgi analizza le informazioni fornite e le elabora.

URLs Assoluti e Relativi

Si può indirizzare ad un URL in due modi:

  • Assoluto - Un URL assoluto indica l' indirizzo completo. Per esempio https://www.tutorialspoint.com/html/html_text_links.htm

  • Relativo - Un URL assoluto indica che la risorsa è in relazione con la pagina attuale. L' URL fornito va aggiunto all' elemento <base> per formare un URL completo. Per esempio /html/html_text_links.htm

Caratteri Riservati e Non Sicuri

I caratteri riservati sono quei caratteri che hanno un significato specifico all' interno di un URL. Per esempio lo slash serve a separare gli elementi di un percorso. Se hai bisogno di includere uno slash nel tuo URL e non farlo interpretare come separatore dovrai indicarlo come %2F:

I caratteri 'non sicuri' sono quelli che non hanno un significato specifico all' interno di un URL ma possono averlo nel contesto in cui è inserito l' URL. Ad esempio i doppi apici ("") indicano il valore di un attributo nei tag. Se si ha la necessità di includerli direttamente in un URL, probabilmente il browser andrà in confusione. Perciò è consigliabile codificare i doppi apici per evitare ogni possibile conflitto.

Per capire meglio questa codifica puoi dare un' occhiata alla guida HTML URL Encoding.

html_text_links.htm
Advertisements